Я в основном перехожу из R в Python. Я хотел подмножить свой фрейм данных на основе столбца. Пройдя через переполнение стека answer, я нашел решение.Какова цель .loc в кадре данных pandas
Но рассмотрим следующий код:
import pandas as pd
import numpy as np
df = pd.DataFrame({'A': 'foo bar foo bar foo bar foo foo'.split(),
'B': 'one one two three two two one three'.split(),
'C': np.arange(8), 'D': np.arange(8) * 2})
df1 = df[df['A'] == "foo"]
df1
df2 = df.loc[df['A'] == "foo"]
df2
Оба df1 и df2 одинаковы.
Так что мой вопрос: что необходимо для функции loc
в первую очередь. Пожалуйста, имейте в виду, что я пришел из R-фона и в R, нам не нужно использовать функцию типа loc
для подмножества данных.
Пожалуйста, прочтите [это] (http://pandas.pydata.org/pandas-docs/stable/indexing.html#different-choices-for-indexing) и [это] (http: //pandas.pydata. org/pandas-docs/stable/indexing.html # indexing-view-versus-copy), если у вас есть дополнительные вопросы, тогда отредактируйте свой вопрос – EdChum