Я работаю в jupyter ноутбук и имеют панды dataframe «данные»:питон панды dataframe слова в контексте: получить 3 слова до и после
Question_ID | Customer_ID | Answer
1 234 Data is very important to use because ...
2 234 We value data since we need it ...
Я хочу, чтобы пройти через текст в колонке «Ответ» и получить три слова до и после слова «данные». Так что в этом случае я бы получил «очень важно»; «Мы ценим», «поскольку нам нужно».
Есть ли хороший способ сделать это в рамке данных pandas? До сих пор я нашел решения, где «Ответ» был бы собственным файлом, выполняемым через код python (без фрейма данных pandas). Хотя я понимаю, что мне нужно использовать библиотеку NLTK, я раньше не использовал ее, поэтому я не знаю, каким будет лучший подход. (Это было отличным примером Extracting a word and its prior 10 word context to a dataframe in Python)
Вы можете показать исходную структуру структуры данных (а не ее выход)? – RomanPerekhrest
Это просто csv, который я читал как кадр данных с данными = pd.read_csv ('U: \ data science \ data.csv') – jeangelj
, так как вы хотите только три слова до и после «данных», не должен ваш пример быть «так как нам нужно», который не включает «это»? – davedwards