Я занимаюсь анализом текста с помощью Python (Nltk, Pandas) и нуждаюсь в некоторой помощи с моей Dataframe. Я все еще начинаю программировать.Pandas: Слияние столбца dataframe с списком
У меня есть метка данных с меткой PoS (1000 строк, 5 столбцов).
имена столбцов: номер (это в индексе), Id, название, вопрос, ответы
#2 Example rows for Question:
[('I', 'PRON'), ('am', 'VERB'), ('working', 'VERB'),('website', 'NOUN')]
[('Would', 'VERB'), ('you', 'PRON'), ('recomme...)]
#2 Example rows for Answers:
[('This', 'DET'), ('is', 'VERB'), ('not', 'ADV'),('website', 'NOUN')]
[('There', 'DET'), ('is', 'VERB'), ('a', 'DET'...)]
Голы:
1.) одинсписок (не НТР) со всеми 1000 PoS Tagged вопросы
2.) одинсписок (не НТР) со всеми 1000 PoS Tag GED Ответы
3.) одинсписок (не НТР) со всеми 1000 PoS меткой ответы и вопросы
Что я пытался до сих пор, чтобы объединить все строки в столбце вопрос, но мой результат был как :
[[('I', 'PRON'), ('am', 'VERB'),..],[('Would', 'VERB'),
('you', 'PRON'), ('recomme...)],[(.....)]]
Я думаю, я допустил ошибку, присоединившись к ним. как я могу сделать это правильно, чтобы получить список, который выглядит следующим образом:
[('I', 'PRON'), ('am', 'VERB'), ('working', 'VERB'),.....]
для всей колонки.
Редактировать после Beneres ответа:
Thx за быстрый ответ. .sum() был мой подход я делал раньше, но результат:
print (df['Merged'])
0 [('Does', 'NOUN'), ('anyone', 'NOUN'), ('know'...
1 [('I', 'PRON'), ('am', 'VERB'), ('building', '...
2 [('I', 'PRON'), ('am', 'VERB'), ('wondering', ...
3 [('I', 'PRON'), ('am', 'VERB'), ('working', 'V...
Что мне нужно, это
print (df['Merged'])
0 [('Does', 'NOUN'), ('anyone', 'NOUN'), ('know'...
('I', 'PRON'), ('am', 'VERB'), ('building', '...
('I', 'PRON'), ('am', 'VERB'), ('wondering', ...
('I', 'PRON'), ('am', 'VERB'), ('working', 'V...]
Edit 2: решена