NLTK
http://www.nltk.org/ - это набор инструментов для вычислительной лингвистики.Python :: NLTK объединение списков предложений
Я пытаюсь манипулировать предложения, используя sents()
метод:
from nltk.corpus import gutenberg
выбирающий текстов fileid
:
hamlet = gutenberg.sents('shakespeare-hamlet.txt')
выход является:
print hamlet
[['[', 'The', 'Tragedie', 'of', 'Hamlet', 'by', 'William', 'Shakespeare', '1599', ']'], ['Actus', 'Primus', '.'], ...]
Но, допустим, Я хочу составить список предложений автором, а не bo ОК. В повторяющемся образе (это не позволит мне extend()
списков):
shakespeare = []
hamlet = gutenberg.sents('shakespeare-hamlet.txt')
macbeth = gutenberg.sents('shakespeare-macbeth.txt')
caesar = gutenberg.sents('shakespeare-caesar.txt')
shakespeare.append(hamlet)
shakespeare.append(macbeth)
shakespeare.append(caesar)
, но тогда все это становится вложенным:
print shakespeare
[[['[', 'The', 'Tragedie', 'of', 'Hamlet', 'by', 'William', 'Shakespeare', '1599', ']'], ['Actus', 'Primus', '.'], ...], [['[', 'The', 'Tragedie', 'of', 'Macbeth', 'by', 'William', 'Shakespeare', '1603', ']'], ['Actus', 'Primus', '.'], ...], [['[', 'The', 'Tragedie', 'of', 'Julius', 'Caesar', 'by', 'William', 'Shakespeare', '1599', ']'], ['Actus', 'Primus', '.'], ...]]
Есть ли способ, что я могу закончить с ОДНОГО списка со всеми конкатенированные предложения, не вложенные, вот так?
['[', 'The', 'Tragedie', 'of', 'Hamlet', 'by', 'William', 'Shakespeare', '1599', ']'], ['Actus', 'Primus', '.'], ...], [['[', 'The', 'Tragedie', 'of', 'Macbeth', 'by', 'William', 'Shakespeare', '1603', ']'], ['Actus', 'Primus', '.'], ...], [['[', 'The', 'Tragedie', 'of', 'Julius', 'Caesar', 'by', 'William', 'Shakespeare', '1599', ']'], ['Actus', 'Primus', '.'], ...]]
Ваш пример внизу не является допустимым списком. Это поможет, если вы дадите немного больше информации о том, что вы ищете (и/или дважды проверяете свой пример). – Daniel
@ Даниэль, там вы идете, я отредактировал нижний пример. спасибо, что предупредил меня. синтаксис для приведенных выше примеров совершенно прав. –
Мое удовольствие - хотя, это все еще не совсем так (ваш пример, как написано, вызывает «SyntaxError»). Я думаю, что я вижу, для чего вы идете: похоже, что вы хотите этого '[',' The ',' Tragedie ',' of ',' Hamlet ',' для первого элемента вместо этого '[', ' «The», «Tragedie», «of», «Hamlet», «но это всего лишь предположение. Просто посмотрел ваше последнее редактирование, хотя, что делает его намного понятнее - спасибо! – Daniel