Я хотел бы создать таблицу, которая показывает частоты некоторых слов в 3 текстах, тогда как тексты - это столбцы, а слова - это строки.Создайте кортеж токенов и тексты для условного распределения частот
В таблице я хотел бы посмотреть, какое слово появляется, как часто в тексте.
Это мои тексты и слова:
texts = [text1, text2, text3]
words = ['blood', 'young', 'mercy', 'woman', 'man', 'fear', 'night', 'happiness', 'heart', 'horse']
Для того, чтобы создать условное распределение частот, что я хотел, чтобы создать список кортежей, которые должны выглядеть как много = [(«text1», «кровь») ('text1', 'молодой'), ... ('text2', 'кровь'), ...)
Я попытался создать много, как это:
lot = [(words, texte)
for word in words
for text in texts]
Вместо того, чтобы много = ('text1', 'blood') и т. д. вместо 'text1' - это целое t ext в списке.
Как создать список кортежей, предназначенных для условной функции распределения частот?
Не уверен, что я полностью понимаю, что вы хотите, но это может помочь http://stackoverflow.com/questions/30970342/remove- пунктуация-с-а-лист/30970369 # 30970369 –