Имея длинный список комментариев (50, говоря), например, это:Список список слов на Python:
«это было самое большое разочарование нашей поездки ресторан был получил некоторые очень. хорошие отзывы, поэтому наши ожидания были высокими. Сервис был медленным, хотя ресторан был не очень полным. У меня был домашний салат, который мог бы выйти из любого сизмы в нас. keshi yena, хотя вкусно напомнил мне барбекю вытащил курицу, этот ресторан очень завышен ».
Я хочу создать список списка слов, сохраняющих токенирование предложения, используя python.
После удаления стоп-слов я хочу получить результат для всех 50 комментариев, в которых сохраняются токены предложений, а токены-слова сохраняются в каждом токенизированном предложении. В конце я надеюсь, что результат будет похож на:
list(c("disappointment", "trip"),
c("restaurant", "received", "good", "reviews", "expectations", "high"),
c("service", "slow", "even", "though", "restaurant", "full"),
c("house", "salad", "come", "us"),
c("although", "tasty", "reminded", "pulled"),
"restaurant")
Как я могу это сделать в python? Является ли R хорошим вариантом в этом случае? Я действительно буду благодарен за вашу помощь.
Что такое 'c' во внутреннем списке? –