Для класса я говорю с проблемой анализа настроений twitter. Я рассмотрел другие вопросы на сайте, и они не помогают в моей конкретной проблеме.В Python, как проверить, являются ли слова в строке ключами в словаре?
Мне дана строка, которая является одним твитом с измененными буквами, так что все они в нижнем регистре. Например,
'after 23 years i still love this place. (@ tel aviv kosher pizza) http://t.co/jklp0uj'
, а также словарь слов, где ключевым является слово и является значение для настроения для этого слова. Чтобы быть более конкретным, ключ может быть одним словом (например, «привет»), более чем одним словом, разделенным пробелом (например, «желтый шершень») или дефинированным составным словом (например, «двумерным»,) или число (например, «365»).
Мне нужно найти настроение твита, добавив чувства для каждого подходящего слова и разделив на число подходящих слов (по подходящему слову, я имею в виду слово, которое находится в словаре). Я не уверен, что лучший способ проверить, имеет ли твит слово в словаре.
Я попытался с помощью «ключа в строке» конвенционный со сквозными через все ключи, но это было проблематично, потому что есть много ключей и слово-в-слова будут подсчитаны (например, уничтожить отсчитывает кошку, ел, эра и т. д.)
Затем я попытался использовать .split ('') и перейдя через элементы результирующего списка, но я столкнулся с проблемами из-за знаков препинания и ключей, которые являются двумя словами.
У кого-нибудь есть идеи о том, как я могу более эффективно справиться с этим?
Например: используя пример выше, все еще: -0.625, love: 0.625, каждое другое слово отсутствует в словаре. так что это должно вернуться (-0,625 + 0,625)/2 = 0.
@styvanesoukossi я сделал. – MCT
Вы можете показать ключ в этом вводе и ожидаемом выходе? – Hackaholic