Предположим, у меня был список слоганов (короткие, многословные фразы), и люди проголосовали за те, которые им больше всего нравятся, и я хотел бы оценить, какие слова, если таковые имеются, сделал некоторые лозунги более популярными, чем другие. Какой был бы лучший способ достичь этого? Моя первая мысль заключалась в том, чтобы просто найти все уникальные слова в наборе лозунгов и оценить каждое из них как среднее число голосов всех лозунгов, содержащих указанное слово, но частота должна также входить в игру некоторым образом, я думаю, так что должно быть справедливо следующее:Алгоритм определения того, какие слова делают фразу популярной
- Если слово а происходит только лозунг, который получил наибольшее количество голосов, и Слово B происходит только в лозунге, который получил второе-самое, слово а является более «популярность приносящего»
- Однако, если Word A встречается только в лозунге высшего ранга, а Word B встречается как в лозунгах второго, так и в третьем слове, Word B должен побеждать, поскольку он подталкивает больше лозунгов к вершине.
- Однако одно из слов Word A в верхнем слогане должно по-прежнему превзойти три появления Word B в других лозунгах, если они, скажем, в средней или нижней половине пакета (то есть, в подсчете голосов должен быть баланс голосов и частота).
Я также хочу исключить слова, которые обычно являются общими (например, «или»). Это связано с вопросами об определении трендовых слов, которые были заданы в прошлом, но различны, потому что изменение с течением времени не является фактором. Я был бы счастлив просто указать в правильном направлении об этом, насколько это касается литературы, но я не совсем уверен, что искать. Является ли это проблемой, с которой сталкиваются другие люди?
Люди на http://metaoptimize.com/qa узнают об этом подробнее. – Frank 2010-12-04 00:48:53