Мне нужно вдохновение. Для хобби-проекта я играю с анализом контента. Я в основном пытаюсь проанализировать входные данные, чтобы сопоставить его с тематической картой.Какие инструменты вы используете для анализа текста?
Например:
- "Путь в Ираке"> История, Ближний Восток
- "Halloumni"> Питание, Ближний Восток
- "BMW"> Германия, Автомобили
- «Обама "> США
- "Impala"> США, Автомобили
- "Берлинская стена"> История, Германия
- " Bratwu первый»> Продукты питания, Германия
- „чизбургер“> Продукты питания, США
- ...
Я читал много о систематике и в конце концов, все, что я прочитал вывод, что все люди теги по-разному, и поэтому система будет терпеть неудачу.
Я думал о токенизированных вводах и остановке списков слов, но они, конечно же, много работы, чтобы придумать и построить. Построение соответствующих связей между словами и темами кажется исчерпывающим, а также никогда не заканчивающимся на любом языке, с которым вы имеете дело, он очень богат, и большинство языков также сильно зависят от контекста. Не говоря уже об этом.
Я думаю, мне нужно придумать что-то умный и обучать его темами, которые я хочу, чтобы угадать. Вид как Eliza bot.
В любом случае, я не верю, что есть что-то, что делает это из коробки, но есть ли у кого-нибудь какие-либо выводы или примеры использования технологий для анализа ввода, чтобы извлечь , что означает?
Я думаю, что я пытался зарегистрироваться несколько раз. Они все еще должны мне пароль. Но я думаю, я попробую еще раз и дам вам знать, как это получается. Огромное спасибо! – Till
Я знаю, что это заняло некоторое время, чтобы принять - мы использовали много OpenCalais. Еще раз спасибо за все предложения. :) – Till