2011-04-30 5 views
0

У меня есть база данных терминов и фраз.
Если эти термины/фразы существуют в тексте, он сообщает, для чего это важно. Это может быть сделано с 2 APIs доступных онлайн
http://developer.yahoo.com/search/content/V1/termExtraction.html
http://developer.zemanta.com/
Но результаты не то, что я хочу.
Я вижу интуитивно, что это можно сделать очень изысканно (не интенсивно)
Там лежит моя проблема. Я не могу понять, как это сделать быстро и с очень низким ресурсом (CPU и память)
Термины/фразы указаны в миллионах, а также текстовые строки. PHP - это единственный язык, с которым я знаком. Спасибо за ваши предложения.Поиск терминов/фразы в тексте

ответ

0

Вы можете использовать lucene для извлечения терминов из документов и их сопоставления с вашей базой данных. Насколько я знаю, есть PHP/Zend API/Port для lucene.

Был аналогичный вопрос, как это сделать с lucene в java. Это должно указывать на правильное направление: Effective search on a small text

Смежные вопросы