2013-12-18 2 views
0

У меня есть база данных, большинство из которых являются HTML-страницами, которые затем используются для показа в приложении.Как я могу искать содержимое в HTML, а не теги

Мы стремимся создать функцию поиска, но у меня есть некоторые проблемы с ложными срабатываниями из-за результатов, включая HTML-код.

например поиске «заголовка» будет возвращать содержание страниц, которые имеют название HTML тег

Мы в настоящее время используется NSPredicates для выполнения запроса на базе ядра данных.

Есть ли какие-либо простые/эффективные способы предотвращения возврата этих результатов?

У меня такая же проблема и на Windows и Android!

+0

http://stackoverflow.com/questions/240546/removing-html-from-a-java-string – dymmeh

ответ

1

Одна идея для iOS - фактически сохранить отдельную текстовую версию, кроме HTML-версии. Затем вы можете использовать очень простой (даже если не очень эффективные) предикаты лежат

[NSPredicate predicateWithFormat:@"text CONTAINS[cd] %@", searchText]; 

Более производительным способом было бы вырезать слова и хранить их в нижнем регистре в индексированной атрибута другого объекта.

В обоих случаях синтаксический анализ должен выполняться заранее через одну из доступных библиотек (см., Например, ссылку в комментарии).

Смежные вопросы