2015-09-28 5 views
0

Я пытаюсь получить первые 10 слов из строки, закодированной в HTML.Извлечение количества слов из HTML-документа

В настоящий момент я раскол по пробелам. проблема заключается в том, что пробелы в аргументах тегов также распознаются как отдельные слова.

Мне нужен механизм, который возвращает мне правильно отформатированный предварительный просмотр HTML-документа в виде строки в Ruby или JavaScript.

У кого-нибудь есть идея?

разрешены в HTML строки представляют собой списки, абзацы, цвета и т.д. Но ничего экзотического, как формы, радио, плавающие фреймы таблицы или флэш

+2

Можете ли вы привести пример для строки? – Saar

+3

Вам нужно будет использовать html-парсер для этого. Простая обработка строк может не дать вам результат, который вы ищете –

+0

http://jsfiddle.net/arunpjohny/t0xntsyh/5/? –

ответ

0

Если вам нужно сделать эту работу в Ruby, вы можете использовать Nokogiri камень , Это идеально подходит для вашей работы. Here у вас есть примеры того, как его использовать. Nokogiri хорошо документирован и прост в использовании.

Смежные вопросы