2010-11-08 2 views
1

Мне нужно прочитать некоторые тестовые данные из html-документа. Проблема в том, что некоторые неанглийские символы там показаны как коды HTML (например, Ø - Ø). Как я могу изменить их на один символ? Позже мне нужно будет сравнить эти символы с тем, что пользователь входит в веб-форму.Сохранение HTML-кодов (например, Ø) в виде букв

Я пытаюсь сделать это в Ruby 1.9.2.

Заранее благодарен

ответ

1

Этот вопрос был много раз. Но я не могу его найти. Итак, как я помню:

require 'CGI' 
some_string = 'Ø&>' 
p CGI.unescapeHTML(some_string).gsub(/&#(\d+);/){[$1.to_i].pack 'U'} 

=> "\u00D8&>" 

\u00D8 ваш символ. &> - это только пример использования CGI::unescapeHTML.

Смежные вопросы