Я получаю текст из тела HTML-документа, как показано ниже. Когда я пытаюсь выполнить регулярное выражение для выражения «Приложение 99», я получаю не сопоставленный, т. Е. Пустой массив. Однако в html я вижу «Приложение 99», хотя элемент проверки показывает его с & nbsp99. Как я могу избавиться от этих символов HTML и искать «Приложение 99», как если бы это была обычная строка?Работа со специальным символом в Nokogiri/Regex
url = "https://www.sec.gov/Archives/edgar/data/1467373/000146737316000912/fy16q3plc8-kbody.htm"
doc = Nokogiri::HTML(open(url))
body = doc.css("body").text
body.scan(/exhibit 99/i)
Это работает. Не могли бы вы объяснить, что делает этот кусок кода? – PiperWarrior