Я разобрал этот фид http://www.sixapart.com/labs/update/developers/ с nokogiri, а затем запустил некоторое регулярное выражение по содержимому некоторых тегов. Содержимое UTF-8 в основном, но иногда коррумпировано. Тем не менее, для моего случая мне все равно, и мне просто нужно передать правильные части контента, поэтому я рад рассматривать данные как двоичные/ASCII-8BIT. Проблема в том, что независимо от того, что я делаю, регулярные выражения в моем скрипте рассматриваются как UTF-8 или ASCII. Независимо от того, для чего я установил комментарий для кодировки, или что я делаю для создания регулярного выражения.Ruby 1.9 regex encoding
Есть ли решение для этого? Могу ли я заставить регулярное выражение бинарно? Могу ли я сделать gsub без регулярного выражения? (Я просто заменяю & amp; с &)
вы можете легко передать строку в GSUB string.gsub («& амп», «&») – ipsum
Делать это просто вызывает строку, чтобы стать регулярным выражением. Та же проблема – singpolyma