Чтение файла с Рубином

У меня есть текстовый файл, который содержит список регулярных выражений, которые я регулярно использовать для очистки HTML файлов по:Чтение файла с Рубином

list.txt

<p[^>]*>|<p> 
<\/?(font|span)[^>]*>| 
<\/u>\s*<u>| 
<\/u>\s*<i>\s*<u>|<i>

, если каждая строка состояла из форма «# {а} | # {Ь}», что было бы самым простым способом чтения и преобразовать этот файл в массив:

[ 
    [ /<p[^>]*>/, '<p>' ], 
    [ /<\/?(font|span)[^>]*>/, '' ], 
    [ /<\/u>\s*<u>/, '' ], 
    [ /<\/u>\s*<i>\s*<u>/, '<i>' ] 
]

источник

2009-06-21 Stefan

Умм, я просто написал вам код, который будет работать на | также. Попробуйте это. – Elitecoder

Написал другой код, который будет работать для "!" Надеюсь, это поможет. – Elitecoder

Попробуйте следующее:

result = File.foreach("list.txt").collect do |line| 
    *search, replace = line.strip.split("|", -1) 
    [Regexp.new(search.join("|")), replace] 
end

Или, если ваш сепаратор не происходит в регулярных выражений и замены:

result = File.foreach("list.txt").collect do |line| 
    search, replace = line.strip.split("!", -1) 
    [Regexp.new(search), replace] 
end

источник

2009-06-21 21:36:02 molf

Предполагая, что #{b} часть никогда не будет содержать |, я получаю следующее:

File.open(filename,"r").collect 
    { |s| 
    x = s.rindex('|'); 
    [ Regexp.new(s[0..x]), s[x+1..-1].chop ] 
    }

В противном случае, вы, вероятно, придется заменить s.rindex('|') с чем-то более сложным.

источник

2009-06-21 21:35:52 mweerden

Чтение файла с Рубином

ответ

Смежные вопросы