Единственный правильный способ сделать это, который также работает с огромными файлами, состоит в том, чтобы читать n байт за раз от конца до тех пор, пока у вас не будет нужного количества строк. Это, по сути, работает Unix tail
.
Пример реализации IO#tail(n)
, которая возвращает последние n
строки в качестве Array
:
class IO
TAIL_BUF_LENGTH = 1 << 16
def tail(n)
return [] if n < 1
seek -TAIL_BUF_LENGTH, SEEK_END
buf = ""
while buf.count("\n") <= n
buf = read(TAIL_BUF_LENGTH) + buf
seek 2 * -TAIL_BUF_LENGTH, SEEK_CUR
end
buf.split("\n")[-n..-1]
end
end
Реализация немного наивным, но быстрый тест показывает, что нелепая разница эта простая реализация уже может сделать (тестирование с ~ 25MB файл, созданный с yes > yes.txt
):
user system total real
f.readlines[-200..-1] 7.150000 1.150000 8.300000 ( 8.297671)
f.tail(200) 0.000000 0.000000 0.000000 ( 0.000367)
эталон код:
require "benchmark"
FILE = "yes.txt"
Benchmark.bmbm do |b|
b.report "f.readlines[-200..-1]" do
File.open(FILE) do |f|
f.readlines[-200..-1]
end
end
b.report "f.tail(200)" do
File.open(FILE) do |f|
f.tail(200)
end
end
end
Конечно, other implementations уже существует. Я не пробовал, поэтому не могу сказать, что лучше.
дубликата: [? Чтение последних п строк файла в Рубине] (http://stackoverflow.com/questions/754494) – hippietrail