У меня очень большой текстовый файл, содержащий статистику хоккея.разобрать файл, чтобы получить 10 лучших игроков.
мне нужны две вещи из каждой строки:.
- имя игрока
- точки (первый набор чисел)
И я хочу, чтобы вернуться в топ-10 список.
Ниже приведен образец текстового файла, но он продолжается намного дольше.
html_log:Bob 1217.1 1.75 696:48 1 5 38 6 109 61 14:42 633 223 25 435:36 182 34 0.55
html_log:Steve 485.5 1.26 385:18 7 12 -1 28 172 218 16:04 839 94 101 143:18 44 15 -0.03
html_log:Jim 1153.3 1.84 625:54 1 2 71 3 2 10 7:58 499 3 5 616:36 241 36 1.13
-repeats с большим количеством игроков и статистика (без перевода строки)
мне нужно получить имя игрока в этом случае текст после «html_log» тега я также нужен первый набор чисел , и для вывода верхнего списка 10 нужно выводить.
Оптимальный результат был бы выход
- >>
Bob 1217.1
Jim 1153.3
Steve 485.5
+ остальные пользователи в текстовом файле, и их рейтинг, от высшего к низшему. или только 10 лучших из текстового файла.
Что вы пробовали до сих пор? Какую часть вы застряли? Разбор файла должен быть простым с помощью нескольких вызовов «split» или регулярного выражения. Получение 10 лучших из любого итерабельного легко с помощью 'heapq.nlargest'. Если вы правильно настроите свой код, этот итерабельный может быть итератором, который вы кормите, когда идете вперед. – abarnert
Насколько велика большая? Килобайты, мегабайты, гигабайты? – mvp
Я согласен с @abarnert.разбор этого файла довольно прост. – IcyFlame