У меня есть файлы с несколькими столбцами, и я хочу читать значения из определенного столбца. Я могу прочитать столбец, используя awk{print $column_number}
.Извлечение данных из колонок unix
Каждый файл имеет разную длину столбцов, то есть некоторые могут составлять 1000 записей, а другим может быть всего 2 и так далее. Сами записи варьируются от 1 цифры до 5 цифр. Это одинаково для всех файлов.
Я хочу рассчитать диапазон наиболее повторяющихся значений. Например, если столбец гласит:
5
93
201
2002
20003
20005
20087
31450
31451
31452
31458
52400
52428
, то я хочу, чтобы хранить 31,400
как наиболее неоднократного значение, то 20,000
и 52,000
в качестве второго и третьего наиболее наиболее часто повторяющихся значений и так далее. Вы можете сказать, что я округляю ценности, чтобы увидеть самые повторяющиеся числа, если это имеет смысл. Эти значения (наиболее часто повторяющихся, то второй наиболее неоднократное) можно считать кратные 100. Таким образом, в основном код должен выглядеть примерно так:
for f in ls path-to-the-files/*
do
while read i
do
<do the operation to sort and store the values>
done
done
Буду признателен за помощь в этом!
ли все диапазоны последовательные куски 10000? – sethcall
Нет, они могут быть 11000, 67500, почти все, если этот диапазон повторяется часто. К сожалению, следовало бы упомянуть об этом. Я редактировал 52 000 вопросов. – dawnoflife
Я думаю, вам нужно лучше определить, что такое диапазон. 20000 и 52000 не являются диапазонами, они являются значениями. –