2017-01-02 10 views
0

У меня этот большой 294 000 строк csv с URL-адресами в столбце 1 и номерами в столбце 2.Как я могу сортировать очень большой файл CSV?

Мне нужно отсортировать их с наименьшего номера до наибольшего числа. Я загрузил его в программное обеспечение «CSVed», и он справляется с этим нормально, он не сбой или что-то еще, но когда я нажимаю верхнюю часть столбца, чтобы отсортировать его, он не делает его в порядке от самого маленького к самому большому, это все просто запутались.

У кого-нибудь есть идеи? Я искал весь день, я думал, что могу попросить здесь.

Спасибо.

+0

Есть _no_ заказа после того, как вы делаете что-то вроде? Это звучит странно для меня. У вас есть доступ к таким инструментам, как Java или, возможно, R? –

+0

Существует заказ, но это не правильный порядок, он все еще запутался. –

+0

Например, это будет 170, а затем 17050, затем 17 и т. Д. Первые числа будут совпадать, но это будет от небольшого числа до большого с малого до от малого до большого, если это имеет смысл –

ответ

0

Вы можете использовать сортировку gnu. Он занимает небольшую площадь памяти и может даже использовать несколько процессоров для сортировки.

sort -t , -k 2n file.csv 

Gnu рода доступен по умолчанию в большинстве дистрибутивов, а также для MacOS по умолчанию (хотя позже имеет несколько различных вариантов). Вы также можете установить его для окон, например, с CoreUtils for Windows.

Для получения дополнительной информации о вызове сортировки использует manual

+0

Это может сработать, я попробую. Благодарю. –

0

Если у вас есть доступ к системе UNIX (и ваши адреса не запятые в них), это должно сделать трюк:

sort -t',' -n -k2 filename 

Где -t говорит столбцы разделяются запятыми, -n говорит данные является числовым, и -k2 говорит, что сортировка основана на втором столбце.

+0

Боюсь, что нет, у меня есть только операционная система Windows. –

Смежные вопросы