В чем разница между:Различия между Unix команд для сортировки CSV
!tail -n +2 hits.csv | sort -k 1n -o output.csv
и
!tail -n +2 hits.csv | sort -t "," -k1 -n -k2 > output.csv
? Я пытаюсь сначала отсортировать файл csv по первому столбцу, а затем по второму столбцу, чтобы строки с тем же первым столбцом все еще были вместе.
Кажется, что первый из них уже делает это правильно, сначала сортируя поле перед первой запятой, а затем полем, следующим за первой запятой. (разрыв связей, то есть.)
Или это на самом деле не так?
И что делает вторая команда? (И в чем разница между ними?). Когда я запускаю два, существует значительная разница между двумя файлами output.csv.
И, наконец, какой из них я должен использовать? (Или они оба ошибаются?)
Это мой hits.csv: –
внутрибрюшинно, метка времени 62.172.72.131,1041502001 62.172.72.131,1041502098 62.121.107.115,1041809792 163.28.16.1,1043258352 216.37.59.126,1044304131 68.104.188.224,1044472900 66.137.118.69,1044543502 207.181.42.20,1044646708 205.156.184.254,1045670100 80.225.248.61,1045779615 200.44.24.157,1046214366 193.63.247.68,1046260886 66.176.248.72,1046317786 216.249.85.109,1046566502 68,44 .222.12,1046638290 130.113 .69.66,1048009156 –
Итак, каков был бы правильный способ сделать это? –