выбор данных из большого файла

Следующая инструкция grep работает должным образом. Но это занимает много времени, если размер файла слишком велик (40GB)выбор данных из большого файла

grep '^INSERT' test.txt > new.txt

1) Есть ли другой способ быстро получить список всех «INSERT» заявления из этого файла?

2) Есть ли команда для быстрого удаления первых 100 строк из этого файла?

источник

2013-04-12 shantanuo

Какая у вас местность? 'echo $ LANG' – devnull

- ваш вопрос 1 и 2 для одной задачи или две задачи? – Kent

# local - это # en_US.UTF-8 ## вопрос 1 и 2 для одной задачи. Инструкция INSERT начинается после первых 100 строк – shantanuo

Вы можете сравнивать строки вместо матча регулярного выражения, но с 40GB не будет никакой волшебной команды вам все равно придется проверять каждую строку:

$ awk '$1=="INSERT"' test.txt > new.txt

Что касается второго вопроса использования sed:

$ sed -i '1,100{d;q}' test.txt

источник

2013-04-12 08:45:16

Вы делаете это с диска шпинделя? Если да, попробуйте SSD. Или, если вы можете себе это позволить, получите машину с достаточным количеством ОЗУ для размещения всего файла.

источник

2013-04-12 08:43:50 holygeek

Первая операция должна быть намного быстрее, следующим образом:

LANG=en_US grep '^INSERT' test.txt > new.txt

(если вы используете локаль с поддержкой UTF-8)

источник

2013-04-12 08:49:50 devnull

sed -n '1,100\!{/^INSERT/p}' test.txt > new.txt &

Вы можете отправить процесс в фоновый режим с «&» и продолжить работу. Используйте команду ps, чтобы проверить состояние фоновых процессов.

источник

2013-04-12 10:22:35

выбор данных из большого файла

ответ

Смежные вопросы