Поиск количества строк в файле

-2

Я пытаюсь написать очень маленькую программу, которая проверит количество подстрок в большом текстовом файле. Все, что он сделает, это подсчитать первые 2000 строк текстового файла, найти любые подстроки «TTT», подсчитать их и установить переменную в эту сумму. Я немного новичок в оболочке, поэтому любая помощь будет удивительно оценена!Поиск количества строк в файле

#!/bin/bash 

$counter=(head -2000 [file name] | grep TTT | grep -o TTT | wc -l) 
echo $counter

источник

2016-04-19 Frost

Разве это не работает? Вы действительно не задавали вопрос. –

Он дает синтаксическую ошибку, Извините, если это было не ясно – Frost

Вы должны использовать 'counter =' вместо '$ counter ='. Кстати, первый «grep TTT» можно пропустить. –

Для чего это стоит вам может awk лучше подходит для этой задачи:

awk -F"ttt" '{j=(NF-1)+j}END{print j}' filename

Это поделит каждую запись в файле с помощью разделителей «ТТТ». Затем он подсчитывает количество полей, вычитает один и добавляет это к сумме.

Файл вроде:

ttt tttttt something 
1 5 ttt 
tt 
one more ttt record

бы разделить (визуализируя с трубой DELIM), как:

| || something 
1 5 | 
tt 
one more | record

Подсчет количества полей в записи:

Вычитая один от этого:

Количества до 5, то есть количество подстрок «ttt».

Чтобы включить это в скрипт (и фиксации ваш другой вопрос):

#!/bin/bash 

counter=$(awk -F"ttt" '{j=(NF-1)+j}END{print j}' filename) 
echo $counter

Изменение в том, что, когда мы устанавливаем переменную в Bash мы не включаем в знак $ на фронте. Только при ссылке на переменную мы включаем $.

источник

2016-04-19 19:39:47 JNevill

как насчет того, чтобы сделать еще один шаг? 'awk -v RS =" ttt "'END {print NR-1}' file' – karakfa

Это очень приятно! – JNevill

У вас есть некоторые незначительные ошибки синтаксиса там, вероятно, вы имели в виду это:

counter=$(head -2000 [file name] | grep TTT | grep -o TTT | wc -l) 
echo $counter

Обратите внимание на малейшие изменения, которые я сделал там, чтобы заставить ее работать.

Btw grep TTT в середине избыточен, вы можете просто удалить его, то есть:

counter=$(head -2000 [file name] | grep -o TTT | wc -l)

источник

2016-04-19 20:09:39 janos

Grep уже может делать то, что вы хотите: counter=$(grep -c TTT $infile). Вы можете ограничить количество обращений (не строк) с помощью -m NUM, --max-count=NUM, что делает остановку grep в конце файла ИЛИ когда найдены NUM вхождения.

источник

2016-05-17 15:15:42 azrdev

Поиск количества строк в файле

ответ

Смежные вопросы