У меня есть большой файл, полный линий, как это ...Подсчитайте наиболее распространенные вхождения неизвестных строк в файл
19:54:05 10.10.8.5 [SERVER] Response sent: www.example.com. type A by 192.168.4.5
19:55:10 10.10.8.5 [SERVER] Response sent: ns1.example.com. type A by 192.168.4.5
19:55:23 10.10.8.5 [SERVER] Response sent: ns1.example.com. type A by 192.168.4.5
Я не заботиться о каком-либо других данных, только то, что после того, как «response sent:» Мне нужен отсортированный список наиболее распространенных вхождений доменных имен. Проблема в том, что я не буду знать все имена доменов заранее, поэтому я не могу просто выполнить поиск строки.
Используя пример выше, я хотел бы выход быть вдоль линий
ns1.example.com (2)
www.example.com (1)
... где число в скобках() отсчеты этого события.
Как я могу использовать это для Windows? Входной файл - .txt - выходной файл может быть любым. В идеале это процесс командной строки, но я действительно потерялся, поэтому я был бы доволен чем угодно.
Я _really_ хочет помочь вам, но я боюсь, ваш вопрос не вверх к стандартам SO. Это читается как вопрос, связанный с кодами. Вы что-то пробовали? – Matt
Я пробовал несколько вариантов параметров командной строки grep, основываясь на других вопросах, которые я нашел в stackoverflow, но, честно говоря, кодирование - это не моя дневная работа, мне просто дали это после того, как кто-то ушел - то, что я всегда нашел, входная поисковая строка (чтобы быть известна) - поэтому я попытался взять файл выше, отсортировать его в excel, чтобы удалить лишний материал, а затем запустить grep по всему для каждого из доменов, но это слишком медленно/вручную - я понял, что там должен быть лучшим способом. – notAduck