Недавно я читал некоторые статьи о классификации интернет-трафика, в частности, используя алгоритмы машинного обучения.Классификация интернет-трафика
Я планирую изучить его, и я хотел бы предложить идею проекта по классификации интернет-трафика для моего класса машинного обучения в этом семестре.
Мой первый шаг - собрать данные в моей локальной сети, состоящей из 3-4 клиентов. Я использую инструмент wirehark для обнюхивания пакетов.
Следующим шагом является извлечение потоков TCP из пакетов wirehark. На этом этапе я пытаюсь использовать tcpflow для Linux. tcpflow создает разные файлы для каждого потока. Здесь содержимое файлов в основном двоично, и я не могу понять, как я могу извлечь дискриминаторы из этих файлов.
Может кто-нибудь дать мне идею или поделиться своим опытом о том, как я могу интерпретировать файлы tcpflow? Я буду более чем счастлив услышать вашу рекомендацию.
Заранее спасибо.