Я выполняю проект по обнаружению вторжений на основе хоста с использованием набора данных ADFA-LD, теперь я делаю модуль выделения функций. Я построил словарь фразы, который состоит из фраз вызова системы длины 4. И теперь для извлечения функции мне нужно сравнить фразы с новыми трассами системного вызова (следующие примеры):извлечение фраз из текстового файла в java
sys_clock_gettime sys_poll sys_poll sys_clock_gettime sys_poll sys_poll sys_poll sys_clock_gettime sys_poll sys_clock_gettime sys_poll sys_poll sys_poll sys_poll sys_poll sys_poll sys_poll sys_poll sys_socketcall .......
Что мне нужно, это, как я могу сравнить эти фразы с новыми следами. я делаю в java.
моя фраза словарь:
sys_socketcall-sys_poll-sys_clock_gettime-sys_poll
sys_clock_gettime-sys_poll-sys_poll-sys_socketcall
sys_poll-sys_socketcall-sys_poll-sys_clock_gettime
sys_poll-sys_clock_gettime-sys_clock_gettime -sys_clock_gettime
sys_clock_gettime-sys_clock_ge TTIME-sys_socketcall-sys_clock_gettime
sys_socketcall-sys_clock_gettime-sys_poll-sys_poll
sys_poll-sys_poll
я использую '-' в качестве разделителя в сравнении эти фразы с новыми следами, поэтому я присоединился к уникальной системе звонки с '-'.
Покажите нам, что вы пробовали до сих пор. Если вы застрянете, мы постараемся помочь. – icza
Вопрос не показывает никаких усилий. -1 – zubergu
Не могли бы вы уточнить, что именно это указывает критерий длины? Все строки вашего примера имеют длину> 4, так что это означает, что все строки выбраны правильно? – MrHug