Я хочу найти (не сгенерировать) 2 текстовые строки, чтобы после удаления всех букв и ucasing одна строка может быть переведена на другую путем простой подстановки.Как найти «эквивалентные» тексты?
Мотивация для этого происходит из проекта, который я знаю о том, что это методы тестирования для атаки шифров через распределения вероятностей. Я хотел бы найти большой, согласованный простой текст, который после шифрования с помощью простой подстановки cypher может быть дешифрован к чему-то еще, что также является связным.
Это заканчивается как 2 части, найдите самые длинные такие строки в корпусе и получите этот корпус.
Первая часть мне кажется, быть любезным к какой-то атаки с B-дерева шпонкой из строки после подстановки, что делает последовательность первых появлений последовательно.
HELLOWORLDTHISISIT
1233454637819a9b98
Немного оптимизации на основе зная, максимальное значение и длину строки, основываясь на каждой глубине дерева и остальные просто кодирования.
Другая часть была бы более привлекательной; как создать большой текст для поиска? какой-то интернет-паук, казалось бы, был бы идеальным подходом, поскольку у него был бы доступ к самому большому количеству текста, но как его разделить только на текст?
Вопрос в том, Любые идеи о том, как сделать это лучше?
Редактировать: шифр, который использовался, является безумно базовым 26-ти подписным шифром.
p.s. это скорее мысленный эксперимент, чем вероятный реальный проект для меня.
Этот вопрос довольно запутанный. – mepcotterell 2008-12-07 18:04:15
Какая часть (и)? Критерии соответствия? Метод поиска? Часть о получении корпуса? – BCS 2008-12-07 21:01:53