Это проблема с С. Skiena книжного, постановка задачи является:Найти наиболее частых Заказал пару слов в документе
Дайте алгоритм для нахождения пары упорядоченного слово (например, «Нью-Йорк») , встречающихся с наибольшей частотой на данной веб-странице. Какую структуру данных вы бы использовали? Оптимизируйте время и пространство.
Одно очевидное решение вставляя каждую упорядоченную пару в хэш-карте, а затем перебирает все из них, чтобы найти наиболее часто один, однако, безусловно, должно быть лучше, кто может предложить что-нибудь?
Почему должен быть определенно лучший способ? –
Является ли «Йорк Нью» тем же самым, что и «Нью-Йорк»? Что насчет «Нового». Йорк "так же, как« Новый, Йорк »так же, как« Новый \ nYork »? – dawg
@OliverCharlesworth, потому что он использует O (n^2) время и память, если n - количество слов в документе, что слишком много. Кроме того, как говорит мой лектор, вы должны спросить себя: «Мы можем сделать лучше?» :) – Susan