Я пытаюсь создать приложение в Rails, которое поможет пользователям читать китайский текст. Если пользователь нажимает на китайский символ, они получат информацию о произношении и значении.Построение китайско-английского словаря - как определить, какие символы образуют слова?
Я получил это для работы с использованием базы данных китайско-английского словаря. Тем не менее, я не уверен, как определить, является ли персонажем только один символ или часть более длинного слова. Например: у меня есть текст 我是铁公鸡
, и пользователь нажимает на слово 公
, что означает «общедоступный», но приложение должно показывать выделение 铁公鸡
как «скряга». Таким образом, персонаж может быть автономным или создавать слова с другими персонажами.
Что такое эффективный способ определения того, что слово образует персонаж? Я думал о проверке целевого символа и его соседей против базы данных и выборе самой длинной комбинации, которую можно найти. Любые другие идеи?
Удивительная проблема для решения. Думаю, вам нужно выделить оба экземпляра, чтобы показать возможные значения. Таким образом, вместо того, чтобы пытаться решить, что показывать, вы показываете пользователю все возможности: один символ в виде слова или слово, составленное несколькими окружающими символами. – Mohamad
хорошая проблема, действительно. Я, вероятно, поеду на выделенный [полнотекстовый поисковик] (http://stackoverflow.com/questions/47656/how-do-i-do-full-text-searching-in-ruby-on-rails), потому что они специализированы в этих прецедентах, но я должен признать, что я не знаю, поддерживает ли какой-либо двигатель китайский язык. –
Я сделал сайт, который делает то, что вы описали: 3000hanzi.com – stevendaniels