2016-04-21 2 views
0

Я пытаюсь использовать драгоценный камень ffi-aspell для проверки орфографии текста. Для этого мне кажется, что я должен сам извлечь эти слова. Я пытаюсь сделать это, применив String#scan к тексту с регулярным выражением, но это не кажется простым.Классы символов, используемые в ffi-aspell

Что является самым простым способом определения класса символов, который может появиться в словаре ffi-aspell на каком-либо языке? Я хочу сделать его доступным не только для английского языка, поэтому такие вещи, как /[a-zA-Z']/ для персонажа (или /[a-zA-Z']+/ слово), не работают. /[[:word:]]/, похоже, захватывает символы, которые не находятся в словаре, такие как цифры, и, кроме того, не соответствует апострофе (одинарная кавычка), который часто используется в слове. Есть ли какая-либо документация, которая определяет набор символов, используемый в словаре ffi-aspell?

+1

Не было бы проще сначала сканировать 'ffi_aspell' _dictionary_ для записей и просто любоваться' Regexp # union' uniques? – mudasobwa

+0

@mudasobwa Я думаю, что это даст идеальное решение. Это было бы гибким и давало точный набор, который я хочу. Можете ли вы превратить это в ответ? – sawa

ответ

1

Я думаю, было бы легче сканировать ffi_aspellсловаря первыми для записи и только своего рода Regexp#union уников потом.

Смежные вопросы