2010-09-15 3 views
1

Я ищу файл для тестирования моего приложения Sentence Splitter, и я надеюсь, что файл может охватывать как можно больше случаев.Sentence Splitter test file

Спасибо!

+0

Каким образом ваши спутники должны быть разделены и на каких условиях? – sum1stolemyname

+0

Язык английский. Алгоритм разбивает текст на основе верхнего или нижнего регистра, пунктуации или языковой грамматики. Это сложный алгоритм, поэтому я бы хотел проверить его как можно больше случаев. Очень простой пример - это предложение «Доктор Джон сказал, что его штат I.D. не является 3.1415». должно быть в одном предложении, но случай в http://stackoverflow.com/questions/1936388/what-is-a-regular-expression-for-parsing-out-individual-entences должен быть разделен на 6 предложений. – user200340

ответ

6

Прочитать документацию для Lingua::Sentence. Он называет корпус, который он использует, а также связанные модули разделения предложений. Просматривайте тестовые файлы.

+0

Спасибо! Отличный ресурс. – user200340