Предположим, у меня есть множество слов. Например. {«Я», «как», «дыни», «Сьюзан», «любит», «яблоки»} (только очень простой пример), я хочу найти, где я должен добавить период, АКА, где я должен отделить предложение , Поэтому ответ будет «Мне нравятся дыни». «Сьюзен любит яблоки».Алгоритм для выделения предложений?
Капитализация может дать некоторые подсказки. Но заглавное слово не гарантирует начальное слово (первое слово предложения). Например, сокращения, такие как NBA, США, название страны, такие как Америка, Канада, капитализируются, но могут быть в середине предложения.
Какой алгоритм можно использовать для выполнения работы?
'Мне нравятся дыни, Сьюзен любит яблоки, также является правильным предложением. – fl00r
Вы можете ориентироваться только на него, и даже тогда это звучит не так просто. Большинство алгоритмов, которые я видел, делают это наоборот: с учетом текста с пунктуацией, попытайтесь найти, где предложение начинается и заканчивается. Но в конце дня предложение представляет собой довольно произвольную единицу текста (как и слово на самом деле), а его рендеринг в письменной форме весьма неоднозначен. – biziclop