2016-05-22 3 views
0

pdflib - хорошее программное обеспечение для анализа PDF. Когда я использую его для извлечения текста из PDF. Как извлечь текстовое предложение по предложению? Теперь я могу извлечь только слово, строку, страницу. Например, дать следующее содержание в PDF:Как использовать pdflib получить текстовое предложение по предложению?

I want to extract text from pdf 
Sentence by sentence. Is there 
anybody can help? 

слово возвращаемый режим одно слово каждый раз (т.е. я, хотение, чтобы, экстракт ...), возврат в режим линии на одну строку каждый раз (т.е. я хотите извлечь текст из pdf; Приговор по предложению Есть: anyboy может помочь?). Режим страницы возвращает весь абзац. То, что я хочу, чтобы это предложение каждый раз (то есть я хочу, чтобы извлечь текст из PDF-предложения по приговору; Есть ли кто-нибудь может помочь?)

ответ

0

Я по электронной почте поддержки, и ниже их ответ:

Здравствуйте ,

это невозможно TET. Я предполагаю, что вы ссылаетесь на TET (не PDFlib), который является нашим инструментом для извлечения текста.

Чтобы получить контент по предложению, вы должны добавить процесс сообщения, который определит конец предложения, а затем вернет строку так, как вы хотите. Например, когда вы используете слово детализации, вы перебираете все слова. Затем вы объединяете все слова, пока слово не будет нарушено. Затем вы возвращаете строку . Однако это должно быть сделано в ваш код.

Смежные вопросы