2015-12-03 5 views
3

Я пытался использовать службу IBM Watson Document Conversion с демо-PDF, но это не превращает документ в маленькие биты. Все, что он делает, создает 1 блок ответа, который действительно длинный:Преобразование документов Уотсон не работает?

"text": "Watson is an artificially intelligent computer system capable of answering questions posed in natural language,[2] developed in IBM's DeepQA project by a research team led by principal investigator David Ferrucci. Watson was named after IBM's first CEO and industrialist Thomas J. Watson.[3][4] The computer system was specifically developed to answer questions on the quiz show Jeopardy![5] In 2011, Watson competed on Jeopardy! against former winners Brad Rutter and Ken Jennings.[3][6] Watson received the first place prize of $1 million.[7] Watson had access to 200 million pages of structured and unstructured content consuming four terabytes of disk storage[8] including the full text of Wikipedia,[9] but was not connected to the Internet during the game.[10][11] For each clue, Watson's three most probable responses were displayed on the television screen. Watson consistently outperformed its human opponents on the game's signaling device, but had trouble responding to a few categories, notably those having short clues containing only a few words. In February 2013, IBM announced that Watson software system's first commercial application would be for utilization management decisions in lung cancer treatment at Memorial Sloan- Kettering Cancer Center in conjunction with health insurance company WellPoint.[12] IBM Watson's former business chief Manoj Saxena says that 90% of nurses in the field who use Watson now follow its guidance.[13]" 

Заранее спасибо!

ответ

6

К сожалению, этот демонстрационный PDF не является лучшим документом для использования: В настоящее время единицы ответа разбиваются на теги заголовков (h1 - h6) и что PDF не содержит заголовков. = (

Если вы установите conversion_target в NORMALIZED_HTML, вы будете иметь возможность видеть преобразованный PDF, прежде чем он раскололся на Ответ единиц. Он будет содержать пункты, но никаких заголовков.

В будущем мы ожидать также позволяет расщепление Ответа единиц пункта, но это еще не выпустили

UPDATE:.. Мы обновили PDF на демо-сайт с одним, что гораздо лучше пример

+1

Вы можете получить много лучший пример PDF здесь: https://github.com/mfulgo/document-conversion-nodejs/raw/master/pub lic/data/samplePDF.pdf –

+0

Привет, Мэтт! Спасибо за помощь, и это действительно сработало для меня! -Tanmay – TajyMany

Смежные вопросы