2016-11-04 2 views
1

Я пытаюсь работать с RestfulAPI на python.Отправить строку текста OCR для resAPI

После того, как OCR в формате pdf, я хочу отправить текст в restfulAPI, чтобы вернуться к загрузке определенных слов вместе со своей позицией в тексте. Мне еще не удалось отправить строку текста в API.

код следующим образом:

import requests 
import PyPDF2 
import json 

url = "http://xxapi.xxapi.org/xxx.util.json" 

pdfFileObj = open('/Users/xxx/pdftoOCR.pdf','rb') 
pdfReader = PyPDF2.PdfFileReader(pdfFileObj) 
pageObj = pdfReader.getPage(1) # To try with the text found in the first page 

data = {"text": pageObj.extractText()}  
data_json = json.dumps(data)  
params = {'text':'string'} 


r = requests.post(url, data=data_json, params=params) 
r1 = json.loads(r.text) 

Хотя я получаю ответ 200 из запроса, данные должны поступать в формате Json с необходимостью опрашивать некоторые лексемы URL (который я не знаю, как это сделать либо) Также я не думаю, что запрос правильный, когда я вставляю маркер в браузер, я вижу пустой Json-файл (без слов, без позиции), даже если я знаю, что часть текста, которую я пытаюсь отправить, содержит требуемые слова.

Заранее благодарен! Я работаю с OS X, питон 3,5

+0

с pdfReader.getPage (1) Я имел в виду вторую страницы (как питон начинается от 0) Я изучил первый R и я новичок в python –

ответ

0

Ну, большое спасибо @ Jose.Cordova.Alvear для решения этой проблемы

import json 
import requests 

pdf= open('test.pdf','rb') 
url = "http://xxapi.xxapi.org/xxx.util.json" 

payload = { 
    'file' :pdf 

    } 

response = requests.post(url, files=payload) 

print response.json() 
Смежные вопросы