2014-01-07 2 views
-2

Я преобразовываю данные Marathi из PDF в excel или word, но не получает правильный формат. Я скопировал некоторые данные из PDF и вставил в текстовый документ, но он не получил правильного формата. , например. प्रविण सुधाकर शिरवाडकर эта строка находится в PDF , но когда я копировал и вставлял слово, он получал -प्रववर् सुधाकर शिरवाडकर Что мне делать для этого? кто-нибудь, пожалуйста, помогите мне.Как преобразовать данные marathi из pdf в excel в надлежащем формате

спасибо заранее

ответ

0

проверить шрифт в вашем PDF и попытаться сделать его доступным для документа слова.

+0

Я уже пробовал это, но он не получил результат –

0

Я думаю, что вы не имеете perticular шрифты, используемые в PDF

В Adobe Reader - - меню Файл> Свойства вкладка> Шрифты дает вам список всех шрифтов, используемых в документе.

+0

Я уже пробовал это, но он не получил результат –

+0

откройте документ в Adobe Reader, щелкните правой кнопкой мыши по нему, затем нажмите «Свойства документа», перейдите на вкладку «Шрифты». Он отобразит все шрифты, используемые в этом документе. –

0

Есть, по-видимому, проблемы в том, как PDF хранит текст unicode devnagri. Попробуйте этот альтернативный маршрут: конвертируйте PDF в изображение. Можно использовать интерактивный инструмент или загруженный, или если на использовании Linux эту команду в терминале:

for f in *.pdf; do convert -density 200 "$f" "${f}_200dpi.jpg"; done 

изменения плотности от 200 до другой в соответствии с необходимостью. Каждая страница из вашего документа должна быть преобразована в файл изображения. Для инструмента Windows попробуйте https://www.pdfill.com/pdf_tools_free.html

Затем перейдите к http://www.i2ocr.com/free-online-hindi-ocr, загрузите изображение и конвертируйте его. Это использует OCR (оптическое распознавание символов).

Смежные вопросы