Помимо использования ADO, есть ли другой способ извлечения данных из файла PDF с помощью VB6? Мне удалось открыть PDF-файл с использованием VB6 без использования Acrobat Reader, но следующий шаг в моем проекте требует чтения PDF-файла и поиска данных из него. Например, какие страницы показывают слово «цемент»?Как прочитать файл PDF
ответ
В общем, вам нужно будет полагаться на внешнюю библиотеку. Чистое решение VB (т. Е. Чтение файла как текст и процесс самостоятельно) - это то, что вы не снимаете через неделю.
Вы можете использовать Adobe Acrobat через автоматизацию. Например, чтобы начать работу, например, http://www.freevbcode.com/ShowCode.asp?ID=7066. Обратите внимание, однако, что Adobe Reader недостаточно, вам действительно нужен полный Acrobat. Существуют и другие популярные библиотеки чтения PDF (например, poppler), однако вам может быть трудно использовать те, что в VB6.
В общем замечании, ваши шансы на успех зависят от того, что вы подразумеваете под «извлечением». Проще говоря, PDF - это чисто описательный формат без метаинформации. То есть файл содержит инструкции, такие как «Поместить a at (x1, y1), поставить« foo »в (x2, y2)» и т. д. Чтение таблиц или любая структурированная информация потребуют огромного количества эвристик.
Лучшим способом действий, вероятно, является попытка получить данные, которые вы хотите извлечь, в более подходящем формате данных (открытый текст, XML, что угодно).
- 1. Не могу прочитать pdf-файл
- 2. Невозможно прочитать PDF-файл с использованием PDFBOX
- 3. Прочитать содержимое pdf как строку
- 4. Не удается прочитать PDF-файл с сервера
- 5. Imagick Не удалось прочитать файл PDF
- 6. невозможно прочитать pdf-файл с использованием imagick
- 7. Как просмотреть файл PDF
- 8. Прочитать файл с nodejs
- 9. Как открыть PDF и прочитать его?
- 10. Прочитать содержимое pdf-файла
- 11. Чтобы прочитать pdf в asp.net
- 12. Прочитать pdf-файлы с php
- 13. CGPDFDocument не смог прочитать pdf
- 14. Как прочитать файл назад?
- 15. Как прочитать файл Windows.edb?
- 16. прочитать бинарный файл (питон)
- 17. Невозможно прочитать PDF порожденную IText
- 18. Прочитать pdf-слова с php
- 19. Python прочитать часть PDF-страницы
- 20. iTextSharp - как открыть/прочитать/извлечь прикрепленный файл?
- 21. Прочитать pdf-файл по строкам с помощью java
- 22. Возможно ли прочитать pdf-файл в формате txt?
- 23. Прочитать PDF-файл на новой вкладке того же браузера
- 24. Прочитать PDF в приложении rails
- 25. Прочитать pdf-файл с SD-карты с помощью webview
- 26. Вставить файл Pdf в DLL, а затем прочитать его
- 27. Пытается прочитать pdf-файл в модальном всплывающем окне на кнопке
- 28. Прочитать файл в формате PDF или изображение перед отправкой
- 29. Есть ли способ прочитать pdf-файл, используя AS3? (Air)
- 30. Невозможно прочитать PDF-файл в маратхи текст в программе Java
Err, ADO и PDFs ?? – Deanna
Разбор в формате PDF [очень сложный действительно] (http://stackoverflow.com/questions/1251956/is-there-a-pdf-parser-for-php), по-видимому (это для PHP, но даст вам представление о сложности). Между тем: VB6 ?! – halfer
Вы искали здесь: http://stackoverflow.com/questions/7784235/read-pdf-file-contents-in-vb – thejartender