Эй, довольно давно, я ищу программу просмотра PDF для командной строки.CLI pdf viewer для linux
Как мне нравится работать без X на Linux и часто работать на удаленной машине, мне бы хотелось иметь инструмент для чтения pdf-файлов. Есть довольно много действительно хороших графических программ (evince, okular, acroread, ...), чтобы выполнить эту работу, поэтому я решил, что должен быть хотя бы один достойный инструмент текстового режима. Но я даже не знаю, дерьмовый!
В настоящее время я либо запускаю X только для чтения pdf-файлов, либо для использования pdftohtml + lynx. Однако последнее не дает очень хорошего результата, и большинство документов просто нечитаемы, особенно если они содержат математическую формулу.
В Google полно людей, которые говорят, что это невозможно или предлагается версия pdftohtml.
Я понимаю, что это не совсем вопрос программирования, но сейчас я рассматриваю возможность запуска проекта для реализации такой программы, если там уже нет хорошего.
Спасибо за любые предложения.
Как это будет обрабатывать файлы PDF которые построены из источника изображения (без текста), который waaaayyy слишком распространен? –
Некоторые PDF-файлы преобразуются в плохой текст !, либо просто формы, либо вывод OCR, который скрыт над исходным изображением только для выбора. Который никогда не может быть преобразован в хороший текст! Как вы, по-вашему, должны быть обработаны? –
@ 0xA3: ну, есть библиотеки, способные отображать графику на консоль - libcaca и aalib. Можно даже посмотреть фильмы в искусстве ascii. Однако не слышал о просмотре в формате pdf. Кроме того, можно рендерить изображения в фреймбуфер с помощью svgalib. Однако не слышал о просмотре CLI pdf. Очевидно, это можно сделать, но я не уверен, что кто-то действительно потрудился сделать это. О, и с libcaca/aalib «графический» pdf будет едва читаемым. – SigTerm