У меня есть .tex-файлы, из которых я хочу получить простой текст без каких-либо латексных тегов, таких как \ section {...} или \ newpage.
Есть ли у кого-нибудь идеи о том, как достичь этого? У меня также есть .pdf-файл, но когда я просто копирую код оттуда, некоторые слова получат сцепление, которое действительно плохо.
Есть ли какой-нибудь инструмент, который вы знаете?извлечь текст из tex, удалить теги латекса
ответ
Пожалуйста, смотрите OpenDetex GitHub page последнюю версию OpenDetex. Это более современная, производная версия моего оригинального DeTeX.
Мое наследие DeTeX home page доступно here.
Если вы хотите получить исходный код detex-2.8.tar, вы можете получить его here.
opendetex доступна как для окон и Linux
скачать программу opendetex здесь
http://opendetex.googlecode.com/files/opendetex-2.8.1.tar.bz2
http://code.google.com/p/opendetex/downloads/list
Использование: http://code.google.com/p/opendetex/wiki/Usage
распакуйте его в любой каталог по вашему выбору , Скажите и извлеките его в каталог Downloads.
сделать другой каталог любого имени в этом (необязательно, но его полезно, если вы создаете). скажем, имя каталога - «my_paper». Поместите свою бумагу в каталог «my_paper». сказать свое имя бумаги project.tex
Перемещаться по пути
cd ~/Downloads/opendetex
Выполните команду
detex -n my_paper/project.tex > out.txt
родовой формы
detex -n full_path_to_tex_file.tex > output_text_file.txt
- 1. Извлечь фигуры из файла латекса
- 2. Извлечь текст между ~ теги
- 3. Как исключить определенные теги латекса в OpenDetex?
- 4. Как удалить теги, включая текст из строки
- 5. Удалить номера разделов латекса
- 6. Кодировать текст на TeX
- 7. JS извлечь текст между скобками теги
- 8. Как извлечь теги HTML без/исключая текст
- 9. Извлечь текст между двумя текстовыми ограничителями (теги)
- 10. Как извлечь текст из contenteditable DIV (но не HTML-теги)
- 11. удалить \ начать {табличные} из Звездочет .tex выход
- 12. Как извлечь теги из XML
- 13. Python извлечь текст из XML
- 14. Удалить html-теги из UIWebView
- 15. Помещение меток оси латекса через gnuplot и в документ латекса
- 16. извлечь текст из тега
- 17. извлечь текст из UIWebView
- 18. Извлечь текст из MP3
- 19. Извлечь текст из SWF
- 20. Извлечь текст из div
- 21. Извлечь текст из CSV
- 22. Извлечь текст из PDF
- 23. Извлечь текст из изображений
- 24. Извлечь текст из XML?
- 25. Извлечь текст из массива
- 26. извлечь текст из mht
- 27. Извлечь текст из Webview
- 28. Извлечь текст из JComboBox
- 29. Извлечь текст из ссылки
- 30. Запуск латекса в Emacs
Добро пожаловать! –
Работает только с файлами ASCII tex. Если вы используете кодированные tex-файлы с xelatex и UTF-8 с символами, отличными от ASCII, detex выводит мусор для символов, отличных от ASCII. – Lucas
Это с открытым исходным кодом, он всегда может быть исправлен. –