2017-01-21 3 views
-3

Итак, я попытался использовать токенизаторы, но я могу только выяснить, как заменить или удалить отдельные разделители в java.Как конвертировать некоторые ограниченные случаи файлов * .tex в обычный текст * .txt

Нравится использовать этот ввод: \ box {Boxed words} {\ boldface Эта строка выделена жирным шрифтом. }

Я хочу, чтобы убрать \ поле и некоторые другие рекомендации, которые я должен соблюдать, которые: Правила, которые мы собираемся применить, очень просты.

  1. Удалить все команды, обратные косые следы, сопровождаемые одной или несколькими строчными буквами, и завершены с пробелом.
  2. Удалить все фигурные скобки:} или {.
  3. Замены все математике дисплей (символы в пределах $), по слова ФОРМУЛА 1 , ФОРМУЛА 2 и т.д ...
  4. среда (специальная команда). \ begin {enumerate} \ item Первый элемент, \ fer и только это. \ item Вторая строка \ итерация и, возможно, больше. \ item Третье. ... \ end {enumerate} помещает все между элементами обратной косой черты в новый абзац с номером. Так что выше должен выглядеть так:
  5. Первый пункт и только это.
  6. Вторая строка и, возможно, больше.
  7. В-третьих.
+0

Вы, по сути, спрашиваете, как написать парсер для TeX, чтобы вы могли различать команды данных (текст) и разметки (команды TeX). Это большая задача и слишком широка для StackOverflow. Поскольку это школьный проект, вы должны попросить своего учителя о помощи, а не StackOverflow. –

+0

Хорошо, я думал, что это будет небольшая задача, поскольку я только в своем втором классе java, и профессор только дал неделю, чтобы понять это, когда он даже не упоминал ничего о разборе и т. Д. – Avo

ответ

0

Разумным способом (IMO) является использование автономного TeX для преобразования текста (или TeX в HTML). Это должно:

  • Сохраните вашу работу в реализации собственного конвертера.
  • Сделайте лучшую работу ... при условии, что вы выбрали достойный конвертер.
  • Изолируйте вас от необходимости иметь дело с потоком особых случаев, когда ваш эвристический/шаблонный подход не срабатывает.
+0

Я должен написать java-программу, которая выступает как простой конвертер для файлов tex в txt-файлы. Например, удалив все в tex-файле, который является командой (\ box или \ boldface), и удалите все фигурные скобки в этом файле. – Avo

+1

Почему? Это упражнение? Если да, то (конечно) ваш учитель объяснил вам, как использовать синтаксический анализ или сопоставление шаблонов. Я предлагаю вам спросить своего учителя о каком-то руководстве. –

+0

Я спросил учителя, но его очень трудно понять и очень расплывчато по тому, что он хочет. Я даже спросил TA, и TA говорит, что он не понимает инструкции преподавателей. Можете ли вы объяснить, как синтаксический анализ или сопоставление шаблонов помогут в этом упражнении или какую-то страницу, которая покажет мне? Заранее спасибо. Я пытался использовать то, что мы покрывали, в течение 7 часов и не повезло. Мы рассказывали больше о строках и токенизации, но я могу только избавиться от символов, а не от слов сразу после символа сосать как «\ bold». – Avo

Смежные вопросы