Я ищу, чтобы создать двоичный код, который принимает строку html на stdin, и выплескивает хорошо сформированную строку xml, представляющую DOM. В основном «аккуратный», но с использованием FireFox.FireFox версия tidy
Любые идеи, где я должен подключиться к исходному коду FF?
Почему вы хотите, чтобы Firefox выполнял работу? –