2010-11-04 5 views
9

Какие еще существуют варианты для разбора html в F #? В настоящее время есть некоторые регулярные выражения, но предпочли бы что-то вроде Pythons Beautiful Soup http://www.crummy.com/software/BeautifulSoup/ или могли бы использовать api, подобный jQuery из F #.F # html parsing

Я видел fslex и fparsec, но я не уверен, что кто-то еще уже создал некоторую библиотеку синтаксического анализа html с этими или мне придется писать свои собственные.

ответ

8

Я не пробовал использовать это (от F # или иначе), но Html Agility Pack, по-видимому, является предпочтительным решением для .NET.

What is the best way to parse html in C#?

+0

Я использую это уже более года и очень люблю это. Я столкнулся с одной ошибкой XPath, но в остальном она была полностью надежной. – Daniel

+0

Что было ошибкой XPath? Я использую эту библиотеку с XPath, и до сих пор это было хорошо. Надеюсь на некоторые другие варианты. – yanta

+0

@yanta, по-видимому «Html Agility Pack теперь поддерживает Linq для объектов (через LINQ to Xml Like interface)». Хотя я не уверен, как это можно использовать через F #. –