Я хотел бы проанализировать HTML-документ и распечатать каждый из абзацев в файл журнала как отдельную запись. До сих пор у меня есть:f # split html по тегам
let parseTextFile (path) =
let fileText = File.ReadAllText(path)
fileText.Split('<p>') |> Seq.iter (fun m -> logEmail(m))
Но, к сожалению, для меня String.split не делать то, что я хочу здесь, кажется, существуют, чтобы разбить строку на один символ разделитель. Как я могу разбить файл, используя что-то большее, чем один символ, может быть приятно иметь что-то большее, чем просто < p>, а потому, что при этом у меня будет </p> в конце абзаца. С регулярным выражением или каким-то сложным совпадением я мог бы более точно выделить все между < p> тегами.
Взгляните на эту перегрузку: http://msdn.microsoft.com/en-us/library/tabh47cf.aspx – wmeyer