Я пытаюсь пометить уровни заголовков (уровень 1, уровень 2, уровень 3) из многих заголовков. Использование размера шрифта Информация, поступающая из HTML. Сначала я взял размер шрифта, используя регулярные выражения, какUima Ruta Уровни управления
"<span style=\"font-family:\'(.+?)\'"->1=fontfamily;
"<span style=\"font-family(.+?)font-size:\'(.+?)\'"->2=font size;
Теперь мне нужно сравнить все эти направляющихся размеры, используя FONTSIZE информации и уровни тегов заголовка на его основе.
Вход:
<span style="font-family:'Times New Roman'; font-size:'14pt'"><span class="">MATERIALS AND METHODS</span></span>
<span style="font-family:'Times New Roman'; font-size:'12pt'"><span class="">Chemicals</span></span>
<span style="font-family:'Times New Roman'; font-size:'10pt'"><span class="">HILIC-MS Profiling of Metabolites</span>