Мне нужно разобрать некоторую строку из входного файла. Эти строки необходимы в Hadoop. Проблема в том, что эти строки находятся в тегах разметки.Соответствие содержимого внутри тега
Может кто-то предложить мне шаблон, чтобы соответствовать и хранить их
<id>INIcE89C561</id> <id>INIcE89C560</id> <id>Q1S5WLipQW2</id>
мне нужна строка между идентификатором тегом. Все теги из разных входных файлов. Мне нужно использовать их как значение. В ключевой паре значений.
Это выглядит так ужасно, как xml, это тот случай для всего входного файла? –
некоторые из входных выборок является Lile аравия \t || INIcE89C560 || INIcE89C561 области \t || Q1S5WLipQW2 ASICs \t || Q1S5WLipQW2 INIcE89C561 INIcE89C56 на \t || Q1S5WLipQW2 бадминтона \t || Q1S5WLipQW2 –