Предположим, у меня есть текстовый файл с разделителями табуляции, который содержит данные, расположенные в столбцах (с заголовками).Есть ли модуль Perl для разбора столбчатого текста?
Возможно, что разные столбцы могут быть «сложены» в «рабочий лист», например, есть разделитель (который может или не может быть заранее известен), который позволяет размещать разные столбцы по вертикали.
Есть ли модуль Perl, который облегчает разбор столбчатых данных в этом текстовом файле в структуру данных (например, хеш-таблицу с ключом, являющимся заголовком столбца, а значение является массивом сканеров данных столбцов)?
EDIT Под слоем «stacked» я имею в виду, что столбец текста может содержать несколько отдельных «векторов» данных, каждый из которых имеет разные заголовки и разную длину. По общему признанию, это усложняет синтаксический анализ.
EDIT Я честно не знаю, где такое замешательство. Тем не менее, вот пример:
header_one\theader_three
data_1\tdata_7
data_2\tdata_8
data_3\tdata_9
\tdata_10
header_two\tdata_11
data_4\theader_four
data_5\tdata_12
data_6\tdata_13
\tdata_14
Сценарий бы превратить это в хэш-таблицу с четырьмя ключами: header_one
, header_two
, header_three
и header_four
, каждая клавиша ссылки ссылочный массив Указав на data_n
элементов расположенных под заголовком.
Вам, вероятно, придется показать пример ... Мне сложно визуализировать. – Tanktalus
Я не думаю, что у меня есть пример, который я могу легко вставить и форматировать на этой странице. Представьте себе один столбец данных (с уникальным заголовком), а другой сразу под ним (с другим уникальным заголовком). –
ПОКАЗАТЬ ПРИМЕР! Если вы хотите, чтобы кто-нибудь придумал что-то, что сработает. –