Я новичок в hadoop, и мне нужно добавить данные в таблицу в улье. У меня есть данные из FIX4.4 протокола, что-то вроде этого ...Как вставить данные в таблицу в следующем сценарии?
8=FIX.4.4<SHO>9=85<SHO>35=A<SHO>34=524<SHO>49=SSGMdemo<SHO>52=20150410-15:25:55.795<SHO>56=Trumid<SHO>98=0<SHO>108=30<SHO>554=TruMid456<SHO>10=154<SHO>
8=FIX.4.4<SHO>9=69<SHO>35=A<SHO>34=1<SHO>49=Trumid<SHO>52=20150410-15:25:58.148<SHO>56=SSGMdemo<SHO>98=0<SHO>108=30<SHO>10=093<SHO>
8=FIX.4.4<SHO>9=66<SHO>35=2<SHO>34=2<SHO>49=Trumid<SHO>52=20150410-15:25:58.148<SHO>56=SSGMdemo<SHO>7=1<SHO>16=0<SHO>10=174<SHO>
8=FIX.4.4<SHO>9=110<SHO>35=5<SHO>34=525<SHO>49=SSGMdemo<SHO>52=20150410-15:25:58.164<SHO>56=Trumid<SHO>58=MsgSeqNum too low, expecting 361 but received 1<SHO>10=195<SHO>
Во-первых, то, что я хочу есть, в 8=FIX.4.4
8 в качестве имени столбца и FIX.4.4 как значение этого столбца, в 9=66
9 должно быть имя столбца, а 66 - значение этого столбца и т. д .... и в таком сыром файле так много строк.
Во-вторых, то же самое для другой строки, и эти данные будут добавляться в следующий ряд таблицы в улье.
Теперь, что я должен делать, я не могу думать.
Любая помощь была бы пригодна.
Как вы обычно в результате чего в данных? Какие инструменты/язык программирования вы используете? Используя довольно простое регулярное выражение, вы, вероятно, можете отфильтровать пары столбцов и значений. С помощью этих пар не должно быть слишком сложно создать CSV, который вы можете легко импортировать в куст. – spijs
Как создать regex для этого файла и преобразовать его в CSV? @spijs –