2010-01-08 3 views
0

Я довольно хорошо знаком с SSIS разбором регулярных разделителями файлов текстовых данных, однако, я ищу некоторые советы по подходу к решению файла, который выглядит, как этот тестовый файл:SSIS-анализ нерегулярного плоского файла?

ISA*00* *00* *01*220220220 *ZZ*RL CODE 01*060327*1212*U*00300*000008859*0*P*:~ 
GS*RA*CPA-BPT*LOCALUTILITY*060319*1212*970819003*X*003030~ 
ST*820*000000001~ 
BPR*C*321.91*C*X12*CBC*04*000300488**9918939***04*000300002**1598564*070319~ 
TRN*1*00075319970819105029~ 
REF*RR*0003199708190000174858~ 
DTM*097*070318~ 
DTM*107*070318~ 
N1*PR*DIRECT PAYMENT~ 
N1*PE*ABC CORPORATE BILLER*ZZ*90005836~ 
ENT*1~ 
N1*PR*BILLING - TEST - NATTRASS~ 
RMR*CR*0009381082105011**142.15~ 
REF*TN*000303965~ 
DTM*109*070316~ 
ENT*2~ 
N1*PR*BILL FREID TEST~ 
RMR*CR*0011010451800011**179.76~ 
REF*TN*000304189~ 

321,91 является общая сумма транзакции.

Я бы предпочел сделать это с помощью SSIS, но также мог бы создать парсер C#.

Предложения были бы оценены.

спасибо.

+0

является это любой стандартный отраслевой формат? если это так, BizTalk имеет несколько расширений, которые обрабатывают перевод данных. –

+0

Вы когда-нибудь выясняли, как написать синтаксический анализатор для файла 837? Tks! – ssokol91

+0

@ ssokol91 - http://www.1edisource.com/transaction-sets?TSet=837 и/или искать http://www.liaison.com/products/transform/delta/ – ElHaix

ответ

2

Файл, показанный выше, называется «Файл 837». Вы можете искать 837 парсеров файлов или способы анализа такого файла в C#. У меня нет ссылки на это, но по крайней мере это должно помочь вам найти решение (помните: «837 файл»)

(Кстати, я считаю, что это нарушение правил HIPAA. ../этот пост в общественных местах Хотя данные могут быть вымышленными, вы не можете действительно опубликовать что-то вроде этого Пожалуйста, проверьте, что)

03/18/10 UPDATE:

Я нашел "How To Read the ANSI 837 File" doc here (скачать PDF файл)

03/26/10 ОБНОВЛЕНИЕ:

Я нашел дополнительную информацию об этом. Примером может быть не файл 837. Похоже, что это ANSI X12 - стандарт EDI. Пожалуйста, обратите внимание на EDI Mapping doc (pdf)

и, также этот Google Search Result on EDI X12

И это EDI Tools for Programmer

Пожалуйста, пост решения этой проблемы, чтобы кто-нибудь, кто нуждается в ответе выиграют от этого ;-)

+0

Вы должны указать, почему вы считаете, что фиктивный файл данных может быть нарушением HIPPA. –

+0

Так что я был неправ. Пожалуйста, проигнорируйте мой комментарий о нарушении правил HIPPA. ;-) – MarlonRibunal

+0

Это «HIPAA», а не «HIPPA». ;) –

0

Этот образец файла будет сложным для обычного компонента источника данных с плоскими файлами для обработки. Единственной альтернативой этому может быть использование компонента сценария как источника в потоке данных. Затем у вас будет доступ ко всем библиотекам .Net Framework, и тогда вы сможете создать свой настраиваемый парсер C# или vb (используя 2008) или vb (используя 2005) в этом компоненте. Удачи!

2

Ответ на этот вопрос нелегко. Источник данных «Плоский файл» SSIS не обрабатывает ничего, кроме простейших форматов. Я использовал задачу с плоским файлом, чтобы читать в оборванных правых или повторно напечатанных плоских файлах как один большой столбец. Затем я запускаю его через задачу сценария для обработки разбора. Извините, нет более легкого ответа, чем это ... вы бы подумали, что будет.

0

Предполагая, что выполнение этого в SSIS не является чистым вариантом, вы можете использовать библиотеку с открытым исходным кодом File Helpers, чтобы эффективно писать парсер C#.

Файловые помощники полезны для разбора файлов с разделителями, а также файлов фиксированной длины.

Смежные вопросы