2014-01-05 3 views
1

пожалуйста, у меня есть файл .csv этот файл выглядетьУдалить и добавить слова в CSV-файл

Example Company       
(999) 999-9999      
http://yourwebsite.com        
Report Date Range: Dec 26, 2013 - Dec 26, 2013      
Exported: Dec 26, 2013        
Twitter : Profile Summary        
Screen Name,Name,Description,Location,Followers,Following,Listed 

SctaSa,statisticalgraph,statistical Screen- The official account for your organization,Saudi Arabia,6775,8,75 

Итак, мне нужно принять конкретные данные из файла .csv быть читаемым для трансформации SSIS, начало из столбца «Имя экрана» и добавьте два столбца «Диапазон дат отчета» & «Экспортировано», которое существует в строке № 4 & 5, чтобы поместить их в конец списка столбцов, после чего поместите данные этих двух столбцов в конце строки данных и удалить данные мусора, чтобы они выглядели так:

Screen Name,Name,Description,Location,Followers,Following,Listed,Exported,Report Date Range 
SctaSa,statisticalgraph,statistical Screen- The official account for your organization,Saudi Arabia,6775,8,75,26-Dec-13,26-Dec-13 

Можем ли мы сделать это с помощью команды Windows или C#?

пожалуйста, помогите, потому что я не являюсь экспертом в C# и я хочу использовать этот скрипт в проекте SSIS

Спасибо за помощь

+0

Имеются ли заголовки (например, компания, отображающая имя, ..), только один раз в файле? если это так, вы, вероятно, можете сделать всю работу в SSIS – Jayvee

+0

Как я могу это сделать в SSIS?! расскажи мне об этом. – user3143565

ответ

0

Если вы не знакомы с C#, то я предлагаю вам use PowerShell или аналогично этому. Это будет намного проще протестировать в командной строке и изменить в будущем.

Для получения конкретных строк из текстового файла с помощью PowerShell см. this answer.

Затем пользователь PowerShell добавит дополнительный текст или, вероятно, лучше будет использовать SSIS для добавления новых столбцов и предоставления значений, таким образом, вы уменьшите количество манипуляций с текстом. И, предположительно, значения данных происходят откуда-то, что будет легче получить из SSIS, чем в PowerShell.

0

Что-то на этих линиях, чтобы сделать это в SSIS (я уверен, что он может быть улучшен): поток

данных:

  • Исходный компонент: читать CSV, ограниченный CRLF (т.е.каждая строка будет возвращать один столбец в трубопровод)

  • Производный столбец: разбивка по лексема «:» когда вы найдете подстроки «вывезенных» или «Report Date Range»

    компонент
  • Сценарий: Сохранить полученный столбцы экспортируемого/Report Date Range к переменному

  • условного разделение: isHeading (столбец ==»Имя, название, описание, местоположение, подписчики, После, в списке»)
    isDetailLine (маркер „“ появляются й количество раз)

  • Производный столбец Если isHeading: колонка Pipeline + «вывезенных, Report Date Range»

  • Производный столбец Если isDetailLine: колонка Pipeline + «» + переменная вывезенных +»,» + переменная Report Date Диапазон

  • Союз

  • Назначение Компонент

Смежные вопросы