У меня есть файл с 2 столбцами («IdNo», «skillList») в файле csv. когда я прочитал файл. Он считывает весь файл в виде строки. IdNo имеет serialNumber, а у SkillList есть список определенных пользователем навыков. Поэтому я хочу узнать частоту использования навыков.подготовка данных в читаемом формате на python
Но моя проблема заключается в том, как получить данные в доступной форме. Мои данные выглядят примерно так.
>>> a1
'IdNo, skillsList\nBAXA0000206_NEENA_TIWARI_0.htm,"[u\'Training\', u\'E-Learning\', u\'PowerPoint\', u\'Teaching\', u\'Accounting\', u\'Team Management\', u\'Team Building\', u\'Microsoft Excel\', u\'Microsoft Office\', u\'Financial Accounting\', u\'Microsoft Word\', u\'Customer Service\']"\nBAXA0000227_ABDUR_RAZZAQUE_0.htm,"[u\'Telecommunications\', u\'Data Center\', u\'ISO 27001\', u\'Management\', u\'BS25999\', u\'Technology\', u\'Information Technology...\', u\'Certified PMP\\xae\', u\'Certified BS25999 Lead...\']"\nBAXA0000261_Priya _ Lobo_0.htm,"[u\'Market Research\', u\'Segmentation\', u\'Marketing Strategy\', u\'Consumer Behavior\', u\'Experience Working with...\']"
Нужна помощь. Thanks
Прочитайте его Csv пакет предоставляемых Python. Или используйте Pandas reader. – sashkello
Альтернативно смотрите в функцию «split». Который разделит вашу строку запятой и поместит в список. – sashkello
http://docs.python.org/2/library/csv.html или http://pandas.pydata.org/pandas-docs/dev/io.html – sashkello