2013-09-14 4 views
1

У меня есть текстовый файл, который содержит журнал так:Создание Numpy массива с определенным форматом данных

245  (click,view,view,check,view,view)   (22,1,5,6,7,15) 

305  (view,run)  (5,6) 

3051   (run,run)  (115,36) 

Это вкладка отделено, количество записей во втором поле столбца равно треть поле столбца.

Мне сложно взять это на python, используя np.loadtxt, поскольку он имеет разделитель и текст и скобки (круговые) для разделения 2-го поля и 3-го поля.

Ждем предложений по поводу того, как я должен это делать?

ответ

2

Возможно, было бы лучше разобрать его каким-то образом со стандартным питоном, прежде чем загружать его в numpy? Не зная о том, как numpy нужно отформатировать, ниже приведен пример, чтобы превратить его в массив массивов.

Например, вы можете использовать split().

Защиту MakeItAList (lineFromFile): список = сплит (lineFromFile " ") список [1] ​​= сплит (список [1] ​​[1: -1],",") список [2] = сплит (список [2] [1: -1], ",")

Это немного неуклюже, но он превратится в 245 (click,view,view,check,view,view) (22,1,5,6,7,15). во что-то вроде [245, [click,view,view,check,view,view], [22,1,5,6,7,15]], которое немного более управляемо как структура данных.

Смежные вопросы