2010-05-19 2 views
0

Я новичок в Python, и я хочу, чтобы извлечь данные из этого форматачтения и извлечения данных из файла с помощью питона

<seq id> <alignment start> <alignment end> <envelope start> <envelope end> <hmm acc> <hmm name> <type> <hmm start> <hmm end> <hmm length> <bit score> <E-value> <significance> <clan> 

**FBpp0143497**  **5 151**  5 157 PF00339.22 **Arrestin_N**  Domain  1 135 149  83.4 **1.1e-23** 1 CL0135 
**FBpp0143497** **183 323** 183 324 PF02752.15 Arrestin_C  Domain  1 137 138  58.5  **6e-16** 1 CL0135 
FBpp0131987  60 280  51 280 PF00089.19 Trypsin   Domain 14 219 219 127.7 3.7e-37 1 CL0124 

этот формат

>FBpp0143497 
5  151  Arrestin_N  1.1e-23 

>FBpp0143497 
183 323  Arrestin_C  6e-16 
+4

Пожалуйста, покажите код, который у вас есть. Это не «Write Code For Me.COM» –

+0

Возможный дубликат [проблема при извлечении данных из текстового файла] (http://stackoverflow.com/questions/2873929/problem-in-extracting-the-data-from- текстовый файл) – Mark

ответ

1

Вы можете разобрать файл с модуль 'csv', используя пробел как разделитель. Смотрите документацию для csv.reader

1

Как это протеомические данные, вероятно, вы могли бы найти специальные парсер в BioPython пакете

0

Вы можете использовать раскол(), чтобы отделить элементы в пространствах, а затем распечатать значение вы хотите из возвращенного списка.