Я только начал использовать эту новую программу, которая выводит в нечетном формате, как показано ниже:Как выбрать конкретную информацию из файла? Python
CRISPR 10 Range: 7784249 - 7784543
POSITION REPEAT SPACER
-------- -------------------------------- ---------------------------------
7784249 GTTTCAATCCACGCCCCCGCATGGGGGGCGAC GTTAAGATTTTCAGCCGAAGCATAAGACTGCTCA [ 32, 34 ]
7784315 GTTTCAATCCACGCCCCCGCATGGGGGGCGAC ATCAATAACAATACCTTGCTTTTCAGTTTCATT [ 32, 33 ]
7784380 GTTTCAATCCACGCCCCCGCATGGGGGGCGAC TATAACTTTCTCCTTCTATTGTTGATGTAACATA [ 32, 34 ]
7784446 GTTTCAATCCACGCCCCCGCATGGGGGGCGAC TTTTCATTTGCATCAAGTTCTTTTTCAAGGTCAA [ 32, 34 ]
7784512 GTTTCAATCCACGCCCCCG>CONTIG-97480
-------- -------------------------------- ---------------------------------
Repeats: 5 Average Length: 32 Average Length: 33
CRISPR 11 Range: 8822044 - 8822520
POSITION REPEAT SPACER
-------- ------------------------------------- ------------------------------------
8822044 GTGTCAATGCCCTATATCGGGCGCACTTCATTTCTAC TTTACCAATCTCGGCTCTTTACTCCCGCTGGGTGCATT [ 37, 38 ]
8822119 GTGTCAATGCCCTATATCGGGCGCACTTCATTTCTAC TTAAAGCAGATACAAAGAAGCCTTGTGAGGAATATT [ 37, 36 ]
8822192 GTGTCAATGCCCTATATCGGGCGCACTTCATTTCTAC TATACTTCAGAAGTGCTGAGTTCCAGAAGCTTTTT [ 37, 35 ]
8822264 GTGTCAATGCCCTATATCGGGCGCACTTCATTTCTAC AAATATATGATTAATAATAAGAATAATCAAATAGTA [ 37, 36 ]
8822337 GTGTCAATGCCCTATATCGGGCGCACTTCATTTCTAC TTTCGTGGTTCCATCTGCTTATGAAACATTATTGATCT [ 37, 38 ]
8822412 GTGTCAATGCCCTATATCGGGCGCACTTCATTTCTAC GGATGAGGCTGGTACATATACGTACCTGGTTCTTC [ 37, 35 ]
8822484 GTGTCAATGCCCTATATCGGGCGCACTTCAT>CONTI
-------- ------------------------------------- ------------------------------------
Repeats: 7 Average Length: 37 Average Length: 36
мне было интересно, как я хотел бы идти о выборе только строк третьего столбца и вывести их в новый файл. Я также хочу, чтобы дать каждую часть названия, а также для следующей программы так, например, выход на первой линии «CRISPR 11»:
>CRISPR_11_8822044_8822520_1
TTTACCAATCTCGGCTCTTTACTCCCGCTGGGTGCATT
Таким образом, название производится до «>», то номер CRISPR, тогда значения диапазона и конечное число находятся там, где они находятся в порядке, например его 1, поскольку он является первым в этом множестве.
Я знаю, как писать в файл, но не знаю, как выбрать относительные части файла.
Любая помощь будет отличной.
Используйте str.split() и regex и strip()/lstrip()/rstrip(). – DBedrenko