У меня есть набор текстовых файлов, которые имеют вид:извлечения часть текста из файла в Python
Sponsor : U of NC Charlotte
U N C C Station
Charlotte, NC 28223 704/597-2000
NSF Program : 1468 MANUFACTURING MACHINES & EQUIP
Fld Applictn: 0308000 Industrial Technology
56 Engineering-Mechanical
Program Ref : 9146,MANU,
Abstract :
9500390 Patterson This award supports a new concept in precision metrology,
the Extreme Ultraviolet Optics Measuring Machine (EUVOMM). The goals for this
system when used to measure optical surfaces are a diameter range of 250 mm
with a lateral accuracy of 3.3 nm rms, and a depth range of 7.5 mm w
есть больше текста выше и ниже фрагменте кода. Я хочу быть в состоянии сделать следующее для каждого текстового файла:
магазин программы NSF и номера Fld Applictn в списке, и сохранить соответствующий текст в другом списке
так, в приведенном выше примере Я хочу следующее для i-го текстового файла:
y_num[i] = 1468, 0308000, 56
y_txt[i] = MANUFACTURING MACHINES & EQUIP, Industrial Technology, Engineering-Mechanical
Есть ли чистый способ сделать это в python? Я предпочитаю python, так как я использую os.walk для анализа всех текстовых файлов, хранящихся в подкаталогах.
В зависимости от того, насколько последовательны формат вы можете либо сделать это с помощью регулярных выражений или простые операции с строками или путем написания парсера. Все это возможно в python. –
Да, и строковые операции, как правило, довольно утомительны, если вы делаете их много. Хотя иногда это не так уж плохо. См. Мой ответ, например. –