Я читаю приведенный выше .txt-файл, в котором я должен идентифицировать эти три письма типа (ARW, CZC, DUN и т. Д.). Позже я должен прочитать идентификаторы тестового примера, такие как VR-GREQ .... до следующего языка. но у меня проблема при чтении этого .txt-файла. Ниже мой код:как читать файл с помощью python?
with open(output_filename) as parser_file:
for language in parser_file:
language = language.strip()
if(re.search('[A-Z]', language)):
lines = parser_file.readlines()
я должен дальше код, может кто-то пожалуйста, помогите мне?
мой новый код: выходной_файл = г "C: \ Usersktop \ TEST \ Language \ output.txt" четкости записи():
rx = r'^([A-Z]{3})$'
# define a dictionary for the languages
languages = {}
# looks for exactly three uppercase letters from beginning to end
# define a temporary list
tmp = list()
for line in open(output_filename, 'r+'):
m = re.search(rx, line, re.MULTILINE)
if m is not None:
if len(tmp) > 0:
languages[current] = tmp
tmp = list()
current = m.group(1) # current holds the actual language tag
else:
if len(line) > 0:
tmp.append(line.strip())
# after the loop
if len(tmp) > 0:
languages[current] = tmp
print languages
Я не уверен, что именно вы хотите сделать с этими данными. – GarethPW
Например - я хочу читать ARW со всеми этими идентификаторами: ARW VR-GREQ-299684_6j VR-GREQ-299684_6k VR-GREQ-299606_3 VR-GREQ-299606_4 VR-GREQ-299606_5 VR-GREQ-299606_7 VR-GREQ-299606_9 VR-GREQ-299607_4 VR-GREQ-299608_1 VR-GREQ-299563_10 – sam