У меня есть текстовый файл с таким форматом:Как анализировать определенные текстовые данные?
B2100 Door Driver Key Cylinder Switch Failure B2101 Head Rest Switch Circuit Failure B2102 Antenna Circuit Short to Ground`, plus 1000 lines more.
Это, как я хочу, чтобы это было:
B2100*Door Driver Key Cylinder Switch Failure B2101*Head Rest Switch Circuit Failure B2102*Antenna Circuit Short to Ground B2103*Antenna Not Connected B2104*Door Passenger Key Cylinder Switch Failure
так, что я могу скопировать эти данные в LibreOffice Calc и он будет отформатировать его на две колонки кода и означать каждый.
Моего мыслительный процесс:
Применить регулярный экспресс над Bxxxx и поставить звездочку перед ним (он выступает в качестве разделителя) и \n
до значения (? Я не знаю, если это будет работать), и удалите пробел до следующего символа.
Я пытаюсь изолировать B2100 и провалился до сих пор. Моя наивная попытка:
import re
text = """B2100 Door Driver Key Cylinder Switch Failure B2101 Head Rest Switch Circuit Failure B2102 Antenna Circuit Short to Ground B2103 Antenna Not Connected B2104 Door Passenger Key Cylinder Switch Failure B2105 Throttle Position Input Out of Range Low B2106 Throttle Position Input Out of Range High B2107 Front Wiper Motor Relay Circuit Short to Vbatt B2108 Trunk Key Cylinder Switch Failure"""
# text_arr = text.split("\^B[0-9][0-9][0-9][0-9]$\gi");
l = re.compile('\^B[0-9][0-9][0-9][0-9]$\gi').split(text)
print(l)
Это выходы:
['B2100\tDoor Driver Key Cylinder Switch Failure B2101\tHead Rest Switch Circuit Failure B2102\tAntenna Circuit Short to Ground B2103\tAntenna Not Connected B2104\tDoor Passenger Key Cylinder Switch Failure B2105\tThrottle Position Input Out of Range Low B2106\tThrottle Position Input Out of Range High B2107\tFront Wiper Motor Relay Circuit Short to Vbatt B2108\tTrunk Key Cylinder Switch Failure']
Как достичь желаемого результата?
Чтобы разбить его дальше, что я хочу сделать это:
ломаются все в код (B1001) и значение (текст после него) массив, а затем применить каждую операцию (\n
вещь) на нем индивидуально. Если у вас есть лучшие идеи о том, как сделать все это, тем лучше. Я хотел бы услышать это.
да есть ... Но это кажется случайным. –
'replace ('B21', '\ nB21')'? –