Мне нужно извлечь имена пользователей и идентификаторы из очень большого файла. Я использую python 2.7. Мне нужно распечатать все, что приходит после имени пользователя = или prId = и с кавычками "".python regex pattern matching
Вход:
1. username="null null”
2. username="test"
3. username="test name"
4. username="<unknown>"
5. prId="tokenKeyUser"
Ниже должен быть согласован:
null null
test
test name
<unknown>
tokenKeyUser
В настоящее время я делаю ниже:
re.search(r'username="(.*?)"', line)
re.search(r'prId="(.*?)"', line)
Это в состоянии найти все шаблоны, кроме линия 1 и строка 5.
Это не в состоянии найти: 1. «нуль нуль» 2. „tokenKeyUser“
Что я делаю неправильно здесь
Строка 1, похоже, имеет смарт-цитату, заканчивающую указанную подстроку. – DavidO
В первой строке я вижу два разных символа '' 'и' '' – furas
... и второй соответствует мне. Невозможно воспроизвести ошибку совпадения. – DavidO