У меня есть следующая строка:Python Regexp для извлечения тегов и слова
str1 = "I/TAG1 like/TAG2 red/TAG3 apples/TAG3 ./TAG4"
И у меня есть два списка в Python
tokens = []
tags = []
Мой желаемый результат будет:
tokens = ['I', 'like', 'red', 'apples', '.']
tags = ['TAG1', 'TAG2', 'TAG3', 'TAG3', 'TAG4']
Я пытаюсь использовать regexp, как этот:
r"\w*\/"
Но это извлекает слова косой чертой, то есть I /. Как я могу получить желаемый результат, по крайней мере для токенов (получить все до /)?
Один последний вопрос, что я должен делать, если я хочу также извлечь слова, подобные этим: mt./gal/hr/TAG5, 1/2/TAG5? (Тег всегда после последнего /) – dpalma
ok используйте это регулярное выражение, затем 'r '(\ S +)/([\ w.] +)'' Вместо 'r '([\ w.] +)/([ \ ш.] +) '' – anubhava