Я пытаюсь разбить строку на python с помощью регулярных выражений. Эта линия работает почти идеально для меня:Python regex splitting дополнительно на _
from string import punctuation
import re
row = re.findall('\w+|[{0}]+'.format(punctuation), string)
Однако он не разбивает строку на экземпляры _. Например:
>>> string = "Hi my name is _Mark. I like apples!! Do you?!"
>>> row = re.findall('\w+|[{0}]+'.format(punctuation), string)
>>> row
['Hi', 'my', 'name', 'is', '_Mark', '.', 'I', 'like', 'apples', '!!', 'Do', 'you', '?!']
Что я хочу:
['Hi', 'my', 'name', 'is', '_', 'Mark', '.', 'I', 'like', 'apples', '!!', 'Do', 'you', '?!']
Я прочитал его, потому что _ считается характер. Кто-нибудь знает, как это сделать? Спасибо за помощь.
're.findall ('\ ш + | [{0}] + | _ +'. (Формат пунктуации), строка) ' –
^Вышеупомянутая проблема дает мне такую же проблему: _Mark – mt88