привет, я новичок в программировании на python, помогите мне создать функцию, которая была взята в текстовом файле в качестве аргумента, и создает список слов, тем самым удаляя все знаки препинания, а список «разбивается» на двойное пространство. Я хочу сказать, что список должен создавать сущности для каждого двойного пробела в текстовом файле.как разбить текстовый файл на несколько списков на основе whitespacing в python?
Это моя функция:
def tokenize(document):
file = open("document.txt","r+").read()
print re.findall(r'\w+', file)
Входной текстовый файл имеет строку следующим образом:
What's did the little boy tell the game warden? His dad was in the kitchen poaching eggs!
Примечание: Там два интервала после надзирателя? и перед Его
Моя функция дает мне выход, как этот
['what','s','did','the','little','boy','tell','the','game','warden','His','dad','was','in','the','kitchen','poaching','eggs']
Желаемая выход:
[['what','s','did','the','little','boy','tell','the','game','warden'],
['His','dad','was','in','the','kitchen','poaching','eggs']]
Как применить функцию split() в производном списке после первого прохода? можете ли вы написать этот модуль для меня, чтобы я мог понять .. – Wolf