2016-09-29 2 views
-1

Есть ли у кого-нибудь советы по удалению разделителей сплит-котировок в куске текста? Я использую Python, и я все еще новичок.Разделение котировок

Например, «Ну,» он сказал, «Полагаю, я мог бы отдохнуть». В этом примере курсивом «он сказал» является разделителем и его нужно удалить. Затем цитату нужно рассматривать как одну строку в цитатах, таких как «Ну, я полагаю, я мог бы сделать перерыв». Мне еще не удалось найти код, похожий на это, и надеялся, что кто-то сможет указать мне в правильном направлении.

Спасибо!

+0

Вы может заменить строку '' он сказал'', нет? –

+0

выглядит довольно простым регулярным выражением – njzk2

+1

Неясно, какие входные данные (абзац текста, целая книга, список предложений, список текстовых строк?) И что с этим делать. Он может варьироваться от удаления всего между второй и третьей цитатой и полного [NLP] (https://en.wikipedia.org/wiki/Natural_language_processing). – zvone

ответ

2

Для того, чтобы получить содержимое только в пределах " в вашей заданной строке, вы можете использовать re библиотеку как:

import re 
my_string = '"Well," he said, "I suppose I could take a break."' 
quoted_string = re.findall(r'\".*?\"', my_string) 
# 'quoted_string' is -> ['"Well,"', '"I suppose I could take a break."'] 
new_string = ''.join(quoted_string).replace('"', '') 
# 'new_string' is -> 'Well, I suppose I could take a break.' 

Вы можете написать такой же, как один вкладыш как:

''.join(re.findall(r'\".*?\"', my_string)).replace('"', '') 
Смежные вопросы