Есть ли у кого-нибудь советы по удалению разделителей сплит-котировок в куске текста? Я использую Python, и я все еще новичок.Разделение котировок
Например, «Ну,» он сказал, «Полагаю, я мог бы отдохнуть». В этом примере курсивом «он сказал» является разделителем и его нужно удалить. Затем цитату нужно рассматривать как одну строку в цитатах, таких как «Ну, я полагаю, я мог бы сделать перерыв». Мне еще не удалось найти код, похожий на это, и надеялся, что кто-то сможет указать мне в правильном направлении.
Спасибо!
Вы может заменить строку '' он сказал'', нет? –
выглядит довольно простым регулярным выражением – njzk2
Неясно, какие входные данные (абзац текста, целая книга, список предложений, список текстовых строк?) И что с этим делать. Он может варьироваться от удаления всего между второй и третьей цитатой и полного [NLP] (https://en.wikipedia.org/wiki/Natural_language_processing). – zvone