У меня есть список слов, которые я хочу перекрестно ссылаться на кучу текстов, и если в тексте присутствует слово из строки поиска, я хочу сохранить текст.Захват любого появления слова в тексте; RegEx; Python
search_string = ['Good', 'Bad', 'Ugly']
Мой код до сих пор:
retained_texts = []
for text in full_text:
if set(text) & search_string:
retained_texts.append(' '.join(text))
Здесь full_text
список списков и text
список слов.
Этот метод имеет очень низкий уровень точности, поскольку он сохраняет только тексты, в которых Good
, Bad
и Ugly
являются отдельными словами. Однако он отвергает случаи, когда они внедряются другими словами.
Е.Г.,
Инстансы как Goodwill
, Ugly-duckling
, BadBoy
, Good-Bad-Ugly
и т.д. отвергнуты, в то время как я, безусловно, необходимо, чтобы они были сохранены.
Я бы предположил, что это можно решить с помощью регулярного выражения, но я, честно говоря, не знаю, как это сделать.
бы 'Good' рассчитывать как в' товаров '? – zondo
@zondo Да, было бы. Другими словами, любая строка, содержащая комбинацию символов из поиска, будет считаться. – Zlo
Как насчет случая? «Хорошо» считается как «товар»? – zondo