Как вы можете видеть, у меня есть две переменные: переменная с именем href
, которая имеет несколько ссылок как одну строку и переменную с именем text
, теперь в text
У меня есть ссылки, которые я уже посетил/загружен с. Я хочу, чтобы Python печатал текст, который присутствует в href
, но не в text
.Поиск текста, отсутствующего в строке
Итак, я предполагаю, что он использует цикл for?
Когда я запускаю одиночные буквы, они возвращаются, все разделяются на другую строку.
import requests
from bs4 import BeautifulSoup
url = 'amazon.com'
source_code = requests.get(url)
plain_text = source_code.text
soup = BeautifulSoup(plain_text, 'html.parser')
for link in soup.findAll('a', {'class': 'gridItem-trackInfo-title-anchor'}):
href = link.get('href')
file = open('file.txt', 'r')
text = file.read()
file.close
for i in href:
if i not in text:
print(i)
Что вы пробовали, и можете ли вы опубликовать более полный пример? SO не является службой записи кода, мы можем помочь вам устранить то, что вы сделали, но не писать код для вас. –
Можете ли вы привести пример 'href'? –
Я использовал Beautifulsoup для сбора всех ссылок определенного класса HTML, и я сохранил эти ссылки в href. –