0
Im пытается вытащить только ключевые слова из вывода XML, как показано на:Извлечение данных из XML-страницы в .txt
http://clients1.google.com/complete/search?hl=en&output=toolbar&q=test+a
Я попытался положить вместе ниже, но я, кажется, не получают любые ошибки или любой выход. Есть идеи?
import urllib2 as ur
import re
f = ur.urlopen(u'http://clients1.google.com/complete/search?hl=en&output=toolbar&q=test+a')
res = f.readlines()
for d in res:
data = re.findall('<CompleteSuggestion><\/CompleteSuggestion>',d)
for i in data:
print i
file = open("keywords.txt", "a")
file.write(i + '\n')
file.close()
Я пытаюсь,
- Извлекает XML из URL данного
- список Магазин ключевых слов из файла XML, анализируется с помощью регулярных выражений
Спасибо,
ли вы проверить, что регулярное выражение в FindAll работает правильно (путем установки некоторой константы содержания в «D»)?<\/CompleteSuggestion>') –
Также. попробуйте добавить r перед строкой регулярного выражения, например r '
Эй, Барух, я не так хорош в Regex. Я предполагаю, что я сделал что-то неправильно в самом регулярном выражении. – BubblewrapBeast
Вы должны использовать одну из многочисленных библиотек XML, входящих в стандартную библиотеку Python. – Iguananaut