2015-06-02 2 views
1

Я использую scrapy для сбора некоторых данных, и когда я пытаюсь очистить элемент тега от craiglist, он возвращает шрифт, отличный от других элементов. Как заставить шрифт в левом столбце выглядеть шрифтом в правой? Вот картинка и код я использую:Scrapy возвращает неправильный шрифт

item["tag"] = " ".join(response.xpath("//p[@class='attrgroup']/span/b/text()").extract()[0]) 

How can i make font in the left column look like font in the right one?

+0

Не могли бы вы скопировать и вставить фактический текст в столбце A, а не скриншоты? – teambob

+0

Уверен, что вы идете: 2 0 1 3 D o d g e o d o m e t e r: 4 7 0 0 0 –

+2

Вы используете '." .join', который добавляет пробел между всеми элементами в итерабельном. –

ответ

0

Попробуйте использовать response.xpath("string(//p[@class='attrgroup'])") вместо этого.

+0

Я пробовал, и результат такой же –

0

Кажется, что есть пространство между каждой из букв:

[email protected]:~/code/analytics/src$ echo -n '2 0 1 3 D o d g e o d o m e t e r : 4 7 0 0 0'|hexdump -C 
00000000 32 20 30 20 31 20 33 20 44 20 6f 20 64 20 67 20 |2 0 1 3 D o d g | 
00000010 65 20 6f 20 64 20 6f 20 6d 20 65 20 74 20 65 20 |e o d o m e t e | 
00000020 72 20 3a 20 34 20 37 20 30 20 30 20 30   |r : 4 7 0 0 0| 

Вы можете использовать следующий, чтобы извлечь каждый второй символ, но там, кажется, более глубокая проблема:

response[0::2] 

Не могли бы вы разместить URL-адрес точной страницы, которую используете?

Смежные вопросы