Я пытаюсь разобрать html-файл для 3-х частей информации (Страна, длинный и лат). Я могу найти правильную линию, но ее расщепление - это боль. Я могу сделать это, если информация не изменится или останется одним миром, но это не так. Вот мой кодРазбиение строки html для получения результата
import urllib2
req = urllib2.Request('http://www.geoiptool.com/en/?IP=81.55.99.47')
response = urllib2.urlopen(req)
the_page = response.readlines()
Это возвращает страницу HTML, я буду замена жёстко «IP = 81.55.99.47» с файлом IP позже, поэтому страна может изменить
Вот код, с которого я начал работать, но он не работает, если IP, скажем, на основе Соединенных Штатов.
country = the_page[173]
lineof_country=country.split()
result=lineof_country[5]
con=result.split('<')
print con[0]
Вот пример строки 173, что не будет работать:
<td align="left" class="arial_bold"><a href="http://en.wikipedia.org/wiki/united states" target="_blank"> United States</a> <img src='/flags/us.gif' alt="united states" align="absmiddle" ></td>
Заранее спасибо
@PruthviRaj, будьте осторожны с вашими изменениями ... Я просмотрел большое количество из них сегодня, и это кажется мне *, как будто вы просто пытаетесь заработать с ними какую-то репутацию, а не на самом деле * пытаетесь помогать. Добавление тега 'Python-2' к вопросу, уже отмеченному' Python', и тот, который делает * не * упоминает 'Python-2' в любом месте, несколько сомнительно. Помните, что модераторы могут видеть * все * ваших изменений. – Sheridan
@Sheridan Так я не помогаю? –
Нет, нет. – Sheridan