Мне нужно регулярное выражение, которое вернет мне текст, содержащийся между двойными кавычками, который начинается с указанного текстового блока, и заканчивается конкретным расширением файла (например .txt). Я использую urllib2 для получения html страницы (html довольно прост).Python найти ссылку на скачивание файла на веб-странице
В принципе, если у меня есть что-то вроде
<tr>
<td valign="top"><img src="/icons/unknown.gif" alt="[ ]"></td>
<td><a href="Client-8.txt">new_Client-8.txt</a></td>
<td align="right">27-Jun-2012 18:02 </td>
</tr>
Он должен просто вернуться ко мне
Client-8.txt
Если возвращенное значение содержится в двойных кавычках. Я знаю, как имя файла начинается с «Client-» и расширение файла «.txt».
Я играю с r.search (regex, string), где вводимая строка является html страницы. Но я воняю регулярные выражения.
Спасибо!
время связать мой любимый ответ на SO снова: http://stackoverflow.com/a/1732454/10077 –
Ну, что положить конец. Теперь о чем-то совершенно другом! Благодаря! – ZacAttack