У меня есть этот HTML-код, который находится на одной линии:Проблема с Руби Regular Expression
<h3 class='r'><a href="www.google.com">fkdsafjldsajl</a></h3><h3 class='r'><a href="www.google.com">fkdsafjldsajl</a></h3>
Вот строка для печати (что я не могу использовать)
<h3 class='r'><a href="www.google.com">fkdsafjldsajl</a></h3>
<h3 class='r'><a href="www.google.com">fkdsafjldsajl</a></h3>
И я пытаюсь извлечь только URL-адреса, с этим REGEX
/<h3 class="r"><a href="(.*)">(.*)<\/a>/
И это возвращает
www.google.com">fkdsafjldsajl</a></h3><h3 class='r'><a href="www.google.com"
Что я могу сделать, чтобы остановить его, когда вы найдете "?
Будьте осторожны, пытаясь разобрать HTML с помощью регулярного выражения. Даже в простом HTML вы можете запустить URL-адрес, который испортил ваше регулярное выражение. –