Моя цель - использовать Regex для извлечения из документа HTML значения тега с определенным именем. Соответствующая часть кода:Regex для извлечения значения определенного значения <input> tag
<!-- hidden datas -->
<p class="hidden">
<input type="hidden" name="token" value="6ac2c9b7d56b483ad6b9db051a285637" />
<input type="hidden" name="id_product" value="541" id="product_page_product_id" />
<input type="hidden" name="add" value="1" />
<input type="hidden" name="id_product_attribute" id="idCombination" value="" />
</p>
Мне нужно извлечь символьного символы 6ac2c9b7d56b483ad6b9db051a285637 К сожалению, нет другого пути, чем через Regex.
Тот же токен также присутствует в другой части документа. Может быть, легче извлечь из этого блока кода?
<script type="text/javascript" src="/webshop/js/tools.js"></script>
<script type="text/javascript">
var baseDir = '/webshop/';
var static_token = '6ac2c9b7d56b483ad6b9db051a285637';
var token = '1799f145490151b92137df1493a520cc';
var priceDisplayPrecision = 2;
</script>
вы можете использовать 'jsoup' (http://jsoup.org/cookbook/extracting-data/attributes-text-html) –