2

Я искал что-то, что помогло мне разобрать общие мета-теги с сайтов, похожих на this github project I found for open graph data. Вот demo app.meta tag parsing in Rails

В принципе, я хотел бы, чтобы пользователь вводил URL-адрес с новостного сайта и извлекал из него заголовок, описание и т. Д., Оставляя для пользователя как можно меньшую работу. Прежде чем я начну ругать свои собственные, мне было интересно, существует ли текущий проект/драгоценный камень, который существует аналогично проекту выше? (поскольку он работает только с открытым графиком, а не с общими мета-тегами)

Я также заметил, что facebook's linter делает это, даже без открытых графических тегов.

ответ

2

Я бы порекомендовал Nokogiri gem. Это синтаксический анализатор HTML, XML и т. Д., Поэтому вы можете использовать его для самостоятельного анализа страниц. Самое приятное в этом подходе заключается в том, что он предоставляет вам максимальную гибкость для вашего конкретного случая использования. Вы можете использовать драгоценный камень для анализа любых мета и тегов заголовков, пока вы можете их выражать с помощью селекторов XPath или CSS3.

+0

да, я знаком с nokogiri и Hpricot, и т.д., я был больше заинтересован в более индивидуальное решение, как я Не уверен, что все сайты, получающие царапины, будут использовать точные метатеги для тех же полей. – holden