Если вы пытаетесь полностью очистить страницы AngularJS, вам, скорее всего, понадобится что-то вроде того, что упоминал в комментариях @tadman (PhantomJS) - некоторый тип браузера без браузера, который полностью обрабатывает AngularJS JavaScript и после этого открывает DOM для проверки.
Если у вас есть определенный сайт или сайты, которые вы хотите очистить, путь наименьшего сопротивления, скорее всего, полностью исключает фронтмен AngularJS и напрямую запрашивает API, из которого Angular code тянет содержимое. Стандартный сценарий для большинства/большинства сайтов AngularJS заключается в том, что они вытаскивают статические JS и HTML-код/шаблоны, а затем они делают ajax-обратные вызовы на сервер (либо собственный, либо какой-то сторонний API), чтобы получить контент, который будет оказаны. Если вы посмотрите на их код, вы можете напрямую запросить любой угловой вызов (т. Е. Через $ http, ngResource или restangular). Возвращаемые данные, как правило, JSON и гораздо легче собирать по сравнению с истинным соскабливанием в результатах post-rendered html.
Вам может понадобиться использовать что-то вроде [PhantomJS] (http://phantomjs.org/), чтобы полностью отображать страницы с JavaScript на них. – tadman
Проблема заключается в том, что страница загружает контент динамически. Отключите JavaScript в своем браузере и нажмите на страницу, и вы увидите, что видит ваш код, поскольку ни код, ни браузер в этой точке не интерпретируют и не запускают JavaScript. У Nokogiri нет способа «открытия HTML», он анализирует только то, что ему дано. –