Я работаю над некоторым кодом, который очищает страницу для двух классов css на странице. Я просто с помощью метода поиска Hpricot для этого, как так:Hpricot CSS Поиск по классам
webpage.search("body").search("div.first_class | div.second_class")
... для каждого элемента нашел я создать объект и поместить его в массив, это прекрасно работает за исключением одной вещи.
Поиск будет проходить через всю страницу html и добавлять объект в массив каждый раз, когда он встречается с «.first_class», а затем он снова просматривает документ в поисках «.second_class», в результате чего получается конечный массив содержащий все найденные элементы в неправильном порядке в массиве, то есть все объекты .first_class, за которыми следуют все объекты .second_class.
Есть ли способ, которым я могу заставить это искать документ за один раз и добавлять объект в массив каждый раз, когда он сталкивается с одним из указанных классов, предоставляя мне массив элементов, который находится в том порядке, в котором они находятся натолкнулся на страницу, которую я соскабливаю?
Любая помощь очень ценится. Благодаря