Это возможно в каскадном режиме. Предположим, что ваши имена полей (url, count). Применить функцию, чтобы добавить еще одно поле с именем «домен», которое содержит значение google, если строка содержит слово google и отбросить поле url. Теперь, если вам не нужны другие домены, отфильтруйте их. Так что теперь у вас есть два поля (домены, количество), где домен содержит только слово Google
Теперь используйте AggregateBy(), SumBy() функцию каскадирования.
SumBy any_name = new SumBy (field_name_to_sum, field_name_after_sum, dataType class);
результат Труба = новый AggregateBy ("название", Pipe.pipes (sourcePipeName), name_of_groupBy_field, number_of_SumBy_instances, name_of_sumBy_instance);
в вашем случае это становится
SumBy А = новый SumBy (новые поля ("рассчитывать"), новые поля ("combined_count"), Integer.class);
Результаты по трубопроводу = новый агрегатБы («результат», труба.pipe (sourcePipeName), новые поля («домен»), 1, xyz);
Так что теперь в результате труба содержит одну строку (Google, граф)
Таким образом, выше фрагмент кода будет работать похож на SQL Query ниже.
выбрать домен, сумму (количество) из группы источников по домену;