Я пытаюсь читать из базы данных DB2 на основе запроса. Результирующий набор запроса составляет около 20-40 миллионов записей. Раздел DF выполняется на основе столбца, который является целым числом.Необходимо знать детали раздела в Dataframe Spark
Мой вопрос в том, что после загрузки данных, как я могу проверить, сколько записей было создано для каждого раздела. В основном, что я хочу проверить, происходит ли перекос данных или нет? Как проверить количество записей на один раздел?