Когда я пытаюсь сгруппировать свою фреймворк в столбце, попробуйте найти минимум для каждой группы groupbyDatafram.min('timestampCol')
, похоже, я не могу сделать это на не числовых столбцах. Затем, как я могу правильно фильтровать минимальную (самую раннюю) дату в группе?Найти минимальную отметку по временной шкале через Spark groupBy dataframe
Я передаю данные из экземпляра postgresql S3, так что данные уже настроены.
спасибо, но я получаю ошибку: не найден: значение мин. –
Попробуйте: 'import org.apache.spark.sql.functions._' –
Спасибо, очень быстро извините, это другой вопрос, но я получаю org.apache.spark.sql.DataFrame = [MIN (ts): timestamp], Я думал, что предположим, что добавить MIN MIN (ts) к объекту groupBy не просто вернуть единственный столбец в качестве DataFrame. мне нужно каким-то образом присоединиться к этому объекту groupBy? –