Я использовал StratifiedKFold из scikit-learn, но теперь мне нужно также посмотреть «группы». Есть хорошая функция GroupKFold, но мои данные очень зависят от времени. Точно так же, как и в справке, т.е. количество недель - это индекс группировки. Но каждую неделю нужно только в один раз.Scikit-learn, GroupKFold с перетасовкой групп?
Предположим, мне нужно 10 складок. Мне нужно сначала перетасовать данные, прежде чем я смогу использовать GroupKFold.
Перемешивание в групповом режиме - так что все группы должны перемещаться между собой.
Есть ли способ сделать это с помощью scikit-learn elegant как-то? Кажется, GroupKFold надежно перенести данные сначала.
Если нет способа сделать это с помощью scikit, может ли кто-нибудь написать эффективный код этого? У меня большие наборы данных.
матрица, этикетки, группы в качестве входов