У меня есть 2 класса, A и B. Каждый класс имеет несбалансированное количество выборок друг к другу, скажем, от 500 до класса A и от 1000 до класса B.извлечение равного количества выборок для каждого класса в сценарии несбалансированных выборок
Есть ли способ извлечь сбалансированное количество выборок для каждого класса, скажем 300 для классов A и B, используя scikit learn или любую из функций Numpy.
Образцы первые 5 столбцов и этикетки/классов является последней колонке
1 2 3 4 5 1
2 3 4 2 3 1
4 0 5 4 3 1
4 5 9 2 4 2
5 9 5 3 9 2
То, что я хотел бы сделать, это иметь равное количество обоих классов в мой последний выбор:
2 3 4 2 3 1
4 0 5 4 3 1
4 5 9 2 4 2
5 9 5 3 9 2
Что такое класс? можете ли вы разместить образец данных (3-5 строк) для каждого класса и требуемых наборов данных? – MaxU