У меня есть база данных студентов определенной школы.Равное распределение меток в группе студентов
student_name |math | science| english| social
---------------------------------------------
Aakas | 80 | 70 | 90 | 55
Aphi | 30 | 80 | 67 | 79
Geeta | 60 | 89 | 95 | 87
pradip | 70 | 78 | 67 | 65
Nikita | 45 | 78 | 90 | 48
Shanti | 69 | 90 | 67 | 84
Студенты числа п это сказать 1000.
Что мне нужно сделать, это разделить студентов на группы «М» (например, м составляет 250). Таким образом, каждый субъект группы должен иметь почти средние оценки. Для вышесказанного средние оценки математики - 59 (для шести учащихся) для рассмотрения только математики. Если мы разделим шесть студентов на две группы, каждая из которых будет содержать 3 студентов. Группа 1 = {Aakas, Абхи, Гита} группа 2 = {Прадип, Никита, Шанти}
Группа 1 имеет в среднем 56.67 в математике, которая находится рядом с 59 2-й группы имеет в среднем 61.33 в математике, которая находится рядом с 59
В этом случае учитывается только математика. Мы должны рассмотреть для всех предметов такие, что каждая группа имеет средние оценки, близкие к среднему значению индивидуального предмета для всех студентов. Как его решить?
Пожалуйста, измените свой вопрос и предоставить образец данные и желаемые результаты. Не совсем понятно, что вы пытаетесь сделать. Например, вы просто пытаетесь поместить четыре столбца в квинтили? –
1. Нормализовать данные. – Strawberry