Я использую набор данных, чтобы сделать некоторые предсказания с использованием методов с переменной переменной регрессии. Я должен предсказать заработную плату сотрудников на основе некоторых независимых переменных, таких как пол, процент, дата рождения, оценки по различным предметам, степень, специализация и т. Д.Как нормализовать набор данных для линейной/множественной регрессии в python
Числовые параметры (например, метки и процент по разным предметам) тонкий для использования с регрессионной моделью. Но как мы нормализуем нечисловые параметры (пол, дата рождения, степень, специализация) здесь?
P.S. : Я использую пакет scikit-learn : machine learning in python.