Как получить категориальные и непрерывные данные из файла CSV (например, Titanic dataset) и получить его в хорошем формате для Tensorflow без использования API tf.learn (т. Е. Чистого Tensorflow) ?Смешивание категориальных и непрерывных данных в чистом Tensorflow
Например,
- Категориальные данные могут быть (в моем случае) 'vehicle_make', 'vehicle_model'
- Непрерывные данные могут быть 'цена', 'пробег'
I затем захотите использовать эти данные в качестве входных данных для многослойной нейронной сети персептрона, как показано в следующем примере:
Приветствие,
Баз
Нужно ли масштабировать непрерывные значения в диапазоне от 0 до 1? Если да, как вы это рекомендуете? Приветствия. –
Нормализация входных данных - это почти всегда разумный шаг, просто убедитесь, что все данные нормализованы одинаково, и данные тестирования не «утечка» какой-либо информации в учебные комплекты e.t.c. – hamilyon