Я использую данные CSV реализовать мои сценарии и хотел попробовать эти данные в двух наборах данных:Python: как пробовать данные в наборах данных Test and Train?
- Test Data
- Поезд данных
я хочу попробовать наборы данных 85% и 15% и хотите вывести два файла CSV. Test.csv и Train.csv
Я хочу, чтобы это было сделано в базовом Python и вы не хотите использовать какой-либо другой внешний модуль, такой как Numpy, SciPy, Pandas или Scikitlearn , Может ли кто-нибудь помочь мне в случайной выборке данных в процентах. Более того, мне будут предоставлены наборы данных, которые могут иметь случайное число наблюдений. До сих пор я только что прочитал о Pandas и различных других модулях, чтобы пробовать данные по процентам и не получил никакого конкретного решения для моей проблемы.
Кроме того, я хочу сохранить заголовки CSV в обоих файлах. Поскольку заголовки будут делать каждую строку доступной и могут использоваться в дальнейшем анализе.
Ваше сообщение очень широкое. Подробно о том, что вы уже пробовали. Используйте вопросительный знак, чтобы уточнить, какой вопрос вы задаете. –
@MartinCowie Я только что изучил веб-поиск. Пока ничего не пробовал. Был поиск логики, и я хочу создать два файла из существующего файла. 'Test.csv' и' Train.csv' из masterfile 'data.csv', я хочу, чтобы 85% данных были в' test.csv' и оставались 15% -ными данными в 'train.csv' –