Мне нужна идея, чтобы решить мою проблему в python, чтобы разделить файл.Python Разделить данные на несколько файлов с правилом
I более 1.000.000 строк в файле с двумя столбцами: «accountid» и «property». Один «accountid» может иметь несколько свойств, но каждое свойство является одной строкой. Выглядит примерно так: Example
Мне нужно разбить эти данные на 50 000 строк на файл (что не является проблемой). Тем не менее, я один файл также допускает только 50 «свойств» на «учетную запись». И много имеют более 50 объектов.
У вас есть идея как технически решить эту проблему? Я не требую какого-либо кода;)
Благодаря
Flo
Итак, если элемент с accountid = 1 имеет 130 000 свойств (т. Е. Отображается в 130 000 строк), вы хотите, чтобы это было 3 отдельных файла (первые два файла будут содержать 50 000 строк с accountid = 1, а третий файл будет есть 30 000 оставшихся строк, а также 20 000 строк других предметов)? – shahins
Да, но расщепление само по себе не является проблемой. Это усложняется, потому что каждому файлу разрешено иметь только 50 свойств на один идентификатор. У меня уже есть сложный идентификатор, чтобы решить эту проблему. Как и разбиение сначала на 40.000 партий и разделение, а затем запуск второго скрипта, который перемещает идентификаторы с более чем 50 свойствами в другие файлы. –