Я импортирую CSV, который имеет 3 столбца, один из этих столбцов может иметь дубликаты записей.Поиск дубликатов значений столбцов в CSV
У меня есть 2 вещи, чтобы проверить:
1. The field 'NAME' is not null and is a string
2. The field 'ID' is unique
До сих пор я разбор файл CSV, один раз и проверяя, что 1. (NAME is valid)
, что если это не удается, он просто ломает из цикла в то время и останавливается ,
Я думаю, вопрос в том, как я проверил бы, что ID
уникален?
У меня есть такие поля, как следующее:
NAME, ID,
Bob, 1,
Tom, 2,
James, 1,
Terry, 3,
Joe, 4,
Это будет выводить что-то вроде `Дублированный ID в строке 3'
Благодаря
PS это CSV файл имеет несколько столбцов и может иметь вокруг 100 000 записей. Я упростил его по определенной причине для решения Дубликат колонке/Поле
Благодаря
Вы вставляете в db? – user1844933
Как насчет нажатия каждого значения в массиве и проверки в каждой строке, что значение «ID» отсутствует в этом массиве?Тогда, если это так, просто ошибка «echo» в строке xxx »;' – Jerska
Если вы проверите это на сайте кодирования, это может привести к проблемам с производительностью. Я думаю, лучший способ - проверить уровень ввода данных и построить CSV-состояние. Если вы не заботитесь о проблемах с производительностью, вы можете проверить, что ваш идентификатор уже существует или нет в вашем db или месте хранения на стороне программы. –