Когда пользователь загружает таблицу с заголовками, я разбираю ее в JSON. Затем мне нужно сопоставить свои поля с полями в моей базе данных. Например, если они загрузили поле fname
и lname
, я бы узнал их и объединил в поле full name
в моей базе данных.Данные, введенные пользователем, соответствуют их полям полям в моей базе данных
Моя идея - написать шаблоны, основанные на регулярном выражении, имени столбца и позиции столбца. Например, Last Name
имеет название заголовка, которое, вероятно, начинается с «Last» или, по крайней мере, «L». Значения, вероятно, имеют шаблон регулярного выражения [a-zA-Z]{2,20}
, а значения предыдущего столбца (предположительно имя), вероятно, следует за одним и тем же шаблоном регулярного выражения. Я сохраню свой шаблон регулярного выражения & сканирует образец записей, чтобы исключить крайние случаи, такие как «Jo Ann O'hoolihan».
Подходит ли этот подход разумно? Кто-нибудь уже создал что-то подобное? Конечно, я попрошу, чтобы пользователь подтвердил, что алгоритм правильно догадался, но мне кажется странным, как мало информации, которую я обнаружил при поиске по шаблону. Любые идеи, комментарии или источники приветствуются!