Будучи спортивным ботаником, которым я являюсь, я ищу ежедневные XML-файлы, которые создаются на веб-сайте Бейсбола Высшей лиги, и импортировать их в базу данных Access или MySQL. Проблема, с которой я сталкиваюсь, заключается в том, что почти каждый созданный ими XML-файл немного отличается от последнего. Например, один файл игры может иметь поле с именем batter23
, которое находится рядом с event22
, а другой файл вызывает его batter24
и находится рядом с pitcher25
. Я знаю, что файлы XML могут быть непоследовательными, но я знаю, что должен быть способ последовательно получать данные в базу данных. Нужно ли стандартизировать эти XML-файлы? Некоторый код, который будет анализировать каждый файл в списке и организовывать их в определенный стиль и давать им согласованные имена полей? В настоящее время я сначала импортирую XML-файл в лист Excel, где я меняю тип файла на CSV, но отсюда имена полей и расположения столбцов по-прежнему отличаются от файлов к файлу.Импорт данных XML в базу данных
Моя цель состоит в том, чтобы иметь все файлы в структуре, где я могу быстро импортировать их в базу данных каждый день без необходимости вручную изменять местоположение столбцов или имена полей. Я открыт для всех и всех вариантов, но мой опыт работы на большинстве языков в лучшем случае - уровень новичков, поэтому простите меня за недостаток знаний.
Образец вашего XML будет необходим, чтобы дать хороший ответ. В противном случае это ответ на основе мнения, который потенциально оффтопик для StackOverflow. Я бы предложил посмотреть 'perl' и' XML :: Twig' как хорошие опции для синтаксического анализа XML. (И если вы можете дать образец XML и желаемый результат, я могу сбить вас с примера). – Sobrique