Итак, я искал способ импортировать данные GTFS в SQLdb для моего приложения. Я нашел решение на GitHub.Почему данные GTFS содержат «невидимые» разрывы строк?
Но это написано с использованием python. Я не думаю, что могу использовать это прямо в моем приложении Windows. Пожалуйста, поправьте меня, если я ошибаюсь.
Но у меня нет проблем с пониманием логики решения и создания собственного «парсера».
Итак, я открыл файл данных GTFS «calendar date.txt» в «Блокноте» и нашел его содержимое запутанным. Это было так:
service_id,date,exception_type1,20151012,11,20151111,12,20150822,12,20150829,12.....
Вы можете видеть, что это сбивает с толку, когда нет разрывов строк. Но я вставить код здесь, чтобы показать вам, ребята, и он автоматически форматирует до:
service_id,date,exception_type
1,20151012,1
1,20151111,1
2,20150822,1
2,20150829,1
2
Теперь ясно имеет смысл !! (Есть пробелы между синтаксическими разборами).
Но я не понимаю. Является ли блокнот неправильным? Как я могу видеть данные «правильно», затем, чтобы написать собственный парсер?
Хорошо, я попытался использовать Notepad ++ https://notepad-plus-plus.org/, и он правильно показывает правильные разрывы строк. Теперь мой вопрос заключается в том, существует ли фактический символ «разрыва строки» между строками или какие-либо продвинутые синтаксические анализаторы CSV каким-то образом «обнаруживают/вставляют» их? – Barry66