У меня есть «CSV» текстовый файл, в котором каждое поле отделяется от \t&%$#
, который я сейчас пытаюсь импортировать в R.Импортировать файл "csv" с разделителем с несколькими символами в R?
В sep=
аргумент read.table()
instists на один символ. Есть ли быстрый способ напрямую импортировать этот файл?
Некоторые поля данных представляют собой текст, представленный пользователем, который содержит вкладки, кавычки и другие беспорядочные вещи, поэтому изменение разделителя на нечто более простое, похоже, может создать другие проблемы.
Хотите дать образец беспорядка? Моя мысль была бы, если бы это был один файл, возможно, стоит просто сделать find-replace в исходном файле. Если это действительно грязно, и это не сработает, попробуйте прочитать данные как неструктурированные (например, 'readLines'), а затем с помощью regexp на импортированных символьных строках, что позволит вам отдельно обрабатывать проблемные строки. – Thomas
Не самый лучший, но стоит попробовать: http://stackoverflow.com/questions/15539912/how-to-use-read-csv-or-read-table-to-read-comma-delimited-file-where-fields -have –