Мне интересны исторические данные LendingClub, который является крупнейшей компанией по кредитованию P2P.Как загрузить нестандартизированный CSB-файл и его предварительную обработку
Это нестандартизированный CSB-файл, но его можно легко исправить при открытии в Excel путем удаления 1-й, 39789-39791-й и 42543-42544-й строк, как я могу сделать это в R автоматически? (Если вы хотели бы помочь, но боюсь, это может быть вредоносная ссылка, пожалуйста нагуглить эту компанию первой)
Я попытался следующие:
data <- read.csv(url("https://resources.lendingclub.com/LoanStats3a.csv.zip"))
но он бросает ошибку:
Error in read.table(file = file, header = header, sep = sep, quote = quote, :
duplicate 'row.names' are not allowed
Вы должны четко указать, какие шаги вы хотите выполнить перед импортом? Какие «несколько строк» вы удаляете? Кроме того, вероятно, не стоит предполагать, что другие готовы загрузить (потенциально вредоносный) zip-файл, чтобы помочь вам. Осторожно описывайте содержимое файла здесь в вопросе. – MrFlick
@MrFlick, Хороший совет, он был отредактирован. – user3684014
Ну, это не злой, но кто когда-либо создавал этот файл csv, должен быть запущен. Это ужасно. –