Я пытаюсь загрузить файл CSV со следующим URL в dataframe с использованием Python 3.5 и панды:с помощью панда для загрузки/загрузок архивного файла CSV из URL
link = "http://api.worldbank.org/v2/en/indicator/NY.GDP.MKTP.CD?downloadformat=csv"
CSV-файл (API_NY.GDP. MKTP.CD_DS2_en_csv_v2.csv) находится внутри zip-файла. Моя попытка:
import urllib.request
urllib.request.urlretrieve(link, "GDP.zip")
import zipfile
compressed_file = zipfile.ZipFile('GDP.zip')
csv_file = compressed_file.open('API_NY.GDP.MKTP.CD_DS2_en_csv_v2.csv')
GDP = pd.read_csv(csv_file)
Но при чтении его, я получил сообщение об ошибке "pandas.io.common.CParserError:. Данные tokenizing ошибки Ошибки C: Ожидаемая 3 поля в строке 5, увидела 62".
Любая идея?
Я опустил этот аргумент для упрощения. Я пробовал это раньше, но я получил эту ошибку: «pandas.io.common.EmptyDataError: Нет столбцов для разбора из файла». Кстати, я использую Mac OS Sierra и PyCharm Community Edition 2016.3. Любая идея о том, почему она не загружает данные? –
Хммм, может быть, проблема с загрузкой или распаковкой, протестируйте ее с помощью 'print csv_file.readlines() [: 3]' – jezrael
Я получил этот @jezrael: '[b '\ xef \ xbb \ xbf" Источник данных "," Мировое развитие Индикаторы ", \ r \ n ', b' \ r \ n ', b'" Последнее обновление Дата "," 2016-12-16 ", \ r \ n ']'. Любая подсказка? –