Я использую IPython
в Spark/Bluemix
средеpandas.read_csv в Спарк среде (IBM Bluemix)
У меня есть CSV-файл загружен в хранилище объекта, и я могу прочитать это нормально, используя sc.textfile
, но я получаю, когда я file does not exist
использовать pandas pd.read_csv
data = sc.textFile("swift://notebooks.books/rtenews.csv")
import pandas as pd
data = pd.read_csv('swift://notebooks.books/rtenews.csv')
IOError File swift://notebooks.books/rtenews.csv does not exist
Почему это? Как я могу прочитать файл csv в фреймворке pandas
?
Pandas reader поддерживает только локальные файловые системы. Зачем тебе это нужно? – zero323
Это относится к большому проекту курса аналитики данных и демонстрирует использование Spark/Bluemix и карты/сокращения. Несмотря на то, что файл запускается в локальной файловой системе - я должен обработать его в Spark/Ipython. – subiman
Просто пропустите Pandas и загрузите данные непосредственно в Spark: http://stackoverflow.com/q/28782940/1560062 – zero323