2016-08-30 3 views
2

Код написан на zeppelin, его рабочий и импортирующий штраф в оболочке, когда я запускаю pyspark, но не в zeppelin с тем же кодом.zeppelin не может импортировать pandas, numpy, scipy

%pyspark 
import pandas 

Traceback (most recent call last): 
    File "/tmp/zeppelin_pyspark-4245945050627073162.py", line 239, in <module> 
    eval(compiledCode) 
    File "<string>", line 1, in <module> 
ImportError: No module named pandas 

ответ

1

Это потому, что панды не установлены на машине.

Если пип не установлен, сначала установите пробку.

sudo curl --silent --show-error https://bootstrap.pypa.io/get-pip.py | python 

Затем установите панд

sudo pip install pandas 

Или используйте [докер], как это.

docker run -d -p 8080:8080 -t knockdata/zeppelin-highcharts 

zeppelin-highcharts изображения включают в себя панда и функциональность Highcharts.

+0

как я упомянул о его рабочем состоянии, когда я импортирую с помощью PySpark. Итак, если панды не установлены в машине, то как она работает с Pyspark? –

+1

Возможно, он не использует один и тот же питон. проверьте 'sys.path', если это то же самое. Попробуйте настроить его в zeppelin.pyspark.python' в Zeppelin с тем же, что и в pyspark –

Смежные вопросы