2015-02-24 4 views
-2

Я пытаюсь запустить тестовую программу Java, используя библиотеку MLlib от Apache-Spark.Содержимое библиотеки Apache-Spark

Я загрузил последнюю версию Spark со своего сайта и последовал за книгой O'reilly «Изучение искры, Lightning-Fast Big Data Analysis», чтобы найти полезные примеры и советы, но когда дело доходит до импорта правильных библиотек, они (и другие учебники, которые я нашел в Google) используют классы, которые не включены в папку Spark, которую я загрузил.

Вот пример:

Большинство учебников импорта org.apache.spark.mllib.regression.LabeledPoint, который не существует в моем случае. У меня есть только:

  • JavaLassoSuite
  • JavaLinearRegressionSuite
  • JavaRidgeRegressionSuite

У меня такая же проблема с любыми другими файлами, как предполагается, будут включены в библиотеку. Я попытался загрузить более старые версии, но он все тот же, даже с файлами, которые напрямую не связаны с файлами MLlib (org.apache.spark.SparkConf и org.apache.spark.api.java. *)

Я пропустил шаг, или кто-нибудь знает об этом?

Спасибо!

EDIT

Импорт нужен для первого примера книги:

import org.apache.spark.mllib.classification.LogisticRegressionModel; 
import org.apache.spark.mllib.classification.LogisticRegressionWithSGD; 
import org.apache.spark.mllib.feature.HashingTF; 
import org.apache.spark.mllib.linalg.Vector; 
import org.apache.spark.mllib.regression.LabeledPoint; 

я скачал из this link:

Спарк выпуска: Тип 1.2.1

Пакет: Исходный код

Скачать Тип: Прямая Скачать

(Это мой первый пост на переполнение стека, так что не стесняйтесь сказать мне, если я делаю это неправильно)

+0

Не могли бы вы добавить образец короткого кода с необходимым импортом и ссылку на пакет искры, который вы загрузили? – fxm

+0

Я добавил их в главный пост для лучшего форматирования текста. – Chryor

+0

Спасибо, я посмотрю и скажу, смогу ли я воспроизвести вашу проблему! Что касается вашего сообщения, вы можете немного его осветить (много слов прямо сейчас :)), указав сообщение об ошибке, которое вы получаете, если оно есть, и опубликуйте [MCVE] (http://stackoverflow.com/help/mcve). – fxm

ответ

1

Для того, чтобы получить банку вы хотите, вы необходимо скомпилировать исходные файлы, загруженные с помощью maven (Если вы не знакомы с этим инструментом, я советую вам загрузить предварительно построенную версию).

После того, как вы построили, вы найдете банку, которую вы хотите, в yourSparkFolder/spark-1.2.1/mllib/target.

Обратите внимание, что это разрешит эту проблему. Spark mlibs имеет различные зависимости, перечисленные here. Personnaly, мне это удалось, используя maven в моем искровом проекте (вы можете найти необходимые зависимости here).

+0

Все было, спасибо! – Chryor

3

Возможно, это поможет!

<dependency> 
    <groupId>org.apache.spark</groupId> 
    <artifactId>spark-mllib_2.10</artifactId> 
    <version>1.3.0</version> 
</dependency> 
Смежные вопросы