2010-07-02 2 views
40

Weka, вероятно, является самой популярной библиотекой обучения машин общего назначения. Но это может быть довольно медленным в моем опыте.Самая быстрая общая библиотека обучения машин?

Я смотрел на Shark, Waffles, dlib, Plearn и MLC++ в качестве альтернативы. Из них акула и dlib выглядят наиболее перспективными.

Есть ли у кого-нибудь опыт в тестировании производительности этих библиотек?

+0

Вы также можете быть заинтересованы в http://code.google.com/p/eureqa-api/, который выполняет поиск высокопроизводительных уравнений – Inverse

+0

Зависит полностью от *, который * тип модели, которую вы хотите изучить. CRF? SVM? HMM? – bmargulies

+4

Weka ** невероятно медленный **. –

ответ

39

Для меня самое главное: «Имеет ли этот инструментарий алгоритм или функцию, которую я хочу попробовать?» Поскольку эти инструментальные средства предоставляют довольно разнообразный набор функций, вы должны сначала попытаться сузить то, что вы хотите сделать.

Так, например, если у вас есть желание попробовать различные алгоритмы эволюционной оптимизации, я бы пошел с чем-то вроде Shark.

С другой стороны, я предпочитаю dlib для большей части своей работы, но это не обязательно означает многого, поскольку я написал его :) Однако, если вас интересует двоичная классификация, позвольте мне предложить мой текущий любимый метод для этого, svm_c_ekm_trainer. Я часто использую это для обучения нелинейных SVM на наборах данных сотен тысяч точек. Обычно он запускается через несколько минут (или иногда даже секунд), в то время как для классического алгоритма SMO для этого потребуется несколько часов или дней.

Были также некоторые хорошие ответы на аналогичный вопрос, заданный не так давно: Which machine learning library to use.

+1

Спасибо Дэвис! Отличная работа с dlib! Я действительно просто ищу, чтобы найти что-то, что имеет много функциональности, чтобы я мог использовать это большую часть времени, но при необходимости разветвлялся бы на другие вещи. – griffin