Для меня самое главное: «Имеет ли этот инструментарий алгоритм или функцию, которую я хочу попробовать?» Поскольку эти инструментальные средства предоставляют довольно разнообразный набор функций, вы должны сначала попытаться сузить то, что вы хотите сделать.
Так, например, если у вас есть желание попробовать различные алгоритмы эволюционной оптимизации, я бы пошел с чем-то вроде Shark.
С другой стороны, я предпочитаю dlib для большей части своей работы, но это не обязательно означает многого, поскольку я написал его :) Однако, если вас интересует двоичная классификация, позвольте мне предложить мой текущий любимый метод для этого, svm_c_ekm_trainer. Я часто использую это для обучения нелинейных SVM на наборах данных сотен тысяч точек. Обычно он запускается через несколько минут (или иногда даже секунд), в то время как для классического алгоритма SMO для этого потребуется несколько часов или дней.
Были также некоторые хорошие ответы на аналогичный вопрос, заданный не так давно: Which machine learning library to use.
Вы также можете быть заинтересованы в http://code.google.com/p/eureqa-api/, который выполняет поиск высокопроизводительных уравнений – Inverse
Зависит полностью от *, который * тип модели, которую вы хотите изучить. CRF? SVM? HMM? – bmargulies
Weka ** невероятно медленный **. –