Я создаю некоторые предсказательные модели на Python и использую реализацию SVM в scikits learn. Это было действительно здорово, просто в использовании и относительно быстро.Самая быстрая реализация SVM, используемая в Python
К сожалению, я начинаю сдерживаться во время выполнения. Я запускаю SVB SVG на полный набор данных около 4 - 5000 с 650 функциями. Каждый прогон занимает около минуты. Но с 5-кратным перекрестным валидацией + сеткой (с использованием грубого мелкого поиска), это становится немного неосуществимым для моей задачи. Как правило, есть ли у людей какие-либо рекомендации в отношении самой быстрой реализации SVM, которую можно использовать в Python? Это или любые способы ускорить мое моделирование?
Я слышал о реализации графического адаптера LIBSVM, который кажется, что он может работать. Я не знаю каких-либо других реализаций SVM для GPU, используемых в Python, но он определенно был бы открыт для других. Кроме того, использование GPU значительно увеличивает время выполнения?
Я также слышал, что существуют способы аппроксимации SVM Rbf с использованием линейной карты функций SVM + в scikits. Не уверен, что люди думают об этом подходе. Опять же, любой, кто использует этот подход, является ли это значительным увеличением времени выполнения?
Все идеи для увеличения скорости программы приветствуются.
Спасибо ogrisel. Я посмотрю на это. Определенно выглядит интересно. Sklearn может экспортировать в формат svm light? Это определенно будет полезно. В ответ на ваш предыдущий ответ, к сожалению, я имею дело с таймингами, поэтому случайная выборка + плющение в поезд/тест становится довольно сложной. Не уверен, что подвыборка для моей модели будет такой простой. Благодаря! – tomas
Извините, скоро добавьте ogrisel, знаете ли вы, какая функция утилиты в sklearn может экспортировать в формате SVM? – tomas
Действительно, он отсутствует в документе, но он есть: https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/datasets/svmlight_format.py#L142 – ogrisel