У меня есть набор данных для классификации текста, готовый для использования в MATLAB. Каждый документ является вектором в этом наборе данных, и размерность этого вектора чрезвычайно высока. В этих случаях люди обычно выполняют некоторые функции на векторах, таких как те, которые вы на самом деле находите инструментарий WEKA. Есть ли что-то подобное в MATLAB? если не могу предложить и алгоритм для меня сделать это ...? thanksВыбор функции в MATLAB
ответ
MATLAB (и его Инструментарии) включают в себя ряд функций, которые имеют дело с выбором функции:
- RANDFEATURES (Биоинформатика Toolbox): Генерировать рандомизированное подмножество функций, направленных классификатором
- RANKFEATURES (Bioinformatics Toolbox): характеристики ранжирования по критериям разделения классов
- SEQUENTIALFS (Statistics Toolbox): Последовательный выбор функция
- RELIEFF (Statistics Toolbox): Облегчение-F алгоритм
- TREEBAGGER.OOBPermutedVarDeltaError, predictorImportance (Statistics Toolbox): Использование ансамблевых методов (в мешки деревьев решений)
Вы также можете найти примеры, которые демонстрируют использование реальных наборов данных:
- Identifying Significant Features and Classifying Protein Profiles
- Genetic Algorithm Search for Features in Mass Spectrometry Data
Кроме того, существуют сторонние инструментарии:
В противном случае, вы всегда можете позвонить ваши любимые функции от WEKA непосредственно из MATLAB, поскольку он включает JVM ...
Выбор функции зависит от конкретной задачи, которую вы хотите выполнять с текстовыми данными.
Одним из самых простых и грубых способов является использование анализа основных компонентов (PCA) для уменьшения размеров данных. Эти уменьшенные данные измерений могут использоваться непосредственно как функции для классификации.
Обратитесь к руководству по использованию PCA здесь:
http://matlabdatamining.blogspot.com/2010/02/principal-components-analysis.html
Вот ссылка на командной помощью Matlab PCA:
http://www.mathworks.com/help/toolbox/stats/princomp.html
Используя полученные функции, хорошо известная поддержка Вектор Машины (SVM) могут использоваться для классификации.
http://www.mathworks.com/help/toolbox/bioinfo/ref/svmclassify.html http://www.autonlab.org/tutorials/svm.html
Вы могли бы рассмотреть вопрос об использовании техники независимых особенностей Вайс и Kulikowski быстро устранить переменные, которые, очевидно, unimformative:
http://matlabdatamining.blogspot.com/2006/12/feature-selection-phase-1-eliminate.html
- 1. Простой последовательный выбор функции в Matlab
- 2. Выбор точек из функции контура Matlab
- 3. Выбор изолиний из контурной функции Matlab
- 4. Выбор метода выбора в MATLAB?
- 5. Выбор функции по энтропии и информации Усиление в Matlab
- 6. Быстрый выбор кода в MATLAB
- 7. Выбор требуемых строк в matlab
- 8. Выбор региона GPS в Matlab
- 9. Выбор подходящих данных Matlab
- 10. выбор переключателей в функции
- 11. Выбор функции
- 12. Выбор функции
- 13. Функции ручки в MATLAB
- 14. Обновление функции в MATLAB
- 15. перебрать функции в MATLAB
- 16. функции в MATLAB
- 17. Суммирующие функции в matlab
- 18. Специальные функции в Matlab
- 19. Функции анонимуса в matlab
- 20. Создать функции в matlab
- 21. Функции в matlab
- 22. Замедление функции в matlab
- 23. Минимизация функции в Matlab
- 24. Функции перегрузки в MATLAB
- 25. Определение функции в MATLAB
- 26. Построение функции в Matlab
- 27. Функции потерь в MATLAB
- 28. Функции отладки в matlab
- 29. Функции MATLAB в C++
- 30. Участок функции в Matlab
Дубликат http://stackoverflow.com/questions/3047940/feature-selection -методы-в-MATLAB? Но у этого, кажется, есть более приемлемый ответ. –