2013-10-28 5 views
0

Я пытаюсь запустить работу SVD в mahout. У меня есть матрица (например, A), созданная (Document x term) размером 372053 x 21338 (21338 нет уникальных слов, например N, 372053 документов M). Таким образом, моя матрица A имеет размер (M * N). Я запустил svd, используя mahout, и я получил очищенные собственные векторы (я дал ожидаемый ранг, как говорят 200 R). Теперь у меня есть собственная векторная матрица, созданная размером R * N.Интерпретация вывода SVD в mahout

Заявляющ уравнение SVD

А = U * S * V '(V' существо транспонированная V)

нужно преобразовать матрицу А в новом пространстве, чтобы получить сжатый векторы документов (я пытаюсь реализовать LSI)

Каков вывод, который я получаю от mahout SVD? (Я хотел бы знать в терминах уравнения выше). Я читал mailing list, что мы можем получить собственные значения из NamedVectors в матрице собственных векторов.

Просьба указать, как здесь исходить, чтобы сгенерировать матрицу A в новом пространстве (размером M * R).

Любая помощь высоко ценится :)

ответ

0

Хорошая отправная точка для БИС с стохастической СВД на Mahout можно найти here. . Хорошая часть состоит в том, что в документе описывается также свертывание в процессе и явное выражение в формате вывода в терминах уравнения svd.

Работа интегрирована в последней версии 0.8 и может быть использована с SSVDCli работы или через погонщик CLI с mahout ssvd <options>

Смежные вопросы