Я пытаюсь построить модель классификации чувств с R и H2O. У меня есть файл данных с форматом:Word2Vec Sentiment Classification с R и H2O
+-----------+------------------------------------------------------+
| Sentiment | Text |
+-----------+------------------------------------------------------+
| 1 | This is a sample text. This is another sentence. |
+-----------+------------------------------------------------------+
| 0 | Another sentence. And another! |
+-----------+------------------------------------------------------+
| -1 | Text text and Text! Text everywhere! So much text... |
+-----------+------------------------------------------------------+
Таким образом, настроения дорожит 1, 0 и -1 и текст в каждой строке может состоять из нескольких предложений. Я знаю, что хочу подготовить набор данных, чтобы использовать его с функцией deeplearning h2o. Поэтому я хотел использовать пакет tmcn.word2vec R. Но я не могу преобразовать его по-разному с этим пакетом. Я мог бы просто получить весь текстовый столбец и преобразовать его в документ word2vec, но тогда моя информация о настроении будет потеряна.
Есть ли другой способ перевести текст в числовой ввод для функции deeplearning в R? Специально для H2O?
С наилучшими пожеланиями
Вот недавний пример использования word2vec в h2o: https://github.com/h2oai/h2o-3/blob/master/h2o-r/demos/rdemo.word2vec.craigslistjobtitles.R – redmode