2016-04-06 2 views

ответ

0

Я бы предположил, что текстовый файл размером 50 МБ содержит около 500 000 предложений или 5 миллионов токенов. Это слишком мало для обучения содержательному встраиванию, однако здесь приведены эмпирические данные (обученные 6 миллиардам токенов), о которых вы могли бы обратиться.

enter image description here

Источник: https://nlp.stanford.edu/pubs/glove.pdf

Смежные вопросы