Я загрузил предварительно подготовленную модель word2vec для своего родного языка. Это был файл «news.model.bin» и когда я расстегнула его, ожидал увидеть txt
файл или pickle
, но я нашел еще один .bin
файл в ней с хаосом consistat, как это:Загрузка «.bin» в Theano или TensorFlow
\09\b9\.,-;sdfkf %some really strange symbols and seem to be invalid symbols%
I даже не могу его скопировать, потому что я не могу нормально открыть файл - он тяжелый, и мой ноутбук просто умирает. Вопрос: Может ли этот примерный код быть моделью предварительного транса или нет? Если да, как я должен заниматься этим?
P.S. Ссылка, где я получил модель от (моделей находятся в нижней части страницы): http://ling.go.mail.ru/dsm/ru/about
Быстрый Google превратился [это] (http://mccormickml.com/2016/04/12/googles-pretrained-word2vec- модель-в-питон /). Я думаю, что это специальный формат для word2vec. Надеюсь, поможет. – Kh40tiK
Возможный дубликат [Конвертировать файл bin2 в текстовый файл] (http://stackoverflow.com/questions/27324292/convert-word2vec-bin-file-to-text) –