Прямо сейчас я пытаюсь сравнить слова из двух разных файлов, одного английского, одного китайского. Я должен определить, связано ли какое-либо из английских слов с китайскими словами, являются ли они равными или являются гипернимным другим. Я могу использовать synsets для английского, но что я могу сделать о китайских словах?NLTK synset с другими языками
ответ
Похоже, есть китайский (cmn) WordNet, доступный в университете на Тайване: http://casta-net.jp/~kuribayashi/multi/. Если этот WordNet имеет тот же формат, что и английский WordNet, то вы, вероятно, можете использовать WordNetCorpusReader (http://nltk.googlecode.com/svn/trunk/doc/api/nltk.corpus.reader.wordnet-pysrc.html#WordNetCorpusReader) в NLTK для импорта данных Mandarin. Я не знаю, как вы выполняете выравнивания или переводы между двумя наборами данных, но, предполагая, что вы можете сопоставить английский язык с китайским, это должно помочь вам понять, как соотношение между двумя английскими словами сравнивается с отношением между двумя словами мандарина. Обратите внимание, что если ваши данные используют упрощенный скрипт, вам также может потребоваться преобразовать в традиционный скрипт перед использованием этого cmn WordNet.
- 1. Взаимодействие с другими языками?
- 2. NLTK: получить слово из Synset ID
- 3. С ++ взаимодействовать с другими языками
- 4. NLTK Wordnet Synset для фразы слов
- 5. Как преобразовать [Synset ('dog.n.01'), Synset ('frump.n.01'), Synset ('dog.n.03'), Synset ('cad
- 6. Извлечение Word из Synset с использованием Wordnet в NLTK 3.0
- 7. wordet synset в питона
- 8. Вопрос о переменной C# с другими языками
- 9. Создать файл с другими языками в php
- 10. Классы C# взаимодействуют с другими языками .NET.
- 11. Работы LibShortText с другими языками тоже?
- 12. Delphi DLL, совместимый с другими языками программирования
- 13. Каковы преимущества использования Prolog над другими языками?
- 14. Как сделать optparse в python другими языками
- 15. Сравнение синонимов NLTK
- 16. Как скорость ironpython сравнивается с другими языками .net?
- 17. Python Tkinter (копировать/вставить не работает с другими языками)
- 18. Может ли gwt использоваться с другими языками, кроме java?
- 19. Приложение для полноэкранного терминала с рубином (или другими языками)
- 20. Переменная кэширование в JavaScript по сравнению с другими языками
- 21. использование jsreport с другими языками (не на английском языке)
- 22. Производительность I/O сокета Python по сравнению с другими языками
- 23. Могу ли я использовать silverlight с другими серверными языками?
- 24. Тессеракта работает с другими языками, но не Tess4J
- 25. Легко ли узнать WPF по сравнению с другими языками?
- 26. Может ли DLL использоваться с другими языками программирования?
- 27. Получить синонимы из synset возвращает ошибку - Python
- 28. 0-я синхронизация в интерфейсе wordnet NLTK
- 29. Как получить все гипонимы слова/synset в python nltk и wordnet?
- 30. Словосочетание Несознание для текста на арабском языке с помощью NLTK
; P 'Open Multilingual WordNet' - отличный ресурс для неанглийского wordnet, и если ANYONE рад кодировать API NLTK, свяжитесь с Francis Bond @ http://www3.ntu.edu.sg/home/fcbond/или Steven Bird http://ww2.cs.mu.oz.au/~sb/ or both =) – alvas
Вот почему я привязан к полному списку, а не только к WordNet OP. Я должен добавить что-то, чтобы упомянуть, как онтологии, разработанные для разных языков, обычно не идентичны межлингвистически, хотя я считаю, что для определения гипотез и гипер-нима иерархическая структура может быть достаточно близка во многих случаях. – dmh
возможно иметь независимые от языка доменные онтологии, но я не думаю, что hypo/hypernym hierachies являются близкими друг к другу. См. Http://goo.gl/LkN3h – alvas