Есть ли хорошие API и общедоступные наборы данных (словари, фразы) для работы с естественными языками?API и наборы данных для естественных языков?
В частности, существуют ли какие-либо хорошие условия для перевода на английский и корейский языки?
Есть ли хорошие API и общедоступные наборы данных (словари, фразы) для работы с естественными языками?API и наборы данных для естественных языков?
В частности, существуют ли какие-либо хорошие условия для перевода на английский и корейский языки?
Для английского языка я использую OpenNLP.
К сожалению, я никогда не видел ничего связанного с корейцами, кроме Google Language Detection and Translation APIs. Они довольно просты в использовании.
WordNet - это классический ресурс данных для английского языка с семантическими отношениями.
MontyLingua может пригодиться для промежуточного слоя между английским и корейским.
Natural Language Toolkit (NLTK) - отличный ресурс, если вы рассматриваете Python как язык. Он включает в себя множество вещей, которые вы ожидаете в среде обработки текста/NLP, таких как парсеры, стеблемеры и теги с частичной речью. Документация по этому тоже неплохая.
Что касается наборов данных, NLTK поставляется с множеством annotated corpora and textual data sets для экспериментов.
Надеюсь, это поможет, B.