1

Я прочитал несколько руководств и интродукций, но я не уверен, что получаю от этого зависание, и, самое главное, я не уверен, что полностью понимаю ML vs NN ,Машинное обучение в Python: scikit-learn/Pybrain

Предположим, что я хочу проинструктировать программу (например, с помощью scikit-learn), чтобы в качестве ее набора вводился словарь языка. Например, у меня есть большой словарь итальянских слов, который я могу вводить в виде массива массивов (каждый элемент массива является одним словом, а каждое слово представляет собой массив значений ascii, по одному для каждого символа мира):

[ 
    [112, 105, 122, 122, 97], // pizza 
    [109, 097, 109, 109, 97], // mamma 
    ... 
] 

ли possibile/что это лучшая библиотека/как сделать это:

  1. Учитывая слово, есть программа Infer, если это может быть итальянское слово, так что «мафия» признана как потенциальное истинное итальянское слово, но «Eichhörnchen» не является (оно длиннее среднего итальянского мира, оно содержит такие последовательности, как «rnch», которые не встречаются в исходном наборе, содержит «ö», который является символом, а не используется на итальянском языке)
  2. Сгенерировать другие (скорее всего) итальянские слова, основанные на исходном наборе. Например, «potomo» не является фактическим итальянским слово, но, в соответствии с итальянской орфографией это может быть

ответ

0

Я думаю Наивная байесовская классификация и КНН могут быть used.Naive байесовской классификации была доказан может фильтр спама, но перед этим вам нужен тезаурус.

Смежные вопросы