2013-07-25 3 views
1

Это вопрос чисто программирования. У меня есть множество слов. Слова имеют паузы после них с различной длиной (в основном ноль). Каждое слово также имеет определенную оценку. Я хочу выбрать оптимальный диапазон слов из окна просмотра.Выбор оптимального диапазона

  • Чем ниже общая уверенность, тем лучше (или говорят, что чем ниже 33-й процентиль уверенности, тем лучше).
  • Чем длиннее пауза на краях, тем лучше (с минимальным минимумом).
  • Оптимальная длина (например, 5 секунд). Чем ближе к ней, тем лучше. Там были бы жесткие ограничения на минимальную и максимальную длину.

Nota bene, это в JavaScript, поэтому я не могу позволить себе использовать вспомогательные векторные машины или тому подобное. :-) Для соображений производительности, он будет рассчитан, может быть, каждую минуту на окне с 2-минутной длиной (250 слов или около того).

Second nota bene для желающих: это выбор диапазона слов, генерируемых автоматическим распознаванием речи для ручной транскрипции (активное обучение).

Как вы подходите к этому?

+1

Для начала вам необходимо определить сопоставимый способ измерения «блеска» различных факторов, чтобы вы могли рассчитать значение для комбинации факторов. Вам понадобится формула для каждого фактора, которая дает значение для этого фактора в отношении оптимальной цели. – Guffa

ответ

0

Ночной сон освещает проблему. На самом деле очень мало магии. Так как число пролетов кандидатов довольно ограничено (в самом худшем квадрате числа слов в окне - 250^2), я могу просто оценить пригодность каждого пролета и выбрать тот, у которого лучший результат.

Дух, почему я не увидел это вчера?

Смежные вопросы