Представьте, что у вас есть список поставщиков с внутренним контролем. Теперь представьте, что вы хотите сопоставить неструктурированные строки с этим списком. Большинство из них будут легко соответствовать, но некоторые из них могут быть практически невозможны. Алгоритм присваивает уверенность каждому соответствию, но человеку нужно подтвердить все произведенные матчи.Как проверить методы, которые могут не всегда давать правильный ответ
Как этот алгоритм может быть проверен модулем? Единственной идеей, которую я имел до сих пор, является выборка пар, согласованных людьми, и убедитесь, что алгоритм способен успешно сопоставлять те, которые пропускают строки, которые я не мог разумно ожидать от нашего алгоритма. Есть ли способ лучше?
Ошибка тестирования также была бы хорошей идеей, по крайней мере, чтобы убедиться, что доверие алгоритма не является произвольным. Как вы указали, отбрасывание результатов в пределах диапазона (25-75 процентилей, возможно) было бы хорошей идеей. –