У меня есть функция, которая берет две строки и выдает значение подобия косинуса, которое показывает взаимосвязь между обоими текстами.Ускорение сравнения текста (с разреженными матрицами)
Если я хочу сравнить 75 текстов друг с другом, мне нужно сделать 5 625 одиночных сравнений, чтобы иметь все тексты по сравнению друг с другом.
Есть ли способ уменьшить это количество сравнений? Например, разреженные матрицы или k-средства?
Я не хочу говорить о своей функции или о способах сравнения текстов. Просто уменьшите количество сравнений.
Да, я хочу найти похожие строки. Более подробная информация содержится в моем комментарии к ответу Бена. Моя база данных (MySQL), похоже, имеет эти пространственные типы: http://dev.mysql.com/doc/refman/5.0/en/mysql-spatial-datatypes.html. Нет ничего о квадтрите !? – caw
Многие виды пространственных индексов могут служить вам хорошо. Читайте о доступных формах MySQL. –
Я уже много читал об этих пространственных функциях. Я добавил абзац об этом на мой вопрос. Можете ли вы мне помочь? – caw