Пример: у меня есть миллиарды коротких фраз, и я хочу, чтобы их кластеры были похожи.как найти похожие предложения/фразы в R?
> strings.to.cluster <- c("Best Toyota dealer in bay area. Drive out with a new car today",
"Largest Selection of Furniture. Stock updated everyday" ,
" Unique selection of Handcrafted Jewelry",
"Free Shipping for orders above $60. Offer Expires soon",
"XXXX is where smart men buy anniversary gifts",
"2012 Camrys on Sale. 0% APR for select customers",
"Closing Sale on office desks. All Items must go"
)
Предположим, что этот вектор представляет собой сотни тысяч строк. Есть ли в R пакет для группировки этих фраз по смыслу? или кто-то может предложить способ ранжировать «похожие» фразы по смыслу данной фразе.
Как вы предлагаете определить «смысл»? Какие из ваших примерных фраз следует группировать вместе? – tripleee