Я отредактировал свой вопрос ниже после комментария от @Tchotchke: Я пытаюсь обучить модель НЛП, чтобы классифицировать поддельные и аутентичные обзоры продуктов. Для обучения мне нужен маркированный набор данных таких обзоров. Наборы данных обзоров продуктов опубликованы исследователями, но они не помечены. И некоторые наборы данных (например, в Fake reviews datasets) предназначены для отзывов о гостиницах и, следовательно, не представляют широкий спектр языковых функций, которые могут существовать для отзывов о таких продуктах, как обувь, одежда, мебель, электроника и т. Д., Которые продаются на типичных шопингах порталы, такие как Amazon, Walmart и т. д. Может кто-то может предложить способ генерации такого помеченного набора данных довольно быстро или найти его уже доступным?Метка данных набора обзора продукта spam
-2
A
ответ
0
«Вопросы просят нас, чтобы рекомендовать или найти книгу, инструмент, библиотеку программного обеспечения, учебник или другие за пределы площадки ресурс вне темы для переполнения стека, как они склонны привлекать упрямые ответы и спам. Вместо этого опишите проблему и то, что было сделано до сих пор, чтобы ее решить ». – Tchotchke