2017-01-23 3 views
-2

Я отредактировал свой вопрос ниже после комментария от @Tchotchke: Я пытаюсь обучить модель НЛП, чтобы классифицировать поддельные и аутентичные обзоры продуктов. Для обучения мне нужен маркированный набор данных таких обзоров. Наборы данных обзоров продуктов опубликованы исследователями, но они не помечены. И некоторые наборы данных (например, в Fake reviews datasets) предназначены для отзывов о гостиницах и, следовательно, не представляют широкий спектр языковых функций, которые могут существовать для отзывов о таких продуктах, как обувь, одежда, мебель, электроника и т. Д., Которые продаются на типичных шопингах порталы, такие как Amazon, Walmart и т. д. Может кто-то может предложить способ генерации такого помеченного набора данных довольно быстро или найти его уже доступным?Метка данных набора обзора продукта spam

+0

«Вопросы просят нас, чтобы рекомендовать или найти книгу, инструмент, библиотеку программного обеспечения, учебник или другие за пределы площадки ресурс вне темы для переполнения стека, как они склонны привлекать упрямые ответы и спам. Вместо этого опишите проблему и то, что было сделано до сих пор, чтобы ее решить ». – Tchotchke

ответ

0

Существует коллекция наборов данных обзора амазонки продукции обеспечивается UCSD

+0

Thank-you @ ryder1211212. Но набор данных, о котором вы упомянули, не помечен для поддельных/аутентичных. Таким образом, это не служит моей цели. Но еще раз спасибо. – TDS