2016-06-04 3 views
0

Мне интересно изучать глубокое обучение. Недавно я исследовал интеллектуальную обработку текста, используя набор данных новостей.Как предсказать название новостных статей, используя глубокое обучение?

Я хочу извлечь важные одно или два предложения из тела статьи. Итак, я имитирую эту проблему как примерную версию, то есть, чтобы найти заголовок статьи.

Примеры обучения будут такими: x представляет собой коллекцию изделий, а y - это сборник статей.

Но, примеры испытаний имеют только x. (без y) После обучения модели я предсказываю название тестового набора, только используя его тело.

Как я могу построить модель? Будучи новичком глубокого обучения, я хочу получить некоторое представление или намек на эту проблему.

Спасибо!

+0

как насчет последовательности для последовательного обучения. в основном он отображает предложение в другое предложение. в вашем случае входное предложение является новостью, а выходным является заголовок. –

ответ

0

Я думаю, вы можете адаптировать архитектуру для image captioning, которая использует CNN для анализа входных данных, подающего RNN для генерации языка.

Для вашего приложения для создания заголовков подумайте об этом как надписи к документу, а не над заголовком изображения и отправьте Recurrent CNN текст документа и RNN на текст заголовка.

Это довольно амбициозный для новичка, поэтому я предлагаю вам начать «проще» с готовыми примерами CNN и RNN, чтобы понять компоненты и основные понятия глубокого обучения.

Смежные вопросы