Я ищу некоторую помощь в моделировании этой проблемы с обучением машины.Моделирование карточной игры для машинного обучения
Рука состоит из трех рядов (содержащих соответственно 3, 5 и 5 карт). Ваша цель - создать руку, которая наберет наибольшее количество очков. Вы получаете карты через интервалы, называемые улицами, пять карт на первой улице и три на следующих четырех улицах (вы должны отбросить одну из карт на последних четырех улицах). Карты не могут перемещаться после их размещения. More details on scoring.
Моя цель - создать систему, которая, учитывая множество улиц, играет рукой, подобной нашим лучшим игрокам. Кажется довольно ясным, что мне нужно построить нейронную сеть для каждой улицы, используя функции, основанные на существующей руке и наборе карточек на улице. У меня есть много данных (улицы, места размещения и окончательный результат), но я немного не уверен, как моделировать проблему, учитывая, что возможные выходы уникальны на множестве карт (хотя их меньше 3^5 места размещения на первой улице и 3^3 после). Раньше я занимался только проблемами классификации с фиксированными категориями.
Есть ли у кого-нибудь пример подобной проблемы или предложения по подготовке данных обучения, когда у вас есть уникальные выходы?
Интересная проблема. Плохой вопрос .... помечен как слишком широкий. Пожалуйста, уточните свой вопрос. –
Я не уверен, что полностью понимаю, но не мог бы вы использовать что-то вроде разворачивания матрицы для представления текущего набора рук/функций и вывода? Например, рука, которая выглядит как [23400; 56789; 10 11 12 13 14], будет представлена как [2340056789 10 11 12 13 14]. Намного легче справиться, и в конце третьей нейронной сети для третьей улицы вы можете извлечь вектор обратно в матрицу, чтобы представить финальную руку. –
Если этот вопрос переместится на [DataScience] (http://datascience.stackexchange.com) (хост для вопросов ML)? –