1

Я хочу создать график разброса рукописных цифр 0 и 1 (http://yann.lecun.com/exdb/mnist/). Я взял 4 образца, то есть два 0 и два 1.Scatter plot of handwritten digits

Каждая рукописная цифра имеет значения пикселей, имеющие размерность 1 крестную матрицу 778.

Теперь я хочу сделать диаграмму рассеяния этих цифр в двух измерениях, чтобы проверить, являются ли они отделимыми или нет.

Я пробовал проецировать их в R, но последний сюжет - это просто смесь точек. Как мне построить, чтобы диаграмма рассеяния каждой цифры отличалась от другой. я иду в правильном направлении во время заговора?

Просьба сообщить.

ответ

2
  1. Они, вероятно, отделимы, поэтому вам действительно не нужно его проверять.

  2. Если вы хотите знать, являются ли они разделимыми, правильным способом является использование классификатора, такого как SVM.

    Вы пытаетесь сделать reduce the dimensions из 4 цифр (4x778) в два размера (4x2). Есть много способов сделать это, и никто не идеален. После того, как вы уменьшаете размеры, некоторая информация всегда теряется, поэтому это всего лишь приблизительный способ сказать, являются ли высокоразмерные данные разделимыми.

    Наиболее распространенный/простой способ уменьшить данные до двух (или любого числа) измерений называется PCA.