Я скачал Skin Segmentation Data Set и обнаружил, что он содержит много дубликатов.
Например, this row 0 128 0 2
было обнаружено 199 раз.Являются ли дубликаты полезными в наборах данных?
Пожалуйста, приведите несколько примеров, когда дубликаты хороши и когда зло.
Вы связано с Joe Pisarcik? – stackoverflowuser2010
@ stackoverflowuser2010, nope – MrPisarik