0

Я хочу создать случайный набор данных, которые имеют 2 метки 0 и 1. Это мое распределение:Создать набор данных для двоичной классификации в k-NN с использованием Python

p(x|y = 0) = N(x1;µ1,σ2 1)N(x2;µ2,σ2 2) 
p(x|y = 1) = N(x1;µ3,σ2 3)N(x2;µ4,σ2 4) 

где x = (x1, x2) T содержит два непрерывных признанных атрибута.

Как его решить, используя python? Какую библиотеку я должен использовать? Благодарю.

ответ

1

Есть много возможностей, вероятно, самый простой, чтобы просто использовать numpyrandom number generator, таким образом

import numpy as np 
N = 100 

mean1, mean2, std1, std2 = 1, 5, 2, 3 
x0 = np.random.normal(loc=[mean1, mean2], scale=[std1, std2], size=(N, 2)) 

mean3, mean4, std3, std4 = 2, -2, 1, 0.1 
x1 = np.random.normal(loc=[mean3, mean4], scale=[std3, std4], size=(N, 2)) 
Смежные вопросы