Звучит как страшная идея сделать это. Это приведет к созданию совершенно бессмысленных кластеров (закрытые IP-адреса часто не связаны и размещаются на нескольких сайтах. Таким образом, у одного и того же IP-адреса может быть юридический автомобильный магазин и незаконный материал).
Знаете ли вы, что каждый IP-адрес один номер?
Четыре цифры с точками немного проще в использовании для ручного управления сетью. Но то, что вы видите, просто четырехбайтное целое число. IP 127.0.0.1
, записанный в шестнадцатеричном виде, равен 0x7F000001
и в виде десятичного числа 2130706433
.
Я еще не проверил это, но я уверен, что все браузеры все равно должны поддерживать десятичное понятие IP. Если у вас есть веб-сервер на вашем localhost, попробуйте получить его через http:// 2130706433/
или попробуйте ping 2130706433
в командной строке.
K-средство в четырехбайтовом пространстве данных имеет смысл только в том случае, если был определен какой-то шаблон для назначения IP-адресов. То есть вы бы нуждались в, чтобы иметь 10. .123.45 и 10. .123.45 всегда имели бы столько общего, как если бы они были последующими IP-адресами в последнем байте.
Фактически я делаю обнаружение аномалий, и для этого у меня есть данные с ip-адресом, размером потока и другими функциями. поэтому я хочу применить k среднюю кластеризацию на IP-адресе и хочу охарактеризовать поток с выходом k средней кластеризации, размером потока и другими функциями, а затем хочу использовать этот характеризованный поток для ввода для алгоритма обнаружения аномалий. –
В этом случае вы не должны использовать IP-адрес для кластеризации. Храните его в своем алгоритме k-средних, используйте только числовые значения. Использовать ip-адрес как категориальный атрибут. –
моему профессору не разрешено не использовать ip-адрес. После кластеризации я делаю одно значение этого IP-адреса, например. 256, а затем используя это значение, поэтому для каждого i.p. обратится одно значение. поэтому я хочу, как сгруппировать эти данные. я могу отобразить в 4-х размерном пространстве, то есть 1-го числа. ip на оси X, затем 2-й номер. ip на оси Y, 3-й номер. на оси Z и 4 np. ip на оси K, так что они отображают все ip-адреса на плоскости XYZK. –