Я пытаюсь визуализировать многомерную модель данных, читая их из нескольких входных файлов. Я ищу простое решение для визуализации данных нескольких категорий, считываемых из нескольких входных файлов csv. Нет. Из строк в вводах от 1 до 10000 в отдельных файлах. Формат одинаковый для всех входов с четырьмя столбцами csv-файлов.Множественные входы многомерной визуализации данных
вход 1
tweetcricscore 34 51 high
вход 2
tweetcricscore 23 46 low
tweetcricscore 24 12 low
tweetcricscore 456 46 low
вход 3
tweetcricscore 653 1 medium
tweetcricscore 789 178 medium
вход 4
tweetcricscore 625 46 part
tweetcricscore 86 23 part
tweetcricscore 3 1 part
tweetcricscore 87 8 part
tweetcricscore 98 56 part
Четыре входа имеют разные категории и col[1]
и col[2]
являются парами результатов какой-либо классификации. Все входные данные здесь являются выходами той же классификации. Я хочу лучше визуализировать их, чтобы показать все категории только в одном сюжете. Ищете решения python или pandas для них. График рассеяния или любой лучший подход к сюжету.
Я уже разместил этот запрос в разделе анализа данных обмена стеками, и мне не повезло, поэтому мы пытаемся здесь. https://datascience.stackexchange.com/questions/11440/multi-model-data-set-visualization-python
Возможно, что-то похожее на изображение ниже, где каждый класс имеет свой собственный маркер и цвет и может быть классифицирован или лучший способ показать значения пары вместе.
Код: Редактировать 1: Я пытаюсь построить график рассеяния с указанными выше входными файлами.
import numpy as np
import matplotlib.pyplot as plt
from pylab import*
import math
from matplotlib.ticker import LogLocator
import pandas as pd
df1 = pd.read_csv('input_1.csv', header = None)
df1.columns = ['col1','col2','col3','col4']
plt.df1(kind='scatter', x='col2', y='col3', s=120, c='b', label='Highly')
plt.legend(loc='upper right')
plt.xlabel('Freq (x)')
plt.ylabel('Freq(y)')
#plt.gca().set_xscale("log")
#plt.gca().set_yscale("log")
plt.show()
Ошибка:
Traceback (most recent call last):
File "00_scatter_plot.py", line 12, in <module>
plt.scatter(x='col2', y='col3', s=120, c='b', label='High')
File "/usr/lib/pymodules/python2.7/matplotlib/pyplot.py", line 3087, in scatter
linewidths=linewidths, verts=verts, **kwargs)
File "/usr/lib/pymodules/python2.7/matplotlib/axes.py", line 6337, in scatter
self.add_collection(collection)
File "/usr/lib/pymodules/python2.7/matplotlib/axes.py", line 1481, in add_collection
self.update_datalim(collection.get_datalim(self.transData))
File "/usr/lib/pymodules/python2.7/matplotlib/collections.py", line 185, in get_datalim
offsets = np.asanyarray(offsets, np.float_)
File "/usr/local/lib/python2.7/dist-packages/numpy/core/numeric.py", line 514, in asanyarray
return array(a, dtype, copy=False, order=order, subok=True)
ValueError: could not convert string to float: col2
Ожидаемый результат Plotting- Pandas
какие 'группа 1' и' 2' группа? – MaxU
@MaxU Это ожидаемый результат от Pandas Doc. Вместо 'Group 1' и' Group 2' у меня будет 'высокий'' '' '' '' '' '' '' '' ' –