2017-01-29 3 views
0

У меня есть файл CSV, который имеет 3 столбца.как писать, если условие для столбца2, столбец 3 файла csv

Вот что я должен сделать:

Я хочу написать if состояние или что-то вроде if Divi == 'core' то мне нужно количество тегов (разных) без избыточности, т.е. (два sand1 в теге для основного деления должен считаться только одним счетом).

Один больше, если состояние как Div === saturn or core && type == dev то же самое, не нужно подсчитать не тегов (различных)

Может кто-нибудь помочь мне с этим? Поскольку это была моя идея .. любые новые идеи будут приняты, если они удовлетворяют требованиям enter image description here

+2

Можете ли вы показать, что вы пробовали? –

ответ

0

Сначала загрузите свои данные с помощью панд.

import pandas as pd 

dataframe = pd.read_csv(path_to_csv) 

Во-вторых, формат данных должным образом (вы можете иметь более низкие данные случай/верхнего регистра, как в столбце «Отдел» из вашего примера)

для колонки в dataframe.columns: dataframe [столбец] = dataframe [колонка] .lower()

Если вы хотите посчитать частоту только на одну колонку вы можете:

dataframe['Division'].value_counts() 

Если вы хотите посчитать двумя колоннами Вы можете:

dataframe.groupby(['Division','tag']).count() 

Надежда, что помогает
редактирование: Хотя это не будет давать вам только счетчик, когда 2 условие выполнено, что является то, что вы просили, это даст вам более «полный» ответ , показывая счет для всех комбинаций двух колонок

Смежные вопросы