У меня есть файл CSV геологических образований и появления ископаемых видов в каждой формации. Каждая окаменелость имеет свою собственную строку в CSV-файле с именем плагина, включенным в эту строку.Подсчет уникальных элементов в сечениях столбцов .csv (Python)
Код, который я написал ниже, распечатывал количество образований в виде штрафа.
import csv
from collections import Counter
out=open("BivalviaGRDWIS.csv", "rb")
data=csv.reader(out)
data.next()
data=[row for row in data]
out.close()
formations = []
for row in data:
if row[13]=='':
continue
else:
formations.append(row[13])
print Counter(formations)
Однако могут быть дубликаты ископаемых имен, которые разрушат счет; Мне нужно только количество уникальных окаменелостей в каждой формации. Что я могу добавить для подсчета уникальных элементов в одном столбце из файла .csv, а не во всех элементах?
В каком столбце указано место? –
По месту, я имею в виду образование. Формирование проводится в 14-й колонке. – EJMC
Вы делаете много избыточной работы в своем коде, кстати. Почему бы не цитировать ** напрямую ** над объектом 'csv.reader()'? Вместо этого вы сначала создаете список строк (кругом). –