У меня есть файл CSV в следующем формате:Анализ данных с использованием Python
30 1964 1 1
30 1962 3 1
30 1965 0 1
31 1959 2 1
31 1965 4 1
33 1958 10 1
33 1960 0 1
34 1959 0 2
34 1966 9 2
34 1958 30 1
34 1960 1 1
34 1961 10 1
34 1967 7 1
34 1960 0 1
35 1964 13 1
35 1963 0 1
Первый столбец обозначает возраст и последний столбец обозначает коэффициент выживаемости (1, если пациент выживает 5 лет или дольше; 2, если пациент умер в течение 5 лет) Я должен рассчитать, какой возраст имеет самую высокую выживаемость. Я новичок в python, и я не могу понять, как это сделать. Я смог рассчитать самый повторный возраст, используя функцию режима, но я не могу понять, как проверить один столбец и распечатать соответствующий другой столбец. Пожалуйста помоги.
Я смог найти ответ, где мне пришлось анализировать только первую строку.
import csv
import matplotlib.pyplot as plt
import numpy as np
df = open('Dataset.csv')
csv_df=csv.reader(df)
a=[]
b=[]
for row in csv_df:
a.append(row[0])
b.append(row[3])
print('The age that has maximum reported incidents of cancer is '+ mode(a))
Похоже, вы хотите, чтобы мы написали вам код. Хотя многие пользователи готовы создавать код для кодера, терпящего бедствие, они обычно помогают только тогда, когда плакат уже попытался решить проблему самостоятельно. Хорошим способом продемонстрировать это усилие является включение кода, который вы написали до сих пор, пример ввода (если есть), ожидаемого результата и выход, который вы фактически получаете (вывод консоли, трассировка и т. Д.). Чем больше деталей вы предоставляете, тем больше ответов вы получите. Проверьте [FAQ] и [ask]. –
Проведите некоторое исследование CSV соскабливания с Python, напишите код и вернитесь, если у вас есть проблемы. –
Спасибо Łukasz Rogalski и jacob-on-stackoverflow – StevieG