0
У меня есть Dataframe df
Я выбрал некоторые кулачки, и я хочу разделить их на xtrain и xtest, чтобы присоединиться к coulmn, называемому Sevrice. Таким образом, сырые с 1 и o в xtrain и нано в xtest.Разделите dataframe на два набора по столбцу
Service
1
0
0
1
Nan
Nan
xtarin = df.loc[df['Service'].notnull(), ['Age','Fare', 'GSize','Deck','Class', 'Profession_title' ]]
EDITED
ytrain = df['Service'].dropna()
Xtest=df.loc[df['Service'].isnull(),['Age','Fare','GSize','Deck','Class','Profession_title']]
import pandas as pd
from sklearn.linear_model import LogisticRegression
logistic = LogisticRegression()
logistic.fit(xtrain, ytrain)
logistic.predict(xtest)
Я получаю эту ошибку для logistic.predict(xtest)
X has 220 features per sample; expecting 307
Спасибо, у вас есть какие-либо идеи почему я получаю эту ошибку X имеет 220 функций на образец; ожидая 307 –
Кажется, что-то проблема с данными, я тестирую его с помощью некоторого образца, и он работает, см. редактирование. – jezrael
Благодарим вас за принятие. Я пробую ваш код с вашей csv и той же проблемой. Проблема заключается в том, что 'xtrain' и' xtest' имеют разную длину столбцов, 'print (xtrain.info()) print (xtest.info())' – jezrael