scikit-learn中的分层集训(Stratified Train)

我把我的数据分成一个训练集(75%)和测试集(25%)。我用了如下代码
X, Xt, userInfo, userInfo_train = sklearn.cross_validation.train_test_split(X, userInfo)
[/cod
但是,我想对我的训练数据集进行分层。我该怎么做?我一直在寻找到的stratifiedkfold的方法,没有指定75% / 25%这样分,只划分训练数据集。
数据科学家 Level1 提问 在 2017-12-05 在 研究问题.
添加评论
1 答案
最佳答案
参照文件: sklearn.model_selection.train_test_split:

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y,
stratify=y,
test_size=0.25)


你还可以用 
train, test
= next(iter(StratifiedKFold(...)))
数据科学家 Level2 回答于 在 2017-12-06。
添加评论

您的回答

*代码插入功能已上线
发布您的回答,意味着您同意了我们的 隐私政策服务条款