利用boosted trees进行logistic回归模型特征提取

棉花糖 发起了问题 · 有 1 人回答 · 2016-09-18 16:18:11

1、此部分中的网址打不开,能否再提供一次,可能是页面显示不完整 2、print("ROC AUC: %0.4f" % roc_auc_score(y_test, y_pred_proba)) 和print("ROC AUC: %0.4f" % roc_auc_score(y_test, y_pred)) 的结果为什么不同,sklearn的文档中描述roc_auc_score的y_score 参数,既可以是概率,也可以是binary decision 另外:执行data.groupby('occupation').size().order(ascending=False)时,报错,KeyError: 'occupation' 这个问题以解决,因为names = ("age, workclass, fnlwgt, education, education-num, " "marital-status, occupation, relationship, race, sex, " "capital-gain, capital-loss, hours-per-week, " "native-country, income").split(', ') 中有空格,split之后是有空格的,所以occupation会报错,如果改为‘ occupation’或者把空格都去掉就不会报错了 谢谢


答案

  • editor · 2016-09-18 18:21:09

    好的,多谢您的反馈