利用boosted trees进行logistic回归模型特征提取

棉花糖 发起了问题 · 有 2 人回答 · 2016-09-19 17:08:24

这两个问题能回答了吗,这个问答模块没有继续回复的功能吗

  1. 这里是列表文本这里是列表文本此部分中的网址打不开,能否再提供一次,可能是页面显示不完整
  2. 这里是列表文本这里是列表文本这里是列表文本2、print("ROC AUC: %0.4f" % roc_auc_score(y_test, y_pred_proba)) 和print("ROC AUC: %0.4f" % roc_auc_score(y_test, y_pred)) 的结果为什么不同,sklearn的文档中描述roc_auc_score的y_score 参数,既可以是概率,也可以是binary decision

答案

  • editor · 2016-09-20 11:49:32

    课程链接有误,我们会尽快修改更新,正确地址为:https://pdfs.semanticscholar.org/daf9/ed5dc6c6bad5367d7fd8561527da30e9b8dd.pdf 或者直接搜索文章标题“Practical Lessons from Predicting Clicks on Ads at Facebook”。

  • 数析学院刀塔处档案科科员 · 2016-09-20 10:45:50

    第一个问题,不懂。 第二个问题,y_pred_proba是个概率值,画roc曲线根据不同的判定阈值可以描出很多的点,而y_pred是个布尔值(只有0,1两种),以y_pred来画roc曲线的话应该只有三个(种)点:(1)recall为1precise为实际真占比;(2)precise趋近于1recall趋近于0;(3)一般的情况。所以两个图像不一样,auc自然也不一样= =。