机器学习
回归模型评估
案例一:鸢尾花分类
机器学习的优化算法
交叉熵
lightGBM
处理非平衡数据集的方法
AdaBoost
GBDT
XGBoost
决策树
线性回归
pytorch 优化器的使用
分类模型评估
损失函数
前馈神经网络
特征工程
分箱
评分卡实现过程
逻辑回归
本文档使用 MrDoc 发布
-
+
首页
分箱
### 前言 分箱是把连续型数据根据一定的规则进行分组,使数据离散化,以增强模型的稳定性,并避免过拟合 分箱主要分为无监督分箱和有监督分箱 ### 无监督分箱 1. 等距分箱 2. 等频分箱 3. 聚类分箱 ### 有监督分箱 1. 决策树分箱 >将待分箱的特征与Y值通过决策树进行拟合,决策树训练后的结果会提供内部节点的阈值,这个阈值就是分箱的边界。 2. 卡方分箱 ### 参考 > [数据科学猫:数据预处理之数据分箱](https://blog.csdn.net/Orange_Spotty_Cat/article/details/116485079)
gaojian
2022年11月6日 09:50
分享文档
收藏文档
上一篇
下一篇
微信扫一扫
复制链接
手机扫一扫进行分享
复制链接
关于 MrDoc
觅思文档MrDoc
是
州的先生
开发并开源的在线文档系统,其适合作为个人和小型团队的云笔记、文档和知识库管理工具。
如果觅思文档给你或你的团队带来了帮助,欢迎对作者进行一些打赏捐助,这将有力支持作者持续投入精力更新和维护觅思文档,感谢你的捐助!
>>>捐助鸣谢列表
微信
支付宝
QQ
PayPal
Markdown文件
分享
链接
类型
密码
更新密码