机器学习


  • 简介
  • 目录大纲
  • 最新文档

    案例一:鸢尾花分类

    概述 鸢(yuān )尾花分类相当于机器学习中的Helloworld问题,如果这个问题你能解开了那么说明你机器学习已经入门了。 传统的机器学习任务从开始到建模的一般流程就是:获取数据 — 数据预处理 — 训练模型 — 模型评估 — 预测,分类。 我们将根据这个步骤一步一步展开,通过鸢尾花的4个属性预测鸢尾花属于3个种类的哪一类。 01 获取数据 机器学习算法往往需要大量的数据,在skleran……

    gaojian - 2024年9月14日 15:03


    分类模型评估

    混淆矩阵 首先需要了解一下混淆矩阵,它是二分类模型评估的基础: | | 真实值为正 | 真实值为负 | | --- | --- | --- | | 预测值为正 | True Positive| False Positive | | 预测值为负 | False Negtive| True Negtive | 参数说明: - TP:True Positive 即预测为正,且预测正确 FP:Fal……

    gaojian - 2023年2月23日 17:16


    机器学习的优化算法

    0. 概述 在机器学习算法中,常常需要计算最优解的值,但是这些最优解的值往往无法通过计算直接获得,因此需要通过一些方法来近似获得这些值,这样的方法我们称之为优化算法,它使得我们能够通过更少的计算来更快的获得近似的最优解。 1. 梯度下降法Gradient Descent 2. 随机梯度下降法 SGD 3. mini-batch 梯度下降法 4. 带动量的梯度下降法Gradient descent ……

    gaojian - 2023年1月31日 10:48


    XGBoost

    XGBoost树的定义 先来举个例子: 我们要预测一家人对电子游戏的爱好程度,考虑到年龄因素,年轻人比老年人更喜欢电子游戏,考虑到日常是否使用电脑,年轻人日常使用电脑更多一些,于是我们可以构造出如下两棵决策树: 将两棵树的结论累加起来得到最终的结论: - 小孩的总分是:2+0.9=2.9 - 爷爷的总分是:-1-0.9=-1.9 因此我们认为小孩更喜欢电子游戏。 那么问题来了,这与GBDT有什么……

    gaojian - 2023年1月11日 11:15


    交叉熵

    gaojian - 2023年1月4日 14:43



    gaojian