基础理论-集成学习

发表于 2022-03-12
本文字数： 1.6k 阅读时长 ≈ 1 分钟

集成学习一览
1. Bagging
2. Boosting
3. Stacking
QA
- 0. Boosting 与 Bagging 区别
- 1. Boosting, Bagging 与偏差，方差

阅读全文 »

基础理论-概率派 VS 贝叶斯派

发表于 2022-03-12
本文字数： 1.9k 阅读时长 ≈ 2 分钟

1. 频率派 vs 贝叶斯派
- 频率派
- 贝叶斯派
2. 极大似然估计 vs 最大后验估计
- 1. 极大似然估计 - MLE
- 2. 最大后验估计 - MAP
QA

阅读全文 »

概率图模型-HMM

发表于 2022-03-12
本文字数： 9 阅读时长 ≈ 1 分钟

概率图模型 - HMM

模型-KNN

发表于 2022-03-12
本文字数： 632 阅读时长 ≈ 1 分钟

模型 - KNN

简介
算法步骤
K 的选择
QA
- 1. KNN 中为何采用欧式距离而不采用曼哈顿距离？
- 2.

阅读全文 »

模型-LDA

发表于 2022-03-12
本文字数： 139 阅读时长 ≈ 1 分钟

模型 - LDA

简介

LDA 叫做线性判别分析，又叫做Fisher 线性判别函数，其是一种有监督的降维技术，其思想为：投影后类内方差最小，类间方差最大。

简单来说，我们将数据向低维超平面上投影时，投影后希望每一种类别数据的投影点尽可能的接近，而不同类别的数据的类别中心点的距离尽可能的大。

模型-树回归

发表于 2022-03-12
本文字数： 76 阅读时长 ≈ 1 分钟

模型 - 回归树

CART 用于回归

https://blog.csdn.net/weixin_36586536/article/details/80468426

模型-聚类算法

发表于 2022-03-12
本文字数： 4 阅读时长 ≈ 1 分钟

聚类算法

模型-谱聚类

发表于 2022-03-12
本文字数： 6 阅读时长 ≈ 1 分钟

模型 - 谱聚类

降维度-PCA

发表于 2022-03-12
本文字数： 270 阅读时长 ≈ 1 分钟

降维 - PCA

QA

1. PCA 中第一主成分是第一的原因？

https://www.nowcoder.com/questionTerminal/7e9febebe3d3467ca5ea17e013d416f0

2. 讲一下 PCA

PCA是比较常见的线性降维方法，通过线性投影将高维数据映射到低维数据中。所期望的是在投影的维度上，新特征自身的方差尽量大，方差越大特征越有效，尽量使产生的新特征间的相关性越小。

PCA算法的具体操作为对所有的样本进行中心化操作，计算样本的协方差矩阵，然后对协方差矩阵做特征值分解，取最大的n个特征值对应的特征向量构造投影矩阵。

集成学习-GBDT

发表于 2022-03-12
本文字数： 234 阅读时长 ≈ 1 分钟

集成学习 - GBDT

1. Boosting 思想
2. GBDT
- 1. GBDT 思想

阅读全文 »

Earyant

个人技术博客，分享开发中遇到的问题，以及想学的新技术，会持续更新，可以订阅rss。

GitHub E-Mail Weibo Twitter FB Page StackOverflow Zhihu