打通修炼机器学习的任督二脉

2020/01/24

机器学习概观

介绍机器学习中超脱于具体模型和方法之上的一些共性问题,将从概率的两大派别开始。

众所周知,概率在机器学习中扮演着核心角色,而频率学派与贝叶斯学派对概率迥异的认知也将机器学习一分为二,发展出两套完全不同的理论体系。

正所谓兼听则明偏听则暗,理解机器学习时应该看到这同一枚硬币的两面,以获得完整的认知。除此之外,本模块还涵盖了计算学习等机器学习的理论问题,以及关于模型和特征的一些实验主题。

统计学习

频率学派发展出的机器学习理论——统计学习。

统计机器学习的核心是数据,它既从数据中来,利用不同的模型去拟合数据背后的规律;也到数据中去,用拟合出的规律去推断和预测未知的结果。

统计学习中最基础的模型是线性回归,几乎所有其他模型都是从不同角度对线性回归模型做出的扩展与修正。

因此,在这个模块中,我将以线性模型为主线,和你一起浏览它的万千变化,观察从简单线性回归到复杂深度网络的发展历程。

符号学习

贝叶斯学派发展出的机器学习理论,也就是 概率图模型

和基于数据的统计学习相比,基于关系的图模型更多地代表了因果推理的发展方向。

贝叶斯主义也需要计算待学习对象的概率分布,但它利用的不是海量的具体数据,而是变量之间的相关关系、每个变量的先验分布和大量复杂的积分技巧。

  • 表示
  • 推断
  • 学习