定义

按照[wiki百科的定义EM算法被用于寻找,依赖于不可观察的隐形变量的模型中参数的最大似然估计。在统计计算中,最大期望(EM)算法是在概率模型中寻找参数最大似然估计或者最大后验估计算法,其中概率模型依赖于无法观测的隐性变量。最大期望算法经常用在机器学习计算机视觉数据聚类(Data Clustering)领域。最大期望算法经过两个步骤交替进行计算,第一步是计算期望(E),利用对隐藏变量的现有估计值,计算其最大似然估计值;第二步是最大化(M),最大化在E步上求得的最大似然值来计算参数的值。M步上找到的参数估计值被用于下一个E步计算中,这个过程不断交替进行。

阅读全文 »

本篇主要分析CV领域的主要代表性CNN网络结构,这些网络结构一般是在图像识别的任务上开发设计的,并迁移应用到其他的计算机视觉任务上。

对于计算机视觉而言,从简单到复杂一般包括:

  • 图像识别
  • 目标检测
  • 图像分割
  • 图像翻译/描述

所谓图像识别,就是识别一张图像的类别,比如说猫狗大战,图像识别是最基础的计算机视觉任务。对于图像识别任务中,待识别的照片类似于大头贴的形式,即目标基本覆盖整张图像的大部分区域。对于机器学习任务,网络的搭建以及模型的训练过程,实际上就是学习输入数据到标签之间的映射的过程,假设输入的数据为X,对应的标签为Y,网络模型为f(.),训练的过程就是为了找到合适的参数使得满足关系式$Y=f(x)$。

阅读全文 »

目标检测为计算机视觉领域内的相关任务,输入一张图片,输出图片中物体所在位置及物体的名称。是一个典型的多任务模型。

阅读全文 »

支持向量机是非常高效的一种有监督机器学习算法,是一个二类分类模型,他的基本模型是定义在特征空间上的间隔最大的现行分类器,间隔最大使它有别于感知机;此外核函数的应用,使该算法可以应用有非线性空间。

阅读全文 »

决策树是机器学习中非常容易理解机模型,是最基础最常见的有监督学习模型,被用于分类或者回归,由于树结构与销售、教育、医疗诊断场景决策过程相似,因此在该领域应用广泛。

决策树的生成包括三个部分:特征选择,构造树,树剪枝

阅读全文 »

聚类是一种主要用于处理分类的无监督任务。给出一组无标记的数据,目标是找到这组数据的模式特征,例如哪些数据是同一类型的,哪些数据是另外的类型。聚类与分类的最大区别就是分类的目标实现已知,例如我们熟知的猫狗大战,在进行分类之前我们就已经知道给定的样本非猫即狗,但是在聚类的时候,对目标是未知的,只能根据给定的数据的特征,按照自己设定的划分标准将样本进行划分

阅读全文 »