Expectation maximization

January 20, 2018

Definition: MLE(or MAP) when some data is missing or hidden

Given: observed

Model: for some (unknown) , usually a type of exponential family. X表示观测变量数据,Z表示隐藏变量数据。X和Z在一起表示完全数据(complete-data), 单独X表示不完全数据(incomplete-data)

Goal:

Issue: difficult to maximization.
比如GMM,难以找到最优解.

Algo:

Notes:

直观解释

假设有A,B两个硬币,这两个硬币扔出正面(head那一面)的概率未知,按下面步骤进行估计。

5组实验选择的硬币已知

whatisem

5组实验选择的硬币未知

whatisem

则一组实验模型可写作

整个实验可以写作表示第i组实验选择的是A硬币,表示第i组选择的是B硬币

Initinalize

看公式,参数有3个图片中并未显示的表明,但是后续可以推导出当时,后续的估计值依然是0.5,故整个过程将该参数省略

假设:

E-step

Determine :

比如对于第一组实验,估计是硬币A的概率为

M-step

中的参数求导,得到

最终可得到

比如:

Reference

  1. mathematicalmonk:(ML 16.3) Expectation-Maximization (EM) algorithm
  2. What is the expectation maximization algorithm?
  3. 李航.《统计学习方法》第九章-EM算法及其推广
  4. Stefanos Zafeiriou Adv. Statistical Machine Learning (course 495)
Expectation Maximization - January 20, 2018 -