一个从数据中估计参数的基础机器学习问题-德赢Vwin官网网

假如你有一个硬币。你把它投掷 3 次，出现了 3 次正面。下一次投掷硬币正面朝上的概率是多少? 这是一个从数据中估计参数的基础机器学习问题。在这种情况下，我们要从数据 D 中估算出正面朝上 h 的概率。

最大似然估计

一种方法是找到能最大化观测数据的似然函数（即 P(D;h)）的参数 h 的值。在这里，我们用「；」来表示 h 是一个关于概率分布 P 的参数，意味着参数 h 定义了分布 P，但是分布 P 只是说明了观测数据 D 成立的可能性有多大。

这是被称为「最大似然估计」的最常用的参数估计方法。通过该方法，我们估计出 h=1.0。

但是直觉告诉我们，这是不可能的。对于大多数的硬币来说，还是存在反面朝上的结果的可能性，因此我们通常希望得到像 h=0.5 这样的结果。

先验和后验

如何将这种直觉数学化地表述出来呢？我们可以定义一个观测数据和参数的联合概率：p(D, h) = p(D|h)p(h)。我们定义一个先验分布 p（h) 来表示在观测前关于 h 应该是什么值的直觉，以及在给定参数 h 的情况下的条件概率 p(D|h)。

如何利用现有的数据 D 估计参数 h 呢？我们需要得到后验分布 p（h|D），但是目前只有分布 P(D|h) 和 p(h)。这时候，你需要贝叶斯公式来帮忙!

贝叶斯公式：P(h|D)=P(D|h)*P(h)/P(D)

但是，这里的分母是一个问题：

一般来说，计算这个积分是不可能的。对于这个投硬币的例子来说，如果使用非常特殊的共轭先验分布，就可以绕过这个问题。

最大后验估计

但实际上，我们可以抛开归一化常数 P(D) 以更巧妙的方式讨论 p(h|D)。也就是说归一化常数不改变分布的相对大小，我们可以在不做积分的情况下找到模式：

这就是人们所熟知的最大后验估计（MAP）。有很多种方法可以算出变量 h 的确切值，例如：使用共轭梯度下降法。

贝叶斯参数估计

有了最大后验估计，可以通过先验分布来引入我们的直觉，并且忽略归一化积分，从而得到后验分布模式下的关于 h 的点估计。

但是如果我们试着用近似方法求积分呢？如果按通常的独立同分布假设，我们可以利用这个事实：未来可能出现的数据样本值 x 条件独立于给定参数 h 时的观测值 D。

这并非使用与后验概率 p(h|D) 模式相应的参数 h 的单一值来计算 P(x|h)，而是一个更加「严格」的方法，它让我们考虑到所有可能的 h 的后验值。这种方法被称为贝叶斯参数估计。

注意，存在两个关于概率分布的重要任务：

推断：给定已知参数的联合分布，通过其它变量的边缘概率和条件概率估计一个变量子集上的概率分布。

参数估计：从数据中估计某个概率分布的未知参数

贝叶斯参数估计将这两项任务构造成了「同一枚硬币的两面」：

估计在一组变量上定义的概率分布的参数，就是推断一个由原始变量和参数构成的元分布。

当然，实际上要做到这一点，需要计算困难的积分，我们将不得不用类似于「马尔可夫链蒙特卡洛算法」或者变分推断等方法取近似。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表德赢Vwin官网网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

机器学习

机器学习

+关注

关注
66

文章
8406

浏览量
132558
贝叶斯公式

贝叶斯公式

+关注

关注
0

文章
3

浏览量
1718

原文标题：什么是最大似然估计、最大后验估计以及贝叶斯参数估计？

文章出处：【微信号：mcuworld，微信公众号：嵌入式资讯精选】欢迎添加关注！文章转载请注明出处。

25个机器学习面试题，你都会吗？

问题都没有给出明确的答案，但都有一定的提示。读者也可以在留言中尝试。许多数据科学家主要是从一个数据从业者的角度来研究机器

发表于 09-29 09:39

什么是机器学习? 机器学习基础入门

的指导下，这个过程从数据开始。也就是说，我们嵌入式系统产生的大量数据。机器学习开发过程的第一步是

发表于 06-21 11:06

一文读懂人工智能、机器学习和深度学习三者的不同点

机器学习机器学习是人工智能的一种途径或子集，它强调“学习”而不是计算机程序。一台机器使用复杂的算

发表于 09-25 15:08 •823次阅读

从零到python机器学习大神的7个步骤

有许多python机器学习资源在线免费提供，从哪开始?如何进行?从零到python机器学习大神只

发表于 11-15 12:29 •1.3w次阅读

机器学习中几种常见回归函数的概念学习

回归问题的条件/前提： 1）收集的数据 2）假设的模型，即一个函数，这个函数里含有未知的参数，通过学习，可以

发表于 12-15 11:20 •4730次阅读

<b class='flag-5'>机器</b><b class='flag-5'>学习</b><b class='flag-5'>中</b>几种常见回归函数的概念<b class='flag-5'>学习</b>

谈谈四个无法从学校或各种线上平台学习到的机器学习技巧

机器学习教育过程中通常倾向于深入学习机器学习算法，教导我们从技术层面上理解他们的运作方式。

发表于 06-27 11:04 •4011次阅读

机器学习中的几种数据偏差

机器学习中的数据偏差是一种错误，其中数据集的某些元素比其他元素具有更大的权重和或表示。有偏见的

发表于 01-05 17:54 •2932次阅读

机器学习找一个好用的函数的原因是什么

（1）机器学习中经典的“支持向量机（SVM）”的主要提出者弗拉基米尔·万普尼克（Vladimir Vapnik），在其著作《统计学习理论的本质》中这样定义

发表于 11-02 16:15 •794次阅读

机器学习算法总结机器学习算法是什么机器学习算法优缺点

机器学习算法总结机器学习算法是什么?机器学习算法优缺点?

发表于 08-17 16:11 •1895次阅读

python数据挖掘与机器学习

用的数据挖掘和机器学习工具。一、数据挖掘数据挖掘是指从

发表于 08-17 16:29 •1312次阅读

数据挖掘和机器学习有什么关系

数据挖掘和机器学习有什么关系数据挖掘和机器学习是两个

发表于 08-17 16:29 •2457次阅读

机器学习与数据挖掘的区别机器学习与数据挖掘的关系

视为同一概念。在这篇文章中，我们将讨论机器学习和数据挖掘之间的区别以及它们之间的关系。机器

发表于 08-17 16:30 •2060次阅读

机器学习theta是什么？机器学习tpe是什么？

解一下theta。在机器学习中，theta通常表示模型的参数。在回归问题中，theta可能表示线性回归的斜率和截距；在分类问题中，theta

发表于 08-17 16:30 •1947次阅读

机器学习在数据分析中的应用

随着大数据时代的到来，数据量的爆炸性增长对数据分析提出了更高的要求。机器学习作为一种强大的工具，

发表于 07-02 11:22 •611次阅读

cmp在机器学习中的作用如何使用cmp进行数据对比

在机器学习领域，"cmp"这个术语可能并不是一个常见的术语，它可能是指"比较"（comparison）的缩写。比较在机器

发表于 12-17 09:35 •128次阅读

搜索历史

一个从数据中估计参数的基础机器学习问题

评论

25个机器学习面试题，你都会吗？

什么是机器学习? 机器学习基础入门

一文读懂人工智能、机器学习和深度学习三者的不同点

从零到python机器学习大神的7个步骤

机器学习中几种常见回归函数的概念学习

谈谈四个无法从学校或各种线上平台学习到的机器学习技巧

机器学习中的几种数据偏差

机器学习找一个好用的函数的原因是什么

机器学习算法总结机器学习算法是什么机器学习算法优缺点

python数据挖掘与机器学习

数据挖掘和机器学习有什么关系

机器学习与数据挖掘的区别机器学习与数据挖掘的关系

机器学习theta是什么？机器学习tpe是什么？

机器学习在数据分析中的应用

cmp在机器学习中的作用如何使用cmp进行数据对比