数学中国

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 1816|回复: 0

中心极限定理:从高尔顿板到麦克斯韦分布

[复制链接]
发表于 2020-11-5 11:00 | 显示全部楼层 |阅读模式
中心极限定理:从高尔顿板到麦克斯韦分布

撰文 | 张和持

时隔多年,或许你早就记不得  岁那年夏天高中闷热的教室,但可能会记得有一天数学老师说着要给大伙看个稀奇——一块祖传的高尔顿板。尽管班上大多数同学都叫不出它的名字,却也从小到大在科技馆、博物馆见多了,一点都提不起劲儿。老师一本正经地开始讲,这个图形就是正态分布,它有诸多的性质……午后的时光更加昏沉而缓慢地流逝。

不过,这里面蕴含的数学可一点都不无聊,让我们来观察一下高尔顿板的结构。


高尔顿板丨图片来源:维基百科

从最上方的节点往下,是几排交错排列的钉子。从入口扔下的小球撞上一个钉子,就像触网的乒乓球一样,弹向左边和右边的概率相等。咦?这不就是老早学过的杨辉三角吗?最上方只有一种可能,下降之后,左右两边比例变成 1:1 ,继续这个步骤,第 n 行的比例系数其实就是 n 次二项式的展开系数 C(n,k) 。正因如此,这种分布被称为二项分布。


杨辉三角/图片来源:维基百科




二项分布逼近正态分布的过程丨图片来源:维基百科

为什么一个离散的分布会跟一个连续的分布扯上关系呢?这个结论最早由法国数学家棣莫弗在1738年证明,他发现,如果不断地抛一枚硬币,那么得到的正面次数服从二项分布,只要抛得次数够多,那最终将逼近正态分布。也就是说,假如赌博胜和负的概率是对半分的,那么赌博 n 次的盈亏最终就是上面这个分布。


棣莫弗(Abraham de Moivre 1667-1754)丨图片来源:维基百科

不过这一结论在当时并没有引起重视,毕竟并不是所有赌徒都能像梅雷一样交上帕斯卡这样的朋友。百年之后,拉普拉斯试图挽救这个定理的人气,依然没有成功。为了纪念这对“难兄难弟”,现在人们把这个定理称为棣莫弗-拉普拉斯定理。

这种逼近的本质究竟是什么呢?我们看到,不管是高尔顿板,还是多次赌博,二项分布拆成每一步都是简单的 1:1 概率事件。那么就可以说,二项分布是这样的一步一步“加”起来的。

如果是比 1:1 更复杂的分布,把它们大量加起来是否仍然有类似的性质呢?高斯等人在研究实验物理学时发现,如果对一个物理量进行多次测量,最终的测量误差总是像这样的:


误差演示丨Python作图

在物理学中,误差来自于无关因素的微小扰动。这些扰动加起来,就是整体的误差。这个整体误差虽然层次不齐,但形状与正态分布还是大致吻合的。从那以后,实验的误差一般都当作是正态分布。为了纪念高斯的贡献,也把正态分布称为高斯分布。

至此,我们已经大概能想象到,正态分布的逼近与这种“加”的性质有关,剩下证明就是数学家的事了。如今,我们把这一系列逼近正态分布的性质称为“中心极限定理”,结论从最初的二项分布,已经扩展到了任意分布(包括同分布和不同分布)的广阔天地。就如同上一段中的误差——即便我们对微观下的扰动一无所知,也能通过这种极限形式,了解大样本下的整体行为。

应用这一思想的最为经典的例子当属统计力学。假如有一大堆粒子,每个都杂乱无章地运动,我们自然无从知晓每一个粒子的运动状况。不过,如果把每一个粒子的动量当作是一个随机分布的话,那就可以把所有这些分布“加”起来当做整体的动量。如此一来,中心极限定理岂不是大有用处?




麦克斯韦速率分布丨图片来源:维基百科



参考资料

[1] A. I. Khinchin, Mathematical Foundations of Statistical Mechanics

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|数学中国 ( 京ICP备05040119号 )

GMT+8, 2024-4-19 20:05 , Processed in 0.084961 second(s), 16 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表