走进“熵”的心脏:系综——吉布斯理论追溯_风闻
返朴-返朴官方账号-关注返朴(ID:fanpu2019),阅读更多!16分钟前
学习统计力学时,系综理论堪称“拦路虎”,抽象概念常让人困惑不已。为何孤立系对应微系综?温度定义又为何引发争议?本文追随物理学家吉布斯的思想脉络,从简单的单摆模型入手,介绍如何应用刘维尔定理得到系综理论,并讨论时间平均、统计分布与系综分布之间的关系,以期读者可以从源头了解吉布斯系综理论。
撰文 | 徐晓(华南理工大学物理与光电学院)
从科学理论、文学作品到生活哲理,人们都特别喜欢引用“熵”的概念。
刘慈欣在《三体》中如此描述“歌者”:“宇宙的熵在升高,有序度在降低,像平衡鹏那无边无际的黑翅膀,向存在的一切压下来,压下来。可是低熵体不一样,低熵体的熵还在降低,有序度还在上升,像漆黑海面升起的磷火,这就是意义,最高层的意义,比乐趣的意义层次要高。要维持这种意义,低熵体就必须存在和延续。”“低熵”也成为了一个网络上的热门词汇,因为“低熵”表示足够有次序,不那么糊涂,不那么不确定。而这一比喻的来历则和一个广泛传播的说法有关:熵即混乱度。
“熵”的最早思想来自热力学,与混乱无关。把“混乱”概念和熵联系起来的,是统计力学这门学科。在统计力学中,乃至在应用数学理论、信息理论中,抽象而系统地讲述“熵”这一概念,都离不开系综理论。
可以说系综理论是熵这一概念的“心脏”:通过它,熵的思想被泵到了各个不同的学科中。
系综理论是抽象而艰难的学问。即使对于学习物理的学生,当学到系综理论的时候,大多数人都难免犯迷糊。我有的同事,虽然教书也有年头了,也坦言:不理解系综。两个典型的问题是:
在孤立系中,分出一个粒子数固定的小的系统,做正则系综;再让这个小的系统的粒子数不固定,做巨正则系综。那从系统大小分,明明孤立系是整个理论的分析基础,难道不应该是总系综、小系综、巨系综吗?为什么系综理论里面,孤立系对应微系综,然后才是正则系综,巨系综?
一种流传较广的说法是:孤立系不能定义温度。一个能量恒定且与外界不交换能量的系统,其中的粒子也有平均的动能,分明可以定义温度。这不是相互矛盾的讲法吗?
这些问题,不只在我读书的时候犯迷糊,甚至我教授了二十年的《通信原理》,每年都要讲一遍系综平均和时间平均的关系的情况下,依然犯迷糊——毕竟像温度这样的物理量,是物理学特有的,通信原理不会涉及。
最近,我由于写书的缘故,读了麦克斯韦(J. C. Maxwell)、玻尔兹曼(L. Boltzmann)和吉布斯(J. W. Gibbs)的书,豁然开朗,总算明白了“系综”的来龙去脉。著名理论物理学家吴咏时先生认为,这始料未及而又豁然开朗的过程,是科学研究的趣味所在,不论心境还是内容都值得一书。
故有此文。
1
系综理论提出的背景
为了从分子运动的角度解释气体的温度、压强等物理量的成因,在克劳修斯(R. Clausius)的工作基础上,麦克斯韦于1860年建立了气体分子运动论。他将一个个气体分子看作一个个弹性小球,从概率的角度引入速率分布的假设,建立了描述气体分子速率分布变化的方程。而一个由大量气体分子构成的体系进入统计平衡的状态时(即宏观的热力学平衡态),气体分子的速率分布不再随时间变化。[1]在OXYZ坐标系内,这个稳定的分布(速度分量)为

为了求H函数取极小值时对应的概率分布密度,玻尔兹曼引入了一个假设:在总能量不变的前提下,体系中间各粒子处于不同速率的状态的可能性是相同的。这个假设后来被称为等概率假说。由此玻尔兹曼证明,当粒子数足够多时,分子运动满足麦克斯韦的速率分布。而这个时候系统达至稳态,H取最小值。这样,玻尔兹曼就证明了该分布的唯一性。
然而,这些理论是把气体分子当作弹性小球去处理的。所以有两个问题,一个是忽略了分子间的相互作用力;另一个是忽略了分子的内部结构。
对于第一个问题,玻尔兹曼引入了分子间相互作用的力,即范德瓦尔斯力,修正了模型。而对于第二个问题,处理起来非常困难。在玻尔兹曼看来,当时的实验仅仅是能观察气体发光的光谱,分子内部结构的解释主要来自化学家,其力学结构是不清楚的。所以,玻尔兹曼只能采用相对抽象的力学理论,把一个分子看成一个力学体系,以分析力学为基础,来建立分子内部结构的模型。正是这种分析办法,使得玻尔兹曼不得不使用一个重要的概念——各态遍历(ergodicity),来为其结果的合理性提供支撑,这也是吉布斯的系综理论建立的起点。
现在我们结合玻尔兹曼的思路,来看看吉布斯的系综理论。为什么要结合玻尔兹曼的思路?据说,当年瑞利(John William Strutt, Third Baron Rayleigh)写信给吉布斯,请求他写一篇更长的文章来解释其创立的相理论。吉布斯则答复,认为原来的文章还太长,应该更短些。[4]所以,吉布斯的文章是出了名的抽象晦涩,充满了看似倒因为果的推导和分析。因此,我下面就按照玻尔兹曼的思想脉络,结合具体的力学体系的例子,来介绍吉布斯的系综理论,以便读者理解。
2
刘维尔定理
2.1 分析力学中的基本概念
对于一个力学体系,我们通常采用分析力学来进行处理,分析每个时刻体系的状态。
对于系统势能只与系统内物体的位置有关的力学系统,我们称之为保守系统[5],有:

图1 单摆示意
容易看出,这个例子中,位形空间和动量空间的维度都是1,而相空间的维度为2。(见图2)

如果体系受到除了位形决定的力的影响外,还受到其他力的影响,我们称之为非保守系统。比如单摆的例子中,如果单摆运动到某个位置时,有人突然用手推了一下摆锤,或者摆锤被某个外来的小球撞了一下,系统就不再保守了。这个时候正则方程就会发生变化,写为:

方程(6)似乎只是关于非保守系统的。但即使是保守力,如果被讨论的施力物体在系统之外,并且处于运动状况,则不把系统外部物体的动能以及其彼此间的势能包含进系统,是无法消除Fks的作用的。玻尔兹曼和吉布斯都注意到了这一问题[6, 7]。本文后面讨论略有涉及。由于问题复杂,笔者将另文探讨。
2.2 各态遍历
我们往往通过分析一个系统的参数在时间上的平均结果来刻画系统。
比如,在前面所用的单摆中,我们要求系统的平均动能或者势能,只要给定时间长度,对动能或者势能按时间求平均即可。虽然这个时间平均结果会随着起始观察时间的不同而不同,但是只要观察时间足够长,这些不同的结果将趋向一个定值,为系统总能量的一半。
这个问题也可以换一种方式来解决。
布。所谓求平均的过程,就可看作是一个求统计平均的过程。这个时候,“照片平均”和“时间平均”,不过是一种同义反复,没什么特别用处。
考虑一个盒子内的一群气体分子,我们将其中一个分子选作一个系统。在同一个时刻,各个分子虽然处于不同的运动状态,但是其状态仿佛处在某个分子某个时刻的状态“照片”上。如果对整个盒子照张“全家福”,这张全家福就相当于某个分子各个时刻的照片PS到一起的结果。因此,只要照完全家福,然后针对全家福上的每个成员求统计平均,得到的结果自然就是时间平均的结果了。我们既可以用这个统计平均来代替时间平均,也可以用时间平均来代替这个统计平均。
但是,这里有两个潜在的问题:(1)这张全家福的成员状态是不是平均地反映了某个成员各个时间段的状况?会不会有的时间段的反映状态比较密集,而有的时间段比较稀疏?(2)如果各个成员自然勾肩搭背,显然和一个成员表演情况不同,则某个成员各个时间的照片PS起来,必定少了勾肩搭背的状态。
抽象总结,选用一个成员各个时期照片也好,从整体的照片中抽取单个成员照片也好,都是要形成一个关于成员的“照片”的集合,同时选定了照片针对某个状态的密度分布。这样选定的集合就是“系综”。系综(ensemble)的原意是指一个乐队——尽管他们吹奏同一部作品,但是声部、角色和吹奏强度则完全不同。
选定一个系综以后,我们马上面临的问题就是:“时间平均”是否等于“系综平均”?如果这个系统的运动随着时间推移,系统按照一个系综的分布对应的概率密度,遍历了系统可以处于各种状态,我们则说系统是各态遍历的。这时,时间平均自然等于系综平均,二者的平均结果可以彼此替代。而研究这种替代性,正是玻尔兹曼涉及这一概念的初衷。
容易理解,对于一个复杂的系统,想象这些“照片”的情况都是复杂的事情,我们希望对这些照片情况的理解有更简洁的方式。
2.3 吉布斯的“刘维尔定理”
现在我们来看,吉布斯是如何通过刘维尔定理来找照片的简洁处理方式。需要顺便解释的是,刘维尔(P. J. Liouville)和吉布斯是两个人,为什么这里叫吉布斯的刘维尔定理?刘维尔曾经在1783年处理了一个微分方程解的问题[8],后来玻尔兹曼在处理分子体系的问题时,引用了刘维尔解方程的相关思想,所以玻尔兹曼将之称为刘维尔定理[9],而吉布斯则沿用了玻尔兹曼的叫法。但吉布斯的刘维尔定理,其内涵已经完全是统计力学的了。
现在回到我们的问题。针对单摆,如果我们不停地让外来小球撞击摆锤,则动能和势能平均值既有可能随起始观察时间不同而不同,也有可能不会随时间延长趋于一个定值。
现在我们限制条件,考虑在有外来小球撞击情况下,时间平均在时间趋于无穷时趋于定值的情况。看看在这种情况下,有没有办法使用系综平均。
外来小球的撞击,每一次都改变了系统的能量。因此,容易想象,按照一个合理的分布,既选取系统能量不同的单摆的照片,也选取同能量的单摆运动处于不同时间的照片,应该可以使用系综平均的结果。


图3. 刘维尔定理:相体积不变
吉布斯采用一段非常数学化的语言,来描述刘维尔定理:“当相空间中的限定于一定相空间范围的相按照系统(内外)的力——这些力是位置坐标的函数,同时函数可以显含或者不显含时间,所遵循的动力学规律随时间变化时,其限定的范围的体积值保持恒定。”(吉布斯的原文为:When the phases bounding an extension-in-phase vary in the course of time according to the dynamical laws of a system subject to forces which are functions of coordinates either alone or with the time, the value of the extension-in-phase thus bounded remains constant.)[11]
即由公式(7)和(9),有:
公式(10)即刘维尔定理的数学表述。
在刘维尔定理的基础上,我们容易得到以下结论:对于一个保守系统,比如单摆的振幅不
不会随时间变化,达到稳定状态,则时间平均和系综平均结果相同,各态遍历。需要注意,这里是ρ对t的偏微分,这和全微分的含义是不一样的。全微分时,系统的广义坐标和广义动量都会随时间而变,但偏微分时它们不会随时间而变。
如果单摆不断受到外来撞击,我们可以认为系统从一个能量范围的保守系统系综跳到了另一个能量范围的保守系统的系综。那么,如果针对某个能量值选择的相空间所有微元的概
合理而稳定地选择外来作用,使系统可以进入统计稳定状态,且各态遍历。
3
系综理论
3.1 正则系综
对于一个热力学系统,我们也是通过一定时间的观察,来获得相关的热力学量的。也就是说,我们通过时间平均来求取参数。比如一个容器内有1摩尔氢气,我们是可以通过一定时间观察温度计而得到温度,观察压力传感器而得到的压强的。但是,从微观角度分析这个过程,我们必须考虑6.02×10^23个氢气分子中,每个分子的三个平动和三个转动坐标,考虑相互撞击以及彼此间的范德瓦尔斯力,还要考虑分子内部两个氢原子之间的振动和转动,要考虑分子受到容器壁撞击而致体系内外能量发生传递,就像单摆摆锤受到撞击一样……
显然,我们可以像前面处理单摆一样,来分析容器内的1摩尔气体。当然,现在系统的自由度要大得多,有6.02×10^23×(6+2)个自由度。但是,对于这样的正则系统的系综,应该使用的分布,是什么样子呢?
如刘维尔定理一节所述,只要对相同能量的状态赋予等概率值,针对概率能量差异而得的分布,可以是任何形式。而吉布斯则沿着麦克斯韦和玻尔兹曼的路子,选用了麦克斯韦-玻尔兹曼分布。这种选择背后,自然是正态分布。这是吉布斯的正则系综理论暗含的一个前提。虽然,从表面上看,吉布斯似乎“证明”了一定要选择这个分布。吉布斯选用的分布,按
这个分布对应了一个名字,就是正则分布。这实际上就是玻尔兹曼分布的一个推广。
虽然吉布斯经过长篇细致的推导,来说明这一选择的合理性,但在关键处,他依然指温度与熵和概率因子的对应性,这是通过与玻尔兹曼等人的结果“对比”而得来的。换言之,这种选择,并不是从刘维尔定理出发,经过严密推导而得的结果,而是吉布斯主动预设的。
从力学系统分析出发,然后类比到热力学系统,建立熵、温度和压强等热力学量与力学系统的物理量之间的对应性,在吉布斯建立系综理论之前,就有相应的研究脉络。赫姆霍兹(H. von Helmholtz)、玻尔兹曼和麦克斯韦等物理学家都做过类似的类比。而且历史文献表明,在1890-1900年吉布斯逐步建立理论的时期,他对这些工作是相当熟悉的。12这一点,在一般的教科书里几乎很难找到说明。[13]如果不熟悉历史,自然会对吉布斯使用这一类比感到抽象和奇怪,就会难以自然理解整个系综理论。
现在我们回到单摆的例子,来看看这种对应性。
图5 单摆轨迹的最后分布
在动画中【前往“返朴”观看】,单摆最大振幅一定,则能量一定,摆球沿着等能线运动;当受到外来扰动时,单摆改变振幅,即从一个等能线调到另一个等能线运动。系统的扰动类似公式(13),是按照概率随能量指数变化而设定的,能量越高,单摆到达的可能性越小;最后单摆的轨迹分布则表明了能量轨道按指数分布的情况。轨迹图中,颜色越偏粉红,概率越大;越偏蓝,概率越小(如图5)。容易想象,按照这张轨迹图,我们可以相应定出单摆系统的统计“温度”。
3.2 微正则系综
微正则系综是一个特殊状况。
微正则系综选择的系统都具有同样的能量。由于刘维尔定理的要求,微正则系综对相空间的状态选择了等概率分布。从集合的角度看,一个典型的正则系综,是由一系列微正则系综“粘合”而成,所以微正则系综是正则系综的子集。这也正是“微”这个词的由来。从前面单摆的例子中,我们也可以看出这一点。
在统计力学发展之初,温度被理解为一个系统中每个粒子在三维空间中的某个方向的平均动能,后来经过玻尔兹曼处理,温度被理解为一个力学体系(这个力学体系当然是为了描述微观粒子的运动的)各个独立自由度对应的平均动能。因此,一个微正则系综是可以定义温度的。
仍以单摆为例。显然一个单摆构成的系统,只有一个自由度,其温度即为其平均动能,即
需要强调的是,这里单摆是一个玩具式的模型,是关于微观粒子运动的一个抽象或“类比”,而不是真的有个单摆系统有“温度”。但是,以上内容也提示我们,所谓温度,有两个不同的定义:一个是系统平均动能,这是物理学科的通常理解;另一个是关于热力学系统的统计参量,是统计力学所特有的。
3.3 巨正则系综
巨正则系综,按照吉布斯的定义,则是由自由度不同的系统构成的系综进一步合并而形成的系综。比如,有一个空间区域,有N个气体分子,这个空间区域和N个气体分子构成的系统的各种可能状态及其分布,就构成了一个系综。如果我们选用正则分布,那么这个系综就是正则系综。以同样的方式,在同样的区域和相同的外部条件下,我们还可以得到一个有N+1个分子的正则系综。我们把由N个,N+1个,……分子的系统构成的各个系综合并在一起,就得到一个巨正则系综。而由巨正则系综得到的分布,则与体系自由度的选择紧密相关,在相空间中,这个分布为:

