外观
Chapter 7 狭义相对论
约 5800 字大约 19 分钟
2025-10-13
Part 1 基本假设和运动学理论
· 基本假设
狭义相对论是在描述电磁学的 Maxwell 方程组确立之后提出的。其原因在于,通过联立求解 Maxwell 方程组,人们可以得到如下的描写在真空中传播的电磁波动方程
ϵ0μ0∂t2∂2E−∂x2∂2E−∂y2∂2E−∂z2∂2E=c21∂t2∂2E−∂x2∂2E−∂y2∂2E−∂z2∂2E=0,
以及
ϵ0μ0∂t2∂2B−∂x2∂2B−∂y2∂2B−∂z2∂2B=c21∂t2∂2B−∂x2∂2B−∂2B−∂2B=0.
这里, E(x,y,z,t) 和 B(x,y,z,t) 为电磁波的电场和磁场强度。常数
c=ϵ0μ01=299792458m/s
具有速度的量纲,被定义作电磁波在真空中的传播速度。注意到它等于当时实验上已知的光在真空中的传播速度,Maxwell 提出了光是电磁波的命题。
由于在推导 Maxwell 方程时,并没有特别指定是在哪一个参照系中进行计算的,一个直接的推论是,光速是一个不依赖于参照系的普适常数。换句话说,在两个彼此做匀速直线运动的惯性参照系中,电磁波是以相同的速度传播的。这是与 Galileo 变换公式的结论相矛盾的。有意思的是,光速是普适的这一结论后来被实验物理学家通过实验加以了证实。这就使得人们要么放弃相对性原理,要么放弃 Galileo 变换公式。爱因斯坦选择了后者。
在 1905 年 9 月发表的一篇文章中,爱因斯坦首先提出了狭义相对论的两个基本假设。
(1) 相对性原理:物理定律在所有的惯性参照系都是等价的。因此,有关运动方程应该具有相同的形式。
(2) 光速不变原理:在所有的参照系中,光在真空中传播的速率皆为 c 。而任何粒子在惯性参照系中的运动速率皆小于或等于光速。
现在,让我们看一看从这两个假设出发,我们可以导出什么结论。
· 洛伦兹变换
我们考虑两个惯性参照系 S 和 S′ 。假设 S′ 系相对于 S 系做匀速直线运动,速度为 V 。设在 t=t′=0 时刻,两个参照系的原点 O 和 O′ 重合,并从该处发射一个光脉冲信号。因此,在时刻 t 时,这个脉冲在 S 系中走过的距离为
L=x2+y2+z2=ct.
同理,它在 S′ 系中走过的距离为
L′=x′2+y′2+z′2=c′t′.
根据光速不变假设,我们有 c=c′ 。因此,联合上面两式,我们得到
x2+y2+z2−c2t2=0=x′2+y′2+z′2−c2t′2.
对于这个恒等式,我们可以给出如下的几何解释。引入一个假想的四维空间。令沿着它的四个互相垂直方向的单位向量为 ex 、 ey 、 ez 和 et ,并且,我们将这个四维空间中任何一点的位置向量写作
R=xex+yey+zez+(ict)et.
注意,这里第四个分量(时间分量)为一个虚数。这是与通常的三维向量不同的。仿照通常三维空间中的解析几何学,我们定义四维向量 R 的长度的平方为
R⋅R=x2+y2+z2+(ict)2=x2+y2+z2−c2t2.
这一长度被称为四维长度。我们现在可以说,光脉冲信号在物理空间中的运动可以用四维空间中的一条直线来代表。这条直线上的每一点到原点的四维距离都是零。
相应地,我们可以将两个不同参照系 S 和 S′ 中光脉冲的坐标值 (x,y,z,ict) 和 (x′,y′,z′,ict′) 解释作四维空间中同一点 R 相对两组不同坐标轴 (ex,ey,ez,et) 以及 (ex′,ey′,ez′,et′) 的分量。
这是由于方程告诉我们,在四维空间中,这两组坐标给出的光脉冲点到原点的距离是相同的。而从解析几何中我们得知,它们所对应的坐标系是可以通过空间的旋转联系起来的。这就使得我们有可能找到 (x,y,z,ict) 与 (x′,y′,z′,ict′) 的关系。
为了简单起见,我们假设 S 系相对于 S′ 系的运动速度是沿 ex 方向的。此时,我们可以取 y=y′ 和 z=z′ 。也就是说,我们假设,四维空间的旋转是发生在 x−ict 平面内的。因此,四维空间中任一点 P 的坐标变换可以写作
x′=xcosθ+(ict)sinθ,ict′=−xsinθ+(ict)cosθ,y=y′,z=z′.
这里, θ 是两套坐标系 (ex,ey,ez,et ) 和 (ex′,ey′,ez′,et′ ) 中向量 ex 及 ex′ 之间的夹角。
不难验证,在这种坐标变换下, P 点的四维长度不变。事实上,我们有
x′2+y′2+z′2−(ict′)2=x2+y2+z2−(ict)2=[xcosθ+(ict)sinθ]2+y2+z2+[−xsinθ+(ict)cosθ]2=x2cos2θ+2x(ict)cosθsinθ+(ict)2sin2θ+y2+z2+x2sin2θ−2x(ict)cosθsinθ+(ict)2cos2θ=x2+y2+z2+(ict)2=x2+y2+z2−c2t2.
因此,光脉冲的运动方程在此变换下自动被满足。
现在,我们来看如何通过已知条件定出 θ 的值。为此,我们考虑 S′ 参照系原点 O′ 在 S 系中的运动。首先, O′ 点在 S′ 系的坐标为 x′=y′=z′=0 。而在 S 参照系中,在时刻 t 时,其空间坐标为
x=Vt,y=0,z=0.
因此,对于 O′ 点而言,我们有如下的坐标变换关系
x′=0=xcosθ+(ict)sinθ=Vtcosθ+(ict)sinθ,
ict′=−xsinθ+(ict)cosθ=−Vtsinθ+(ict)cosθ.
从第一个方程,我们解得
−ictx=−icVcosθsinθ=tanθ.
进而,我们有
cosθ=secθ1=1+tan2θ1=1−c2V21,
将这些函数代入方程中,我们得到
x′=xcosθ+(ict)sinθ=1−c2V2x+1−c2V2ict(icV)=1−c2V2x−Vt
ict′=−xsinθ+(ict)cosθ=1−c2V2−x(icV)+ict1−c2V21.
将第二个方程的两边同时除以 ic 后,我们得到
t′=1−c2V2t−xc2V.
这些变换公式和 y′=y,z′=z 一起,被称为 Lorentz 变换公式。从这些公式中,我们可以看到,若要求光速 c 在各个惯性参照系中不变的话,则时间在不同的参照系中是不同的。这一点是与 Galileo 变换非常不一样的。
上面,我们利用光速在各个参照系中不变的假设,导出了 Lorentz 变换公式。对于任何一个四维空间中的点的坐标 (x,y,z,ict) 而言,除了满足光信号的运动方程
R⋅R=x2+y2+z2−c2t2=0
之外,还可能满足
R⋅R=x2+y2+z2−c2t2>0,
或是
R⋅R=x2+y2+z2−c2t2<0.
前者表示,质点在时刻 t=0 时从原点出发,在 t 时刻到达坐标为 (x,y,z) 的三维空间位置。这要求它的速度为
v=t2x2+y2+z2>c.
但是按照 Einstein 狭义相对论的第二条假设,这在物理上是不可能的。这样的点被称为类空点。相反,第二种可能性描写在时刻 t=2 时从原点出发,以小于光速的速率 v 在
t 时刻到达坐标为 (x,y,z) 的三维空间位置的粒子的运动。这在物理上是可以实现的。这类点被称为类时点。而类空点集合与类时点集合是由满足方程的全体点的集合(代表光信号的全部可能轨迹,被称为光锥面)隔开。
在讨论 Lorentz 变换所导致的一些结果之前,我们要强调一下,四维时空中任何一点的位置向量 R 的模
R⋅R=x2+y2+z2−c2t2
在 Lorentz 变换下都是不变的。今后我们会看到,在适当引入的动量 - 能量向量以及所谓四维力向量的模也具有这样的性质。它们被统称为四维向量(或四维矢量)。今后,我们会看到,四维矢量的概念是非常有用的。
现在,让我们回过头来看一下 Lorentz 变换带来的结论。首先,我们从公式
t′=1−c2V2t−xc2V
出发。将此式的两边对于 t 求导后,我们有
dtdt′=1−c2V21−c2xV=1−c2V21−c2vxV.
由此,我们可以导出同一个运动的质点在 S 系和 S′ 系中速度之间的变换关系。例如,我们有
vx′=dt′dx′=dtdx′dt′dt=1−c2vxVvx−V=1−c2V21−c2vxVvx−V.
同理,我们可得
vy′=dt′dy′=vy1−c2vxV1−c2V2,vz′=dt′dz′=vz1−c2vxV1−c2V2.
从表面上看,这些变换公式与我们已经熟知的 Galileo 变换公式
vx′=vx−V;vy′=vy,vz′=vz
非常不同。但是,在 cV→0 的极限下,可以很容易地看到,Lorentz 速度变换公式退化到 Galileo 速度变换公式。
作为一个特例,让我们考虑光在两个参照系中的运动。设在 S 系中,光沿 x 轴运动。因此,我们有 vx=c,vy=0 及 vz=0 。将之代入 Lorentz 速度变换公式后,我们立刻可得
vy′=vz′=0
以及
vx′=1−c2cVc−V=1−cVc−V=cc−Vc−V=c.
也就是说,光在 S′ 系中的速度也是 c 。这就使得 Einstein 的光速不变假设成为自洽。
Lorentz 变换的另一个直接推论是所谓时间延缓效应。假设我们有一个在 S′ 系中静止的时钟同该系一起相对于 S 系运动,并且其在 S′ 参照系中的坐标为 x′=x0′ 。则时钟在两个参照系的读数满足变换关系
t=1−c2V2t′+c2Vx0′.
特别是相对于 S′ 系的时间间隔 Δt′=t2′−t1′ 对应于 S 系中的时间间隔
Δt=t2−t1=1−c2V2t2′+c2Vx0′−1−c2V2t1′+c2Vx0′=1−c2V2Δt′.
由于
1−c2V21>1,
故我们有
Δt>Δt′.
也就是说,在时钟静止的参照系中,其读数相对于其它惯性系而言总是最小的。这一效应称为时间延缓。它是可以通过实验来检验的。
Part 2 相对论动力学
· 质能方程
根据 Einstein 的狭义相对性原理,所有的物理定律或运动方程在等价的惯性系中都应该具有相同的表达形式。另外一方面,我们现在又知道,不同惯性系中的空间和时间坐标是通过 Lorentz 变换联系起来的。
而这一变换不改变相应的四维向量的点乘。因此,一个很自然的想法是,所有的运动方程都应该写成两个四维向量的内积的形式。
为了实现这一想法,首先我们看如何改写动量的定义。在三维空间中,一个质点的动量被定义为
p=m0v=m0dtdr.
这里, m0 应被理解为质点的固有质量,即它在与其一起运动的参照系中的静止质量。由于时间间隔 dt 不是一个 Lorentz 变换下的不变量,我们必须找一个具有时间量纲的 Lorentz 变换下的不变量来替换它,以构成一个 Lorentz 协变的四维动量(既其内积在 Lorentz 变换下不变)。实际上,我们可以去如下的量来代替 Δt 。
Δτ=c1Δs=c1c2(Δt)2−(Δx)2−(Δy)2−(Δz)2
=c1c2(t2−t1)2−(x2−x1)2−(y2−y1)2−(z2−z1)2.
显然,这是一个在 Lorentz 变换下不变的量。其次,在空间同一点处 (x1=x2,y1=y2,z1=z2) ,我们有
Δτ=(Δt)2=Δt.
因此,它的确是具有时间量纲的量,被称为质点的固有时间。
现在,我们可以重新引入动量的空间分量为
px=m0dτdx=m0cdsdx=c2(dt)2−(dx)2−(dy)2−(dz)2m0cdtdx
=c2−v2m0cdtdx=1−c2v2m0vx,
以及
py=1−c2v2m0vy,pz=1−c2v2m0vz.
为了构造四维动量的第四个分量,我们仿照上面的定义。令 x1=x,x2=y,x3=z 和 x4=ict ,则我们有
p4=m0dτdx4=m0cc2dt2−dr2d(ict)=m01−c2v2icdtdt=i1−c2v2m0c=icE.
这里,物理量
E=1−c2v2m0c2
具有能量量纲,称为质点的能量。
上面的动量表达式看起来有点怪异,但实际上在低速极限 cv∼0 下,我们有
px≈m0vx,py≈m0vy,pz≈m0vz,
即牛顿力学中的表达式。更为重要的是,我们有
p12+p22+p32+p42=1−c2v2m02c2−1−c2v2m02c2=m021−c2v2v2−c2=m02c2c2−v2v2−c2=−m02c2.
由于光速不变假设,这显然是一个在 Lorentz 变换下不变的量。因此,我们找到了四维协变动量的正确表达式。
从四维协变动量的表达式出发,我们可以得到如下的结论。
(1) 如果坚持使用牛顿力学中的动量表达式
px=mvx,py=mvy,pz=mvz,
则质点的质量 m 应该被写作
m=1−c2v2m0>m0.
换句话说,一旦质点运动起来,其表观质量 m 应该大于其静止质量 m0 。
(2) 我们看到,质点的能量 E 是以形式
E=1−c2v2m0c2
形式出现的。这与我们过去所熟知的质点能量的表达式非常不一样。在低速运动的极限下,前者是否可以退化为后者呢?
实际上,当 v≪c 时,我们可以利用 Taylor 展开的表达式
1−c2v21≈1+21c2v2+O(c4v4)
近似得到
E=1−c2v2m0c2≈m0c2(1+21c2v2)=m0c2+21m0v2.
公式的第二项是我们熟知的牛顿力学中质点动能的表达式。而第一项则是牛顿力学中未曾出现过的,称为质点的静止能。因此,在相对论力学中,能量守恒应该被表述为
E=i=1∑N1−c2vi2mic2+Q=Const.
在低速度近似下,我们可以将其近似地写作
E=i=1∑Nmic2+21i=1∑Nmivi2+Q=Const.
这一公式的一个直接推论是,若在某种物理过程前后,体系中的粒子的总静止能减少了,则粒子的总动能或内能必然增加。这是今天核发电以及核武器的基本原理。
· 动量关系
当一个质子与一个中子结合成一个氘核时,质量亏损为
ΔM0=Mproton+MNeutron−Mtritium;=(1.6726231+1.6749286−3.3435860)×10−27 kg=3.9657×10−30 kg.
按照质-能关系,它相当于
ΔE=ΔM0c2=3.9657×10−27g×(3×1010)2=3.9657×9×10−7erg
的能量被释放出来。换算成公斤 - 米 - 秒制,它大致等于 3.9657×10−13 焦耳。因此,形成一克分子氘所释放出来的能量大约为
E=3.9657×10−30×6×1023≈24×1010J.
考虑到,一颗爆竹所释放的能量大约为 104 焦耳。因此,形成 3 克氘过程中释放的能量大约为 107 颗爆竹的能量。这是一个相当巨大的数字。
从公式
E=1−c2v2m0c2,p=1−c2v2m0v
出发,我们可以得到如下的质点动量与速度之间的关系
v=Epc2.
与恒等式
p2−c2E2=−m02c2,
或是
E2=p2c2+m02c4
一起构成了相对论性质点动力学的基础。由此得到的一个直接推论是,自然界可能存在质量为零 ( m0=0 ) 的粒子。此时,上面的公式化为
E2=p2c2,
或是
E=pc.
因此,我们有
v=Epc2=pcpc2=cpp=cep.
也就是说,这种粒子的速度与光速相同。另一方面,若一个质点的静止质量不为零,则其速率满足方程
∣v∣=E∣p∣c2=p2c2+m02c4pc2<p2c2pc2=pcpc2=c.
也就是说,其速率永远小于光速。
今天,我们知道,静止质量为零的粒子有光子、中微子以及引力子。
由于 (px,py,pz,icE) 与 (x,y,z,ict) 一样构成了一个四维动量向量,故在 Lorentz 变换下,它们具有相同的变换规律。因此,我们可以立刻写出
px′=1−c2V2px−cVE=1−c2V2px−cVE,py′=py,pz′=pz,
以及
E′=1−c2V2E−Vpx.
这里, (px,py,pz,icE) 和 (px′,py′,pz′,icE′) 分别同一个质点的四维动量向量在 S 系和 S′ 系中的分量。而 S′ 系相对 S 系以匀速 V 沿 x -轴的方向运动。
现在,我们来看一看,在狭义相对论中,牛顿运动方程应该做怎样的修改。牛顿第二定律告诉我们,质点的运动满足方程
dtdp=f.
这一方程显然在 Lorentz 变换下不是协变的。为了将它改写成协变的形式,我们可以引入所谓四维力 (f~1,f~2,f~3,f~4) 。
在一个给定的惯性参照系中,我们要求 f~1,f~2 和 f~3 与作用在质点上的外力在与该参照系相连接的坐标系中的投影 fx,fy 和 fz 分别成正比,而 f~4 则由这一四维力的长度在 Lorentz 变换下不变这一条件来决定。相应地,我们应将牛顿方程改写为
dτdp1=c1dsdp1=f~1
的形式。这样以来,质点的运动方程就成为 Lorentz 变换下协变的了。具体写出来,我们有
f~x=c1dsdpx=c2dt2−(dx)2−(dy)2−(dz)2cdpx=dtdpx1−c2v2dt=1−c2v2fx.
在推导的最后一步,我们利用了在给定惯性系下的牛顿方程
dtdpx=fx.
同理,我们有
f~y=1−c2v2fy,f~z=1−c2v2fz.
现在,我们来决定四维力的第四个分量 f~4 。按照定义,我们
f~4=c1dsdp4=1−c2v2c1dtdE=icE˙1−c2v21.
为了检验这样定义的四维力在物理上是否有意义,让我们考察它和四维动量的内积。按照定义,我们有
i=1∑4pif~i=i=1∑4c1dsdpi=(1−c2v2)2m0fxvx+m0fyvy+m0fzvz−m0c2cE˙=1−c2v2m0(f⋅v−m0E˙).
另一方面,我们可以很容易地验证,这一公式的左边应该恒等于零。实际上,我们有
i=1∑4pic1dsdpi=i=1∑421c1dsdpi2=i=1∑421c1dsd(−m02c2)≡0.
也就是说,
i=1∑4pif~i=i=1∑4c1dsdpi=(1−c2v2)2m0fxvx+m0fyvy+m0fzvz−m0c2cE˙=1−c2v2m0(f⋅v−m0E˙).
右边表达式的分子应该为零。即我们有
m0(f⋅v−m0E˙)=0,
或是
f⋅v=dtdE.
也就是说,外力所做之功的功率,等于质点能量随时间的改变率。这与我们以前的结论是完全一致的。
更新日志
2025/11/27 12:23
查看所有更新日志
19310-physics-7于5551e-physic于