怎样用最简单的方法介绍相对论？有知道答案的吗？

2021-12-25 16:03:58

文章来源：本站

　　导读：本文摘自独立学者灵遁者物理宇宙科普书籍《变化》。旨在帮助大家了解物理宇宙科普知识。

　　再来说说爱氏广义相对论的建立：

　　1905年，爱因斯坦发表了关于狭义相对论的第一篇文章后（即《论动体的电动力学》），并没有立即引起很大的反响。但是德国物理学的权威人士普朗克注意到了他的文章，认为爱因斯坦的工作可以与哥白尼相媲美，正是由于普朗克的推动，相对论很快成为人们研究和讨论的课题，爱因斯坦也受到了学术界的注意。

　　1912年，爱因斯坦在联邦工业大学当上了教授，1913年，应普朗克之邀担任新成立的威廉皇帝物理研究所所长和柏林大学教授。

　　在此期间，爱因斯坦在考虑将已经建立的相对论推广，对于他来说，有两个问题使他不安。

　　第一个是引力问题，狭义相对论对于力学、热力学和电动力学的物理规律是正确的，但是它不能解释引力问题。牛顿的引力理论是超距的，两个物体之间的引力作用在瞬间传递，即以无穷大的速度传递，这与相对论依据的场的观点和极限的光速冲突。

　　第二个是非惯性系问题，狭义相对论与以前的物理学规律一样，都只适用于惯性系。但事实上却很难找到真正的惯性系。从逻辑上说，一切自然规律不应该局限于惯性系，必须考虑非惯性系。

　　狭义相对论很难解释所谓的双生子佯谬，该佯谬说的是，有一对孪生兄弟，哥在宇宙飞船上以接近光速的速度做宇宙航行，根据相对论效应，高速运动的时钟变慢，等哥哥回来，弟弟已经变得很老了，因为地球上已经经历了几十年。而按照相对性原理，飞船相对于地球高速运动，地球相对于飞船也高速运动，弟弟看哥哥变年轻了，哥哥看弟弟也应该年轻了。这个问题简直没法回答。实际上，狭义相对论只处理匀速直线运动，而哥哥要回来必须经过一个变速运动过程，这是相对论无法处理的。正在人们忙于理解相对狭义相对论时，爱因斯坦正在继续完成广义相对论。

　　1907年，爱因斯坦撰写了关于狭义相对论的长篇文章《关于相对性原理和由此得出的结论》，在这篇文章中爱因斯坦第一次提到了等效原理，此后，爱因斯坦关于等效原理的思想又不断发展。

　　他以惯性质量和引力质量成正比的自然规律作为等效原理的根据，提出在无限小的体积中均匀的引力场完全可以代替加速运动的参照系。爱因斯坦并且提出了封闭箱的说法：在一封闭箱中的观察者，不管用什么方法也无法确定他究竟是静止于一个引力场中，还是处在没有引力场却在作加速运动的空间中，这是解释等效原理最常用的说法，而惯性质量与引力质量相等是等效原理一个自然的推论。

　　直到1915年11月，爱因斯坦先后向普鲁士科学院提交了四篇论文，在这四篇论文中，他提出了新的看法，证明了水星近日点的进动，并给出了正确的引力场方程。至此，广义相对论的基本问题都解决了，广义相对论诞生了。

　　1916年，爱因斯坦完成了长篇论文《广义相对论的基础》，在这篇文章中，爱因斯坦首先将以前适用于惯性系的相对论称为狭义相对论，将只对于惯性系物理规律同样成立的原理称为狭义相对性原理，并进一步表述了广义相对性原理：物理学的定律必须对于无论哪种方式运动着的参照系都成立。

　　爱因斯坦的广义相对论认为，由于有物质的存在，空间和时间会发生弯曲，而引力场实际上是一个弯曲的时空。爱因斯坦用太阳引力使空间弯曲的理论，很好地解释了水星近日点进动中一直无法解释的43秒。广义相对论的第二大预言是引力红移，即在强引力场中光谱向红端移动，20年代，天文学家在天文观测中证实了这一点。

　　灵遁者物理宇宙科普书籍《变化》电子版在灵遁者淘宝有。

　　广义相对论的第三大预言是引力场使光线偏转，最靠近地球的大引力场是太阳引力场，爱因斯坦预言，遥远的星光如果掠过太阳表面将会发生一点七角秒的偏转。1919年，在英国天文学家爱丁顿的鼓动下，英国派出了两支远征队分赴两地观察日全食，经过认真的研究得出最后的结论是：星光在太阳附近的确发生了一点七角秒的偏转。

　　英国皇家学会和皇家天文学会正式宣读了观测报告，确认广义相对论的结论是正确的。会上，著名物=理学家、皇家学会会长汤姆孙说：“这是自从牛顿时代以来所取得的关于万有引力理论的最重大的成果”，“爱因斯坦的相对论是人类思想最伟大的成果之一”。

　　爱因斯坦一下子成了新闻人物，他在1916年写了一本通俗介绍相对论的书《狭义与广义相对论浅说》，到1922年已经再版了40次，还被译成了十几种文字，广为流传。

　　爱氏相对论的意义，对于我们而言应该永远铭记和传授给下一代：

　　狭义相对论和广义相对论建立以来，已经过去了很长时间，它经受住了实践和历史的考验，是人们普遍承认的真理。

　　相对论对于现代物理学的发展和现代人类思想的发展都有巨大的影响。相对论从逻辑思想上统一了经典物理学，使经典物理学成为一个完美的科学体系。狭义相对论在狭义相对性原理的基础上统一了牛顿力学和麦克斯韦电动力学两个体系，指出它们都服从狭义相对性原理，都是对洛伦兹变换协变的，牛顿力学只不过是物体在低速运动下很好的近似规律。

　　广义相对论又在广义协变的基础上，通过等效原理，建立了局域惯性场与普遍参照系数之间的关系，得到了所有物理规律的广义协变形式，并建立了广义协变的引力理论，而牛顿引力理论只是它的一级近似。这就从根本上解决了以前物理学只限于惯性系的问题，从逻辑上得到了合理的安排。

　　相对论严格地考察了时间、空间、物质和运动这些物理学的基本概念，给出了科学而系统的时空观和物质观，从而使物理学在逻辑上成为完美的科学体系。

　　狭义相对论给出了物体在高速运动下的运动规律，并提示了质量与能量相当，给出了质能关系式。这两项成果对低速运动的宏观物体并不明显，但在研究微观粒子时却显示了极端的重要性。因为微观粒子的运动速度一般都比较快，有的接近甚至达到光速，所以粒子的物理学离不开相对论。质能关系式不仅为量子理论的建立和□发展创造了必要的条件，而且为原子核物理学的发展和应用提供了根据。

　　对于爱因斯坦引入的这些全新的概念，当时地球上大部分物理学家，其中包括相对论变换关系的奠基人洛仑兹，都觉得难以接受。甚至有人说“当时全世界只有两个半人懂相对论”。旧的思想方法的障碍，使这一新的物理理论直到一代人之后才为广大物理学家所熟悉，就连瑞典皇家科学院，1922年把诺贝尔物理学奖授予爱因斯坦时，也只是说“由于他对理论物理学的贡献，更由于他发现了光电效应的定律。”对爱因斯坦的诺贝尔物理学奖颁奖辞中竟然对于爱因斯坦的相对论只字未提。（注：相对论没有获诺贝尔奖，一个重要原因就是还缺乏大量事实验证。）

　　各位，以上就是关于爱氏狭义和广义相对论创立的过程，爱氏完成了他的工作。但对于这个工作，我们相信，它还有值得被理解和完善的部分。引力不能量子化的问题，就是其中一个。我自己在《变化》里也写出了我的看法。在解释广义相对论的过程中，出现了问题。即引力不是时空弯曲的几何表现，引力的本源是时空！和弯曲没有关系。具体内容请看《引力的本源》一文。大家永远记住，我们的问题永远没有最后一个！我们要走的路，也很长很长。

　　摘自独立学者灵遁者物理宇宙科普书籍《变化》

　　几何语言解释相对论最简单，下面我们从闵氏几何的角度来看一下狭义相对论。

　　1905年，爱因斯坦正式提出了狭义相对论；1908年，闵可夫斯基给出了狭义相对论的几何表述，也就是我们这里说的闵氏几何。爱因斯坦一开始对这套几何语言很反感，认为这些纯数学上的“花架子”没什么用，还增加了相对论的复杂度。但是，他很快就发现闵氏几何非常重要，发现这绝不是什么纯数学技巧，而是有着深刻物理内涵的洞见。而且，如果要建立广义相对论，少了它根本不行。

　　几何语言清晰直观，在处理许多问题时有很大的优势，这在双生子佯谬里体现得非常明显：使用代数语言，使用洛伦兹变换去处理双生子佯谬，其中难度之大思维之绕，绝对是对智商极大的考验；而使用几何语言，这个问题就简单得不像是个问题。然而，目前绝大部分介绍相对论的书籍文章还是使用的代数语言，所以你还是能经常看到许多人在一些非常简单的问题上纠缠不清，争论不休。

　　梁灿彬老师说他上世纪80年代从“言必称几何”的芝加哥大学回来以后，就一直在国内大力推广相对论的几何语言，但是不明白为啥过了三十多年大众对它还是很排斥。长尾科技就在这篇文章里跟大家好好聊一聊，希望能够解开大家跟闵氏几何之间的心结。

　　因为这是从零开始的一篇文章，所以我暂时就只谈相对论里最简单的几何语言，也就是狭义相对论里的闵氏几何。至于广义相对论里涉及的黎曼几何，我们后面再说。

　　了解相对论的人大多知道一点闵氏几何，知道我们可以通过画时空图的方式来解决一些很复杂的问题，但是他会觉得闵氏几何很难：把时空图画出来很难，画出来之后去解释时空图更◆难。当看到别人对着时空图“轻而易举”地把问题解决了，他心里没底。他无法理解为什么你说时空图里的这个代表了相对论的里的那个，为什么你对时空图里的一些点、线、面做这样的处理就对应着相对论里的那个问题。所以，他觉得你在时空图里做的那些几何操作非常“虚”，他不理解这些几何背后的实质，自然会觉得很难。

　　然而，这不该是几何该给我们留下的印象啊。我们平常接触的几何，一个点、一条线、一个正方形、一个圆，这些都是我们日常生活里一些形状的完美投射，它们非常的实在，一点都不虚。很多在代数上不好理解的东西，我们把它画到几何图形上一下子就理解了。几何原本就应该比代数更加简单直观，但是为什么到了相对论这里，大家反而觉得几何语言更加难以接受了呢？原因就是狭义相对论里使用的几何并不是我们熟知的欧式几何，而是一种全新的闵氏几何，当我们把欧式几何里的一些习惯和常识代入进来的时候，自然会引起各种水土不服。

　　所以，这里我们先不谈闵氏几何和欧式几何的具体区别，我们先来看看狭义相对论是怎么和闵氏几何对上眼了的。为什么狭义相对论不用欧式几何来描述，而非得使用一个我们不熟悉的闵氏几何呢？这个问题不清楚，讲再多闵氏几何的性质也是白搭。

　　为什么狭义相对论要使用我们不熟悉的闵氏几何，原因当然还是得从自身来找。大家都知道狭义相对论有两条基本假设：相对性原理和光速不变。从这两个假设出发我们可以很自然的推导出狭义相对论里各种奇奇怪怪的结论，这里我们先来审查一下这两个假设。

　　相对性原理说物理定律在所有的惯性参考系里都是平等的，不存在一个特殊的惯性系。这一点很自然，伽利略很早就发现这点了，他意识到一个人在一个匀速移动（惯性系）的密闭船舱里根本无法区分这艘船到底是静止的还是以某个速度匀速运动。无法区分的意思就是这两个参考系（静止和匀速运动）是平等平权的，否则，你就应该有办法把它们区分开。

　　不同的是：伽利略只敢给力学定律打包票，他只敢说我们无法用力学实验区分两个惯性系，其他定律（比如电磁学实验）能不能区分惯性系他就不敢说了。爱因斯坦说你不敢打包票我来，我打赌所有的物理定律（力学的也好，电磁学或者其他的也好）都无法区分惯性系，你在船舱里做什么实验都也无法区分这艘船是静止的还是匀速运动的。

　　从这里我们可以感觉到，相对性原理好像并没有那么反常识，它只是把伽利略的那套相对性原理的适用范围给扩大了。那么，狭义相对论里那么多结论的“诡异”似乎就应该来自另外一个假设，也就是光速不变。

　　光速不变说真空中的光速在所有的惯性系里都是一样的。不论你在哪个惯性系（注意一定要是惯性系，非惯性系里光速就没人管它了）里测量光速，在静止的地面也好，飞速的火车飞船里测也好，测得的光速都是一个定值c。

　　这就太反常识了，怎么能够在不同的参考系里测量同一个物体的速度都相同呢？比如，在一辆速度为300km/h的高铁上，有一个人以5km/h的速度朝车头走去。那么，高铁上的人会觉得他的速度是5km/h，而地面的人会觉得他的速度是300+5=305km/h，这两个速度肯定是不一样的。但是，如果我把这个人换成一束光，让这束光射向车头，光速不变就是说不管你是在高铁上测量，还是在地面上测量，这束光的速度都是c。你以为在地面上测量的光速应该是c+300km/h么？对不起，并不是这样。

　　你觉得这个事诡异么？诡异！为什么会这样呢？不知道，光速不变是狭义相对论的一个基本假设，这个类似数学里的公理，我们只能假设它是对的，但是却无法证明它是对的，它的可靠性由实验保证。其实，这个事情很多人还是知道的，但是，大多数人并不知道如果我们再深挖一下光速不变原理的秘密，我们就能找到一条通向闵氏几何的隐秘通道。

　　光速不变说你在任何惯性系中测量光速，得到的结果都是c，我们来定量的分析一下这个原理。

　　假设我们在K系里测量一束光，假设这束光在Δt的时间内走了Δl的距离，那么显然就有Δl=Δt×c。如果我们把这束光在x，y，z三个坐标轴方向移动距离的分量记为Δx，Δy，Δz，那么根据勾股定理就有：Δl2=Δx2+Δy2+Δz2，再把这两个式子合起来就能得到：Δx2+Δy2+Δz2-（Δt×c）2=0。如果这时候我们用一个新的量Δs2表示左边的东西，那么就有Δs2=Δx2+Δy2+Δz2-（Δt×c）2=0。

　　好，事情发展到这里，一切都非常容易理解，上面的事情倒腾来倒腾去就是一束光在空间里走了一段距离，然后套用了小学生都知道的距离等于速度乘以时间而已。而且，大家也会发现这个事跟光速不变也没有什么关系，你就是把上面的光换成一颗子弹，把光速c换成子弹的速度，那么上面的一切推理都还是那样的。没错，因为光速不变说的是光速在不同的惯性系里都一样，那么我们还得再考察一个惯性系。

　　还是上面那束光，我们这次在另一个参考系K’里对它进行测量。假设我们测量的结果是它在Δt’的时间内走了Δl’，我们同样对这个距离做一个分解，假设它在x，y，z三个坐标轴方向移动距离的分量记为Δx’，Δy’，Δz’。根据光速不变原理，光在这个参考系里的速度还是c，那么，按照上面的逻辑，我们依然可以得到Δs’2=Δx’2+Δy’2+Δz’2-（Δt’×c）2=0。

　　当我们把K和K’这两个参考系了的结果拿来对比的时候，光速不变原理带来的反常效应就出现了：大家有没有发现Δs和Δs’的表达式的形式完全一致，而且值还相等（都等于0）？

　　我们只是把K系里测量的时间和距离全都换成了K’系里测量的时间和距离，其它的东西我们一概没动。而在牛顿力学里，Δs和Δs’的表达式形式是不一样的，因为牛顿力学里另一个惯性系的测量速度会加上两个参考系之间的相对速度。也就是说在牛顿体系里，在K’系里测量的光速应该是c加上两个参考系的相对速度，这样Δs’的形式就Δs跟不完全一样了，而相对论是用光速不变强制保证了它们的形式一致。

　　这一点大家好好想一想，它并不难理解，但是却是后面的关键。我们现在等于说是定义了一个Δs，对于光来说，这个Δs的值在不同的参考系里是相等的，刚好都是0。

　　那么，重点来了：如果我把这个Δs从光推广到所有物体，我仍然从两个不同的惯性系K和K’去测量这个物体在空间上运动的距离Δx、Δy、Δz和时间上经过的间隔Δt，然后一样把它们组合成Δs和Δs’。那么，这个物体的Δs和Δs’之间有没有什么关系呢？它们是不是还跟光的Δs和Δs’一样相等并且都等于0呢？

　　是否等于0很好回答，一看就知道肯定不等于0。假设博尔特1秒钟跑10米，那么Δt=1、Δx=10，不考虑另外两个维度（Δy=Δz=0），看看Δs2的表达式：Δs2=Δx2+Δy2+Δz2-（Δt×c）2=100+0+0-（1×3×10^8）2，这显然是个非常大的负数。那么问题的关键就落在在惯性系K和K’里测量的这两个值Δs和Δs’是否相等，也就是说，如果博尔特在跑步，我们从地面和火车上测量得到的 Δs和Δs’是否相等？

　　这个答案我直接告诉大家：一样！

　　这个证明过程其实也非常简单，这不就是同一个事件看它在不同的惯性系里是否满足某个式子么？同一个事件在不同惯性系下变换关系，在相对论里这不就是洛伦兹变换的内容么？所以，你直接用洛伦兹变换去套一下Δs和Δs’，你很简单就能发现它们是相等的，这里我就不做具体计算了，当作课后习题。

　　所以，我们通过分析就得到了这样一个结论：在相对论里，不同惯性系里测量一个物体的位移、时间等信息可能不一样，但是它们组合起来的Δs2=Δx2+Δy2+Δz2-（Δt×c）2确是相等的，而这个值对光来说还刚好就是0。

　　注意了，这个结论极其重要，正是它决定了为什么我们要使用闵氏几何来描述狭义相对论，甚至，从某种角度来说，它几乎包含了闵氏几何里的全部奥秘。为了让大家更好地了解这个结论背后的意义，我们先去看一看欧式几何里的类似情况。

　　在欧式几何里也有一些量是不随坐标系的变化而变化的，比如最简单的线段的长度。

　　在二维的欧式几何里，我们假设在一个直角坐标系里有两点A（x1，y1）、B（x2，y2），令Δx=x2-x1，Δy=y2-y1，那么，利用勾股定理就能非常容易的算出AB之间的距离Δl2=Δx2+Δy2。这时候我们如果在建一个新的直角坐标系，在这个新的坐标系里原来A、B两点的坐标变成了A（x1’，y1’）、B（x2’，y2’），同样令Δx’=x2’-x1’，Δy’=y2’-y1’，AB之间新的距离Δl’2=Δx’2+Δy’2。这时候我们可以很轻松的验证Δl=Δl’，也就是说Δx2+Δy2=Δx’2+Δy’2。

　　这个结论一点都不奇怪，我们都可以很直观的感觉到，为什么呢？因为欧式几何就是我们日常熟悉的空间啊，我们现在就假设有一跟2米长的尺子AB，我在一个直角坐标系里计算它的长度的平方Δl2=Δx2+Δy2=22=4，难不成我在另一个坐标系里算得它的长度的平方Δl’2=Δx’2+Δy’2还能不等于4么？我这把尺子的长度是一定的，如果我在不同坐标系下得到尺子的长度却不一样了，那还了得，那这几何就有问题了。

　　因此，在欧式几何里，Δl2=Δx2+Δy2也是一个坐标系不变量，这个值不随你取坐标系的变化而变化。很显然的，如果把欧式空间从二维推广到三维，那么这个不变量自然就可以写成Δl2=Δx2+Δy2+Δz2；推广到四维，我们用t表示第四个维度，那么Δl2=Δx2+Δy2+Δz2+Δt2，再往上推广几维，我就加几个分量就行了。

　　大家肯定注意到了：在欧式几何里，不随坐标系变化的是Δl2=Δx2+Δy2+Δz2+Δt2，而我们上面在讲狭义相对论的时候，不随惯性系变化的量Δs2=Δx2+Δy2+Δz2-（Δt×c）2。这两者非常的相似，这个光速c是个常数，可以不用考虑，为了方便计算我们甚至可以直接约定c=1，这样的话Δl2和Δs2的差别就仅仅只差一个Δt前面的负号而已。

　　那么，这种形式上的相似和那个负号的差别到底意味着什么呢？毕竟它们一个代表的是不随惯性系的变化而变化的量（Δs2），一个代表的是欧式几何里不随坐标系的变化而变化的量（Δl2），一个是物理量，一个是几何量，好像并没有直接的关系。但是，我们这样想想：如果我想用一种几何来描述狭义相对论里Δs2=Δx2+Δy2+Δz2-（Δt×c）2不随惯性系的变化而变化的这种性质，我们肯定就不能选欧式几何了（因为欧式几何里不随坐标系变化的量是Δl2=Δx2+Δy2+Δz2+Δt2）。所以我们需要一种新的几何，在这种新几何里，不随坐标系变换而变化的量是类似Δs2这样带有一个负号的量，这种全新的几何自然就是闵氏几何。

　　你这时候心里可能有点疑惑：我们真的可以只凭借不随参考系变化的量是Δs2和Δl2，就断定这是两种不同的几何么？Δs2和Δl2这些东西到底意味着什么？或者说，到底是什么决定了一种几何？

　　我们从小就在学习欧式几何，我们学习直线、三角形、圆等很多几何图形，我们关心它们的各种性质，比如两点的距离、曲线的长度、两条线的夹角、一个图形的面积。但是，大家有没有想过：在欧式几何的各种各样的性质里，有没有哪个是最基本的？也就是说，我们能不能只定义这个最基本的量，其他的各种量都可以从这个量里衍生出来？这样的话，我们就只需要抓住这一个最基本量的性质，就可以抓住这种几何的性质了。

　　答案是：有，这个最基本的量就是弧长，准确地说是组成任意曲线、弧线的基本元段长。

　　要把这个说清楚，我们这里得稍微引入一丢丢微积分的思想，别慌，这个很容易理解的~在欧式几何里，我们很容易求一根线段的长度（直角坐标系里利用勾股定理就行了），但是，如果要你求一条任意曲线的长度呢？

　　比如上图的曲线AB，这是随手画的很一般的一条曲线，不是什么特殊的圆弧，你要怎么求它的长度呢？数学家们是这么考虑的：我在曲线AB之间取一些点，比如P1、P2、P3，然后这三个点就把这段圆弧的分成了四个部分。我们用线段把这几个点连起来，这样我们就得到了一条折线，这时候我们就用折线的长度（也就是这四条线段的和AP1+P1P2+P2P3+P3B）来近似代替曲线AB的长度。当然，你肯定会说，曲线的长度明显比这四条线段加起来更长啊，你怎么能用折线的长度来代替曲线呢？

　　是的，如果你只在AB之间取三个点，那么曲线AB的长度肯定要比折线的长度多很多，这样近似的误差很大。但是，如果我再多取一些点呢？我在AB之间取十个、一百个甚至一千一万个点，那么，这成千上万条线段组成的折线的总长度跟曲线AB比呢？当然，还是会短一些，但是，你可以想象，这时候这些折线已经跟曲线AB非常接近了。如果一根1米长的曲线被你分成了1万条线段，这时候你用肉眼根本分辨不出来这是原来的曲线还是折线。但是你内心还是知道折线要短一些，那么接下来就是重点了：如果我在曲线AB之间放无穷多个点呢？

　　无穷是一个很迷人，同时也很迷惑人的词汇。从上面的分析我们知道：当我们在曲线AB里放越多的点，这些小线段连起来的折线就越接近曲线AB本身。那么，当我们放了无穷多个点的时候，这无穷多个线段组成的折线是不是就应该等于曲线AB的长度了？答案是肯定的，而这，就是微积分最朴素也是最核心的思想。

　　在这种思想的指导下，我们要求任意曲线的距离，最终还是要求小线段的距离，因为无穷多个小线段累加起来的长度就是曲线的长度。因此，我们只要知道如何求无穷小的线段的长度，我们就能用微积分的思想求出任意曲线的长度，我们把这个最基本小线段称为曲线的一个元段长，记做dl。

　　在欧式几何里，我们把基本元段dl在坐标系里分解一下，用dx和dy表示dl在x轴和y轴上的分量，那么根据勾股定理就有dl2=dx2+dy2，我们就把dl2称之为线元。

　　提炼出了线元这个概念以后，我们就可以开始反推了。在任何一种几何里，如果我们确定了线元，就等于知道了元段dl的长度，然后就可以利用上面微积分的思想求任意一段曲线的长度。那么，接下来，我们会发现几何里的其他性质都可以按照这些定义。比如，我们就可以把两点之间的距离定义为这两点之间所有可能的曲线里最短的一条，把两条直线的夹角定义为弧长和半径的比值（想象在一个圆里，半径固定，弧长越大角度越大），其他什么面积、体积之类的几何性质就都可以根据这些基本性质来定义。

　　最后，你会发现只要给定了一个线元，我们就能把它所有的几何性质都确定下来，也就是说：线元决定几何。

　　那么，什么是欧式几何呢？欧式几何就是由欧式线元（dl2=dx2+dy2）决定的几何。非欧几何呢？只要你的线元不是欧式线元，那么这个线元决定的几何就是非欧几何。用这种新线元，我们一样可以定义出在这种新几何里的曲线长度、两点的距离、线的夹角等等几何性质。

　　那么，闵氏几何是什么？闵氏几何的线元又是什么呢？

　　答：很显然，闵氏几何就是由闵氏线元决定的几何。闵氏线元是这样的ds2=-dt2+dx2+dy2+dz2，如果只考虑二维闵氏几何的话，那么ds2=-dt2+dx2。

　　闵氏线元（ds2=-dt2+dx2）跟欧式线元（dl2=dx2+dy2）十分相像，它们之间唯一的差别就在于闵氏线元的第一个分量dt2的前面是负号，而欧式线元全部都是正号。也因为如此，闵氏几何跟欧式几何也非常像，所以闵氏几何还有一个称呼，叫伪欧几何。但是，我们也要特别注意这个负号，正是这个负号，决定了闵氏几何和我们熟悉的欧式几何里所有不一样的地方，而这些不一样，恰恰是我们通过闵氏几何来理解狭义相对论的关键。

　　我们现在知道了，所谓的闵氏几何，不过是由闵氏线元ds2=-dt2+dx2+dy2+dz2决定的几何。在这种几何里面，曲线的长度、两点的距离、线的夹角等一切性质都有这个第一项带了一个负号的闵氏线元决定。

　　看看这个闵氏线元ds2=-dt2+dx2+dy2+dz2，再看看我们最开始提到的那个在狭义相对论里不随惯性系的变化而变化的量Δs2=Δx2+Δy2+Δz2-（Δt×c）2，是不是非常像？在相对论里有两种单位制：国际单位制和几何单位制。国际单位制就是我们平常熟悉的那一套单位制，几何单位制就是选择光速c=1，这样可以大大简化在用几何处理相对论问题的难度。采用几何单位制的话，不随惯性系变化的Δs2=Δx2+Δy2+Δz2-Δt2，这就真的跟闵氏线元ds2=-dt2+dx2+dy2+dz2一模一样了。

　　这就是为什么我们要用闵氏几何，而不是欧式几何来描述狭义相对论的根本原因。

　　在牛顿的世界里，时间是绝对的，三维的空间也是绝对的，一根木棒在三维空间里随便怎么变换，随便怎么变换参考系，它在三维空间里的长度是一定的，这个是跟三维的欧式线元对应的（因为三维的欧式线元dt2+dx2+dy2也不随坐标系的变化而变化）。

　　但是，在狭义相对论里，空间不再是绝对的，不再是一成不变的，我们熟悉的尺缩效应不就是说从不同的惯性系里观测同一把尺子，这个尺子的长度是不一样的么？这就是说空间上的“长度”在狭义相对论的不同惯性系里不再是不变量。但是，我们发现如果把时间也考虑进来，把三维空间和一维时间一起组合成四维（w4Q7Rt）时空，那么这个四维时空里的间隔Δs2=Δx2+Δy2+Δz2-Δt2就是不随惯性系的变化而变化的量（这个在前面说过，用洛伦兹变换可以非常方便的证明）。

　　所以，在牛顿的世界里，三维空间是绝对的，他必须保证同一把尺子在不同的三维空间的坐标系里长度是一样的，也就是说在度量三维空间里长度的方式（这个有个更专业的概念叫度规，这里我们知道就行）必须跟坐标系无关，而欧式几何正好有这样的特性，所以牛顿力学的背景是欧式几何。

　　而在狭义相对论里，三维空间并不是绝对的，三维空间里一把尺子的长度在不同惯性系里是不一样的。但是，三维空间和一维时间组成的四维时空是绝对的。四维时空里如果也有这样一把“尺子”，那么这把“尺子”无论从哪个惯性系来看，它的四维“长度”都是一样的。而狭义相对论的这种四维“长度”，或者说我们在四维时空里度量长度的方式，它跟闵氏线元表达式的形式是一样的。也就是说只有在闵氏几何里，狭义相对论的时空间隔才对应于他们几何里的“长度”的概念，所以我们要使用闵氏几何来描述狭义相对论。

　　理解这一段非常的重要，因为只有理解了这个，你才能从根本上把闵氏几何和狭义相对论对应起来。有很多闵氏几何的科普文章里上来就是直接给你画时空图，然后告诉你闵氏几何里的这种图形这个几何性质对应着狭义相对论里的这种概念，这样很多人就感觉难以接受，然后对几何语言产生抵触的心理。

　　好，既然我们打算用闵氏几何来描述狭义相对论，那么肯定就要把狭义相对论里的物理语言翻译成闵氏几何里的几何语言。几何肯定是离不开画图的，在欧式几何里我们经常会画出一个几何图形在空间上的样子，这是空间图。而狭义相对论把时间和空间看作一个整体，它要求我们以同等的地位来看待时间和空间，所以我们需要画出一个事件同时在时间和空间里的样子，这种图就叫时空图。

　　在时空图里，你能非常自然地感觉到时间和空间被统一起来了，因为时空图里▲的时间轴和空间轴有着完全的平等的地位。

　　在时空图里，一个粒子现在在哪，你找到它的空间坐标（x，y，z），记下现在的时间t，那么你就得到了它的时空信息（x，y，z，t），那这个时空信息就对应时空图里的一个点，这就叫时空点。

　　同样的，你再记下它下一个时刻t1的位置（x1，y1，z1），那么它又对应了坐标系的另一个点（x1，y1，z1，t1）。所以，一个粒子在任一时刻的时间、空间信息就都对应了时空图里的一个点。那么，如果考察这个粒子的全部历史，你就可以得到一系列的这种时空点，这些点在时空图里就会形成一条线，这条能代表粒子全部历史的线就叫粒子的世界线。

　　现实生活里一个粒子有四个维度（三维空间+一维时间），那么对应的坐标轴应该也是四维的，但是我们在二维平面里勉强可以画出三维图形，对四维图形实在无能为力。为了方便起见，我们假设粒子只沿x轴方向运动，这样我们就可以不考虑y轴和z轴的情况，从而把四维的问题简化为二维，然后我们就可以很愉快的在一张二维的纸上画这二维时空图了。

　　我们先建立一个坐标系，横轴x代表粒子的空间信息，纵轴t代表粒子的时间信息。为了再次简化问题，我们采用几何单位制，也就是取光速c=1，然后我们再来看一些具体问题。

　　问题1：一个静止不动的粒子在时空图里是什么样的？或者说它的世界线是什么样的？

　　这个答案很容易想到，一个粒子静止不动，就是在空间上没动，那么它的x坐标一直为零，但是时间依然在流逝，也就是粒子的时间坐标在一直变大。所以，静止不动的粒子是世界线是一条跟t轴重合，垂直于x轴的直线。

　　问题2：一个匀速向右运动的粒子的世界线是什么样的？

　　这个也不难想象，一个匀速向右运动的粒子，它在时间轴不停往上走的同时，空间轴上也在不停地往右走，那么这个粒子的世界线应该是一条斜直线。问题是，斜多少？是所有的坐标空间它都可以斜，还是有什么限制？这个问题我们先放着，先看看第三个问题。

　　问题3：一条朝右上方45°的斜直线（如下图的L1）代表了什么粒子的世界线？

　　我们先来算一算这个粒子的速度：我们在粒子的世界线L1上取两个点，也就是假设粒子在t1时刻在位置x1，在t2时刻在位置x2。因为这条直线是45°的，所以很显然x2-x1=t2-t1，.那么粒子的速度v=(x2-x1)/(t2-t1)=1。

　　速度等于1是什么意思？我们在画图的时候采用的是几何单位制，也就是取光速c=1(如果我们不采用几何单位制，那么竖轴的单位就不是t，而是ct，本质并没有什么不同)。现在这个粒子的速度等于1，其实就是代表这个粒子的速度是光速，速度是光速那自然就是光子了，那么这条45°斜直线就代表了光子的世界线。

　　从这里我们可以看到，在时空图里，光子的世界线是45°的斜直线。我们也知道在相对论里任何有质量粒子的速度都是小于光速的，那么一个有质量的粒子做匀速直线运动的世界线该是一条什么样的斜直线呢？是在区域1还是区域2？

　　我们可以这样想一下：如果粒子的速度比光速小，那么假设粒子在t1时刻在x1处，那么到了t2时刻它肯定到不了x2地方，那么这两点的连线肯定就在L1的上方，也就是区域1。其实我们也可以想一个极端的粒子，假设这个粒子在原点不动，那么粒子的世界线就是跟t轴重合，粒子速度到达光速就是45°的那条直线，那么速度在静止和光速之间的粒子世界线自然就是在区域1的斜直线了。

　　现在我们知道了这样一个结论：在时空图里，45°的斜直线代表了光子的世界线（如L1），比光子世界线更陡，更加靠近t轴的斜直线（如L2）是有质量粒子匀速直线运动，或者说惯性运动（速度小于光速）的世界线。

　　有了这样的基本认识，我们来用几何语言分析一下狭义相对论里入门教材里必定会碰到的问题：火车闪光问题。这个问题之所以重要，是因为它揭示了同时的相对性，也就是说在一个惯性系看来是同时发生的事件，在另一个参考系里不一定是同时发生的。爱因斯坦敏锐地发现了这点，然后借此从看似牢不可破的牛顿力学里撕开了一道口子。

　　在牛顿力学里，时间是绝对的，所以同时必然也是一个绝对的词汇。在一个参考系看来是同时发生的事件，不管谁来看都绝对是同时发生的，这也是一个非常符合常识的论述。

　　但是，爱因斯坦用一个简单的火车实验就让人们的这个信念坍塌了，这个实验是这样的：假设地面上有一辆匀速运动的火车，在某一个时刻，地面上的观察者发现这个火车的车头和车尾同时被闪电击中。也就是说，对于地面参考系而言，闪电击中车头和车尾这两个事件是同时发生的。但是，爱因斯坦认为在火车参考系里，这两个事件就不是同时发生的。

　　原因也很简单，我们假设在闪电击中火车头尾的时候，在地面这两点的中点有一个观察者。因为两个事件在地面系看起来是同时发生的，所以，站在地面中间的那个观察者肯定会同时看到车头和车尾发过来的闪光，所以这两个事件是同时的。

　　但是，站在火车中间的观察者就不是这样了，因为车头车尾的闪光在向中间传播的时候，火车本身也在前进，所以火车中间的人就会先看到车头发过来的闪光，后看到车尾发过来的闪光。所以，火车上的观察者就会觉得这闪电击中车头和车尾这两个事件不是同时发生的，而是击中车头的先，击中车尾的后。

　　爱因斯坦从这个火车闪光实验出发，发现了同时的相对性，进而打开了狭义相对论的大门。这个实验比较简单，整个逻辑过程也不复杂，但是这样讲不够直观，不够具有普遍性。因为很多人会把这个实验当做一个特例来处理，也就是只有当他们意识到要讲同时的相对性的时候才会想起这个实验，平常就会把这个实验带来的同时的相对性给忘了，然后带来一系列的“相对论诡异疑难”。下面我们从几何语言来看看这个问题，看看如何让这个重要问题更直观，更具有普遍性。

　　我们假设闪电同时击中车头车尾（从地面系观测）的时候，火车的车尾M’、车头N’刚好经过地面的M和N点，P点为地面MN的中点，P’为火车上的中点，我们来看看怎么在时空图上描述这个闪电击中火车的问题。

　　我们先来看看地面上M和N点的世界线，因为M、N在地面上没有动，所以M和N点的世界线都是一条沿着时间轴t竖直向上的直线（空间位置没动，只有时间t在动）。同样的，在MN中间的P点也没动，它的世界线也是一条竖直向上的直线。这三条线好画，那么在火车上的M’、N’和P’，它们都在做匀速直线运动，那它们的世界线是什么样的呢？这个我们上一节刚好说了，做匀速运动的粒子的世界线是一条比45°线更陡的斜直线。那我们把这六个点的世界线都画出来，不难理解应该就是下面这样（横轴为空间x，纵轴为时间t，这里省略了）。

　　下面是关键的了，怎么画车头、车尾的闪光向中点传播的过程？我们知道，闪电击中车头车尾之后，这个事件就会向四面八方发射光信号（所以四面八方的人都能看到火车被闪电击中了），但是，其他的信号我们都不关心，我们只关心被地面中点P和火车中点P’所接收到的那一束光信号。那么，这个光信号要怎么画呢？它们的出发点肯定在m和n，那接下来呢？这次我们再次想起了上一节中提到的：光子的世界线是45°的斜直线。那么我们就加上这两条45°的世界线，最后的图就是下面这样的。

　　这两根世界线跟两个中点P、P’的世界线产生了三个交点A、B、C，这是三个很有意思的点，我们来分析一下它们的物理含义。

　　首先是A点，A点是闪光世界线跟地面中点P点的世界线交点，它们相交了是什么意思？纵轴代表时间，横轴代表空间，相交了就代表这两个粒子此时时间和空间信息都一样，都一样那就是相遇了啊，具体到我们这个问题就是闪光传播到了地面上的中点。因为地面没有动，M和N点到P点的距离又是一样的，那么车头车尾的闪光肯定同时到达地面中点，所以它们都相交于A点是正确的。

　　再来看B点和C点。B点是车尾的闪光的世界线和火车里面的中点P’世界线的交点，那B点代表的意思自然就是火车中间的观察者观察到车尾的闪光这个事件。同理，C点是车头闪光世界线跟P’世界线的交点，那C点就是火车中间的观察者观察到车头闪光的这个事件。这样看就非常明显了，纵坐标是时间轴，那么B事件明显就是在C事件之后发生的啊。

　　这正是同时的相对性的表现：对于地面系，它们都交于A点，所以是同时的；对于火车系，它们分别交于B点C点，所以是不同时的，这在时空图里极为直观。

　　这里有一个事要强调一下：我们在这个火车闪光问题里虽然涉及到了地面系和火车系，但是我们是一直在地面系来分析问题的。我们画的时空图，不管是地面上的点还是火车上的点，我们都是在地面系画，因为毕竟一张图只有一个坐标系嘛。那么，我们能不能在一张图里同时把地面系和火车系两个惯性系都画上呢？

　　答案当然是可以的。

　　我们来具体看看这个问题：假设我们现在已经画了一个地面系的直角坐标系x-t，那么我们要如何把火车系的坐标系x’-t’画出来？

　　第一次遇到这个问题的同学可能有点懵，不着急我们一步步来，我们先看看火车系的纵轴t’要怎么画。要画火车系的纵轴，我们先想想一个坐标系的纵轴的是什么意思？我们知道如果我们让一个点的横坐标为零，那么这个点的轨迹就是跟纵轴重合的。还记得我们上面说的静止粒子的世界线么？静止粒子的空间坐标x为0，所以它的世界线就是垂直于x轴，与t轴重合的一条直线。那么，火车系的t’轴自然也是在火车系里静止在原点处粒子的世界线。

　　这一点很重要，大家好好理解一下，也就是说我们只要把火车系处于原点处粒子的世界线画出来，我们就能得到火车系的t’轴。那么，一个在火车系静止的点，在地面系看来它是在做匀速直线运动，而匀速直线运动的点的世界线，我们上面也说了，就是一条比45°更陡的斜直线。所以，火车系的t’轴就是这样一条更陡的斜直线，如下图所示：

　　火车系的t’轴画好了，那火车系的x’轴呢？大家可以看到我在图上用虚线画了一根与t’垂直的轴，并且特意标明了“错误的x’轴”。为什么要这样标呢？因为这是相对论初学者极容易犯的错误。我们已经习惯了欧式几何，欧式几何里直角坐标系都是相互垂直的，所以到了这里很多人看到我们已经画出了t’轴，就立马条件反射地画一根和t’轴垂直的当做x’轴，但是这是错误的，为什么呢？

　　这里我们第一次感受到了闵氏几何的异样。我在最开始花了那么大的篇幅告诉大家为什么狭义相对论要使用闵氏几何，我们也知道了闵氏几何的线元跟欧式几何不一样（时间项前面多了一个负号），所以，我们在画时空图处理狭义相对论问题的时候，一定要意识到自己虽然是在欧式平面里画图，但是我们画的是闵氏几何里的图形。

　　有人可能会有点疑问，我们前面不是已经用时空图解决了同时的相对性问题么？我们不是已经把爱因斯坦火车闪光问题用时空图画出来了么，我没感觉啥异样啊？那只是因为那个问题比较简单：它只有一个坐标系，而且也不涉及到线长相关的问题，所以我即便在一个欧式直角坐标系里把它画出来了，它也暂时没什么冲突。如果我们生活在一个闵氏空间里，那么我们画出的闵氏直角坐标系肯定都是相互垂直的，但是我们生活在欧式空间里，我已经用一个欧式空间里的直角坐标系画了一个闵氏坐标系，那么另一个就肯定不可能再是垂直的了。

　　这里的逻辑有点绕，大家可以细细品味，搞得不是很懂也不要紧，我接下来会把另一个坐标系画出来，大家能看懂再回去看上面的一段话就明白了。

　　好，回到正题，我们再来看看火车系正确的x’轴该怎么画。我们再来整体回顾一下这个事情：我们现在是已经画好了地面系x-t，要画火车系x’-t’，火车系和地面系它有没有什么关系呢？有啊，洛伦兹变换说的不就是地面系和火车系的关系么？什么是洛伦兹变换？比如我在地面系观测到了一个粒子的位置和速度，现在我想知道它在火车系里是什么情况，我并不需要重新再到火车系里测量一遍这个粒子的位置和速度，我只需要根据洛伦兹变换就可以直接得到火车系里那个粒子的运动情况。所以，洛伦兹变换就是两个惯性系之间的联系，我只要知道了一个惯性系里粒子的运动情况，立马我就可以知道其他惯性系里粒子运动的情况。

　　所以，我们可以根据洛伦兹变换来找到两个惯性系之间的联系。我现在不是根据地面系的坐标轴来找火车系的坐标轴么？我们对着洛伦兹变换改就是了。洛伦兹变换是下面这样的：

　　其中，x，y，z，t代表地面系里观测到的，x’，y’，z’，t’是火车系里观测到的。v是火车系相对地面系的速度，火车的速度一旦给定了，这个v就是一个定值，c是光速，所以右边的γ都是一个常数。如果我们再根据几何单位制来，取c=1，那么洛伦兹变换就可以简化成下面的样子：

　　因为我们只考虑火车系相对地面系在x轴方向上的运动，所以在y和z方向上还跟原来一样，我们可以不考虑。我们现在画图也是来画x-t图，所以我们重点关注这两个式子：

　　这是什么呢？这不就是火车系了的x’和t’么？我现在要画的就是x’的坐标轴，也就是火车系的空间坐标轴，那怎么找到这个坐标轴呢？这个我们前面也提过：纵坐标的那条线就是横坐标为0的所有点的集合，反过来也是，横坐标就是纵坐标为0的点的集合。所以，我们令火车系的时间等于0，也就是纵坐标t’=0就能找到横坐标x’轴了。

　　那我们令t’=γ（t-vx）=0，因为γ是一个不为零的常数，所以就只有t-vx=0了，也就是t=vx。

　　这在x-t坐标系里就是一条过原点的直线，斜率为火车的速度v（斜率就是这条直线的倾斜程度，你可以理解为一个坡越陡斜率越大。当直线与横轴重合的时候，斜率为0；当直线跟横轴成45°的时候，斜率为1；当直线跟纵轴重合的时候，斜率为无穷大）。因为我们这里是几何单位制，光速为1，在狭义相对论里任何有质量的物体它的运动速度都是小于光速的，所以火车的速度v肯定是小于1的，也就是说这条直线的斜率比45°的直线（刚好是光的世界线）小。

　　再者，我们可以用同样的方法令x’=γ(x-vt)=0，就能得到火车系的纵轴是这样一条直线：t=x/v。它的斜率是1/v，因为v小于1，所以1/v是个大于1的数，所以这条斜直线的斜率比45°要大（我们前面画的也正是这样）。这里我给一个初中数学的结论：斜率互为倒数（比如v和1/v）的两条直线它们是关于y=x，也就是45°的直线对称的。所以，我们的x’轴是跟t’轴关于45°的直线对称的。这样我们就能精确地把它画出来了，如下图：

　　第一次看到这样一个坐标系的同学可能会感觉非常别扭，为什么火车系x’-t’的坐标系不是正交的，不是一个直角呢？我们得这样看：它们是正交的，只不过它们是在闵氏几何里正交，我们现在强行把它画在欧式几何里，那么肯定就看起来不正交了。

　　还有同学也会有疑惑，你不•是说狭义相对论里惯性系都是平权的么？那么为什么这里把地面系画成直角的，而把火车系画成了一个小于直角的坐标系？我要是人就在火车里，我非要把火车系画成直角的，不行么？行，当然行。你可以按照上面的思路把火车系画成直角的基准系，再反推过去画地面系，最终的两个图虽然形状不一样，但是实质上还是等价的。

　　理解这个双坐标系非常关键，它第一次向我们展示了闵氏几何不一样的地方。有了它，我们就可以很方便的处理不同惯性系里的一些事情，比如，我们喜闻乐见的尺缩效应。

　　尺缩效应是狭义相对论里比较有趣的一个效应，它简单说来就是一句话：运动的物体长度会收缩，也就是动尺收缩。但是这样描述会让许多初学者心生疑惑，你动尺收缩是真的收缩了还是只是看起来收缩了？这是一种观测效应还是一种由于光速有限造成的传播误差？你相对尺子没动，觉得尺子没缩，我觉得缩了，那么它到底缩了没有（这是个很常见的错误的问题）？

　　其实，用非几何语言初学相对论的人不可避免地会遇到很多类似这样的问题。因为大家在牛顿的那一套环境里浸润久了，想一下子把思维切换过来很麻烦。而且学相对论的人最容易载到“相对”两个字里来，该相对的东西不相对，不该相对的东西又跑去相对，最后把自己绕进去了。但是用几何语言却没有这样的烦恼，因为有很多物理量在3维的时候是相对的，在4维里就都是绝对的了。而且，几何图形清晰直白，会大大降低这类问题的难度和迷惑性。

　　好，现在我们来看看怎么用几何语言处理尺缩效应。

　　一个粒子的世界线是一条线，而一把尺子是由许多粒子组成的，所以一把尺子在时空图里留下的轨迹就应该是一个面，我们称之为尺子的世界面。我们还是以地面系为基准系，假设尺子相对地面系静止，那么尺子每个粒子的世界线都是一条平行于t轴的线，合起来它的世界面应该是一个有一定宽度的面。上一节我们已经学会了如何把运动的惯性系也画出来，我们再把相对尺子运动的参考系x’-t’（假设为火车系）画出来，总的时空图就是这样：

　　如上图所示，阴影部分就是在地面系静止的尺子的世界面，它跟x轴的交点为a，跟x’轴的交点为b。那么我们很容易就能知道oa就是尺子在静止地面系的长度，ob就是尺子在运动的火车系x’-t’的长度。

　　为什么呢？你想想oa代表什么意思？oa就是当地面系的时间为零的时候尺子在空间x轴的投影，那这显然就是尺子的长度了。那么，同样的道理，因为运动的火车系的坐标是x’-t’，ob也是当t’都为0的时候尺子在x’轴的投影，所以ob就是运动的火车系测得的尺子长度。

　　所以，尺缩效应就变成了比较oa和ob的长度。很显然，oa和ob的长度肯定不一样，那么到底是oa长还是ob长呢？

　　没错，你的眼睛没有看错，我就是在问到底是oa长还是ob长？可能这个时候你的脑袋是懵的，明明oab组成了一个直角三角形，ob是斜边，斜边肯定比直角边更长啊，这是初中生都知道的，ob比oa长难道还有什么疑问么？

　　没错，搁在欧式几何里，斜边大于直角边这绝对毫无疑问。但是，我们始终要记住我们处理狭义相对论问题用的是闵氏几何（否则也不会出现x’-t’这样看起来不正交的坐标系），那闵氏几何里要怎么样比较两条线段的长短呢？

　　这个时候你可能意识到了：我们在闵氏几何里连怎么定义线段的长度都不知道，更别提比较两条线段的长短了。那么，闵氏几何里一条线段的长度是怎么定义，怎么计算的呢？

　　在讨论怎么定义，计算闵氏几何一条线段的线长之前，许多人可能对为什么这个问题会是一个问题都心存疑惑：线段的长度不就是用尺子去量一下线段么，为什么还需要什么定义？即便我不用尺子去量，一条线段我在直角坐标系里把它投影到x和y轴，假设它在x轴和y轴的投影长度分别是Δx和Δy，那么我就可以利用勾股定理很简单的算出这条线段的长度L2=Δx2+Δy2。

　　但是，我还是得再强调一次：你能这样做，是因为你已经假设了你是在欧式几何里。只有在欧式几何里，一条线段的长度才可以这样用勾股定理去计算，但是狭义相对论的几何背景是闵氏几何。为了让大家能更直观的了解，我们先不谈闵氏几何，我们就来看看球面几何。

　　球面几何顾名思义就是在在一个球面上的几何。你可以想象在一个篮球的表面，或者地球的表面上有两个点，那么，这两个点之间的距离应该是一段圆弧长，而不再是欧式几何里的直线。你想想，在这种情况下，你还能用勾股定理去计算这两点之间的距离么？你要硬用勾股定理去计算，那么算出来的是这两点之间的直线距离，并非在球面上的圆弧长，这显然是不对的。就好比你在地球表面计算北京到深圳的距离，你用勾股定理算出来的距离是在北京地底下打一个直线隧道通到深圳的距离，这显然不是你在地球表面从北京直线开车去深圳的距离。

　　从这里我们能直观地感觉到：在不同的几何里，长度的计算方式是不一样，每一种几何都有自己度量长度的规则（这就是度规），一旦这种规则确定了，这种几何也就确定了。其实，这一点我在「线元决定几何」这一节里已经说得非常明确了，不光是线长，所有的几何性质都是由线元决定的，不同的几何拥有不同的线元，自然就拥有不同的计算线长的方式。

　　二维欧式几何的线元是dl2=dx2+dy2，二维闵氏几何的线元是ds2=-dt2+dx2。二维欧式几何里线段长度的计算公式是这样的：

　　那么，二维闵氏几何里线段长度的计算公式自然就是这样的：

　　因为闵氏几何的线元的时间项前面有个负号，所以，为了避免根号里面的值出现负数从而让式子无意义，我们套了一个绝对值（它保证所有值都是非负的，比如-5的绝对值为5，记做

　　-5

　　=5）的符号。

　　也就是说，我们在闵氏几何里是根据这个式子来计算一条线段的长度的，Δt和Δx分别代表这条线在t轴和x轴的投影。这个式子跟欧式几何的距离计算公式很类似，唯一的不同还是时间项前面的那个负号。也正因为这个负号，闵氏几何里的线长问题才会变得更我们平常想的不一样。为了让大家熟悉一下这种新的线长计算方式，我先来举个简单的例子。

　　问题4：大家还记得光子的世界线是一条45°的斜直线把，我们现在随便在光子的世界线里取A、B两点，那么线段OA、OB的长度分别是多少呢？如下图所示：

　　我们先来看看OA的长度，因为这条直线是45°，所以A点在x轴和t轴上投影得到的距离就是一样长的，也就是Δt和Δx的大小是一样的。但是，闵氏几何里线段长度的计算公式是它们两个相减再开根号，现在这两个值是相等的，那么相减的结果不就是0了么？再开根号结果自然还是0。

　　也就是说，OA在闵氏几何里的长度为0。

　　你没有看错，它的长度就是0。OA你看着有这么长的一段，但是它在闵氏几何里的长度却是0，这就是那个负号带来的效果。同样的，你可以接着去算OB的长度，或者直接算AB的长度，你会发现它的长度一样全部都是0。

　　所以，我们有这样的结论：光子的世界线长度恒为0。这很反直觉吧？我们再来看个例子。

　　问题5：还是上面的图，我过B点做一条垂直于t轴的线，然后随便在BC之间取一条点D。那么OC就是静止不动的粒子的世界线，OD就是一条匀速直线运动的粒子的世界线，OB是光子的世界线，那么它们三个的长短怎么比呢？

　　乍一看，好像的OB>OD>OC。但是我们刚刚算过了光子世界线OB的长度为0；OC是静止不动的粒子的世界线，那么它在空间上的位移Δx就为0，那么OC的长度就是粒子在时间轴里走的长度；OD在时间轴上的投影跟OC一样，但是它的Δx不等于0，那么它们相减（-Δt2+Δx2）之后的数值肯定就变小了，那么OD是小于OC的。于是，我们得到的结论确实跟之前的感觉截然相反的，三者的长度是OC>OD>OB=0。

　　所以，当我们在说时空图了某一条曲线的长度的时候，我们都要意识到我们是用闵氏几何那把尺子（时间项前面有负号）来度量曲线的长度，这跟我们平常生活里感受的（欧式几何度量长度）是不一样的。一开始大家会觉得这种方式非常不习惯，但是一旦习惯了就会觉得这个非常自然。

　　好了，这里我们介绍了闵氏几何里线长的定义和计算方法，理论上我们就可以计算任意一条线段的长度了，也能比较两条线谁长谁短了。我们上一节不就是最后把尺缩效应归结比较两条线段oa和ob的线长么？那现在可以直接比了啊。

　　我们看到ob在x轴的投影跟oa是一样长的，但是oa在t轴的投影为0，ob在t轴的投影却大于零。但是，根据闵氏几何的线长公式，线长是这个线段在时间轴t和空间轴x投影长度平方相减再开根号。既然两条线段oa和ob在空间轴x上的投影都一样，那么在时间轴t上投影长度越大的，相减之后得到的值就越小，那么最后的线长就越小。

　　所以，我们能直接就这样感觉到，在闵氏几何下，ob是比oa更短的。而ob代表的是运动参考系下尺子的长度，oa是静止参考系下尺子的长度，既然ob比oa更短，那么就是说在运动参考系里尺子的长度更短，这就是我们常说的尺缩效应。

　　这里我们是直接用线长的计算公式算出oa和ob的长度然后再来做比较，虽然算出来了，但是可能不是很直观。在许多教材和文章里都会提到另外一种看起来更直观的比较方式，那就是使用校准曲线，很多人也经常看到这个但是不是很明白，我这里就一起再讲一下。

　　校准曲线其实是回答了这样一个问题：闵氏几何里，到原点距离相等的点组成的轨迹是什么？

　　老规矩，我们先看看欧式几何的情况。在欧式几何里，到原点距离相等（比如说都等于2）的点组成的轨迹是什么呢？这个我们都知道，这就是一个圆，到定点的距离等于定长的点的集合就是圆，这个点就是圆心，这个定长就是半径。

　　在欧式几何里，如果一个点（x，y）到原点的距离为2，那么，根据勾股定理我们就可以很容易写出下面的关系：x2+y2=4。而学过一点解析几何的人就都知道，这就是圆的坐标方程。

　　那么，再回到闵氏几何，在闵氏几何里到原点的距离为2的点组成的轨迹是什么呢？其实也简单，我们不是已经有闵氏几何的距离公式了么？代入进去就行了，因为是求到原点的距离，所以Δx和Δt就分别是点的坐标x和t，如下图：

　　我们把两边平方展开就得到了：

　　大家对比一下，这个x2-t2=4跟我们在欧式几何里圆的方程只有一个符号的差别（因为坐标轴不同，作为纵轴t和y是完全等价的）。这个式子，学过高中数学的同学一眼就能看出来这是一条双曲线，没学过或者忘了的可以自己去找一些具体的点描上去（自己找一些x的值，然后去算t的值，最后把（x，t）组成的点画到坐标系上去，看看轨迹是什么）。我这里用GeoGebra（这是一个免费的在线数学绘图工具，你输入函数或者方程，它就会自动把对应的图像画出来，有兴趣大家自己也可以去画一画）给大家画了一个图，大家可以看。