最小作用量原理

物理原理

物理學裏, 作用量原理(英語:actions principle),或更精確地,平穩作用量原理(英語:stationary action principle),是一種變分原理,當應用於一個機械系統作用量時,可以得到此機械系統的運動方程式。這原理的研究引導出經典力學拉格朗日表述哈密頓表述的發展。卡爾·雅可比特稱最小作用量原理為分析力學之母[1]

在現代物理學裏,這原理非常重要,在相對論量子力學量子場論裏,都有廣泛的用途。在現代數學裏,這原理是莫爾斯理論的研究焦點。本篇文章主要是在闡述最小作用量原理的歷史發展。關於數學描述、推導和實用方法,請參閱條目作用量。最小作用量原理有很多種例子,主要的例子是莫佩爾蒂原理Maupertuis' principle)和哈密頓原理

在最小作用量原理之前,有很多類似的點子出現於測量學光學古埃及拉繩測量者英語rope stretcher在測量兩點之間的距離時,會將固定於這兩點的繩索拉緊,這樣,可以使間隔距離減少至最低值[2]托勒密在他的著作《地理學指南》(Geographia)第一冊第二章裏強調,測量者必須對於直線路線的誤差做出適當的修正。古希臘數學家歐幾里得在《反射光學》(Catoptrica)裏表明,將光線照射於鏡子,則光線的反射路徑的入射角等於反射角。稍後,亞歷山卓的希羅證明這路徑的長度是最短的[3]

費馬的表述

光線從點Q傳播至點O時,會被半圓形或混合形鏡子反射,最終抵達點P。

1662年,皮埃爾·德·費馬提出費馬原理,又稱為「最短時間原理」:光線移動的路徑是需時最少的路徑[4]

費馬原理更正確的版本應是「平穩時間原理」。對於某些狀況,光線移動的路徑所需的時間可能不是最小值,而是最大值,或甚至是拐值。例如,對於平面鏡,任意兩點的反射路徑光程是最小值;對於半橢圓形鏡子,其兩個焦點的光線反射路徑不是唯一的,光程都一樣,是最大值,也是最小值;對於半圓形鏡子,其兩個端點Q、P的反射路徑光程是最大值;又如最右圖所示,對於由四分之一圓形鏡與平面鏡組合而成的鏡子,同樣這兩個點Q、P的反射路徑的光程是拐值。[5]

假設,介質1、介質2的折射率分別為  ,光線從介質1在點O移動進入介質2,則斯涅耳定律以方程式表達為

 

其中, 為入射角, 為折射角。

 
光線從介質1的點Q,在點O移動進入介質2,發生折射,最後抵達介質2的點P

從費馬原理,可以推導出斯涅耳定律。通過設定光程對於時間的導數為零,可以找到「平穩路徑」,這就是光線移動的路徑。光線在介質1與介質2的速度分別為

 
 

其中, 真空光速。

由於介質會減緩光線的速度,折射率  都大於 

如右圖所示,從點Q到點P的移動時間 

 

根據費馬原理,光線移動的路徑是所需時間為極值的路徑,取移動時間 對變數 的導數,設定其為零:

 

由圖中的邊角關係,可以得到移動速度與折射角的關係式:

 

將移動速度與折射率的關係式代入,就會得到斯涅耳定律:

 

費馬原理引發了極大的爭議。假若介質的密度越小,光線的移動速度越快,則費馬原理是正確的;但是,艾薩克·牛頓勒內·笛卡兒都認為介質的密度越大,光線的移動速度就越快。1802年,托馬斯·楊做實驗發現,當光波從較低密度介質移動進入較高密度介質之後,光波的波長會變短,他因此推論光波的運動速度會降低。[5]

莫佩爾蒂的表述

最小作用量原理應用於作用量的最初始表述,時常歸功於皮埃爾·莫佩爾蒂。於1744年和1746年,他寫出一些關於這方面的論文[6][7]。但是,史學專家指出,這優先聲明並不明確。萊昂哈德·歐拉在他的1744年論文裏就已談到這原理[8]。還有一些考據顯示出,在1705年,戈特弗里德·萊布尼茨就已經發現這原理了[9]

莫佩爾蒂發表的最小作用量原理闡明,對於所有的自然現象,作用量趨向於最小值。他定義一個運動中的物體的作用量為 ,物體質量 、移動速度 與移動距離 的乘積[10]

 

莫佩爾蒂又從宇宙論的觀點來論述,最小作用量好像是一種經濟原理。在經濟學裏,大概就是精省資源的意思。這論述的瑕疵是,並沒有任何理由,能夠解釋,為什麼作用量趨向最小值,而不是最大值。假若,我們解釋最小作用量為大自然的精省資源,那麼,我們又怎樣解釋最大作用量呢?

折射理論

於1744年,在巴黎科學院發表的一篇論文《幾種以前互不相容的自然定律的合一論》(Accord de plusieurs lois naturelles qui avaient paru jusqu'ici incompatibles)中,莫佩爾蒂提出,光折射的路徑,從一種介質到另一種介質,是作用量的最小值。按照這論點,如前圖,假設光線從折射率 的介質1折射於折射率為 介質2,則作用量為

 

其中, 是光線的質量。雖然光線並沒有質量,這變量對於結果沒有任何影響,可以被忽略。

取作用量對於變數 的導數,設定為零,經過一些運算,可以得到

 

請注意,這結果與牛頓的光粒子理論相符合;但是,與費馬得到的結果南轅北轍,大不相同。

非彈性碰撞

1747年,莫佩爾蒂在柏林科學院Academy of Berlin)發表了論文《運動與靜止定律》(Loix du mouvement et du repos)。在這篇論文裏,他將碰撞分為兩種,彈性碰撞非彈性碰撞。彈性碰撞遵守動量守恆能量守恆;非彈性碰撞只遵守動量守恆。莫佩爾蒂可以將最小作用量原理應用於彈性碰撞與非彈性碰撞,正確地計算出碰撞後的物體的速度。

思考一個一維非彈性碰撞,假設兩個質量分別為  的物體O1和物體O2,分別以初始速度  朝着同一方向移動,而且, ,物體O1緊追着物體O2。當兩物體發生非彈性碰撞後,結合成為物體O3,以終結速度 移動。從固定於物體O3的參考系觀察,物體O1和物體O2的速度分別為  。所以,作用量為

 

其中, 是時間。

取作用量對於變數 的導數,設定為零,經過一些運算,可以得到

 

所以,最終速度為

 

請注意,按照這種設定參考系的方法,前面折射問題的光折射作用量應該是

 

還有,前面光折射作用量的距離參數是任意值,但是,非彈性碰撞作用量的碰撞前距離參數與碰撞後距離參數被設定為相等。

由於這些不一致之處,促使恩斯特·馬赫嚴厲批評,莫佩爾蒂的最小作用量原理只是一個模糊不清的概念,勉強地被用來解釋各種不同的物理現象[11]

歐拉的表述

1744年,萊昂哈德·歐拉在論文《尋找具有極大值或極小值性質的曲線,等周問題的最廣義解答》(Methodus inveniendi lineas curvas maximi minimive proprietate gaudentes, sive solutio problematis isoperimetrici lattissimo sensu accepti)裏,以非常清楚的字句,給出最小作用量原理的定義[12]

設定一個質量為 ,速度為 的粒子移動無窮小距離 。這粒子的動量為 ,當乘以無窮小距離 時,會給出 ,粒子的動量積分於無窮小距離 。現在,我宣明,這移動粒子的真實軌道(在所有連結兩個端點的可能軌道之中)是 為最小值的軌道,或者,假定質量是個常數,是 為最小值的軌道。

如同歐拉所寫, 是動量積分於移動路徑。採用現代術語,這積分等於簡略作用量 ;其中, 廣義動量 廣義坐標。因此,在同一年,稍微比莫佩爾蒂晚一點,歐拉獨立地發表了,與莫佩爾蒂的理論等同的,關於變分原理的理論。歐拉並沒有爭奪優先榮譽。

直線運動

假設沒有任何作用力施加於這粒子,則這粒子以均勻速度移動:

 

只有在軌道長度 為最小值時,才能得到作用量最小值。這軌道是一條直線。

拋物線運動

假設這移動於二維空間的粒子感受到均勻重力 ,則根據活力定律principle of vis viva),

 

其中, 是瞬時速度, 是最初速度, 是粒子朝着y-軸移動的距離, 是加速度常數。

將這方程式代入作用量:

 

 ,求作用量的穩定值,應用變分法,可以得到歐拉-拉格朗日方程式

 

其中, 是積分常數。

重新編排,可以得到

 

將這方程式積分,

 

其中, 是積分常數。

假設粒子的初始位置為 ,初始速度為 ,則

 
 
 

重新編排,可以看出這是拋物線方程式:

 

歐拉又將這結果推廣至一群粒子。他認為最小作用原理所以正確,是因為粒子的慣性試着阻抗任何關於狀態的改變,自由粒子會選擇遵循影響最小的作用力[4]

拉格朗日的表述

約瑟夫·拉格朗日對於變分法貢獻良多。拉格朗日在論文《分析力學》(Mecanique Analytique)裏,從能量守恆定律理論推導出歐拉表述的最小作用量原理是正確的[4]。能量守恆定律以方程式表達為

 

其中, 是總能量 動能 位能

位能的變分為

  ;

其中, 是粒子的位置, 虛位移

粒子感受到的作用力 為位能的負梯度。將牛頓第二定律帶入方程式,

 

微分運算可以和變分運算對易:

 

其中, 是粒子的速度。

所以,位能的變分為

 

動能的變分為

 

總能量的變分為:

 

總能量的積分的變分為

 

其中, 是路徑長度。

設定路徑的兩個端點為固定不變,能量也守恆不變,則粒子移動的路徑的作用量是穩定值:

 

拉格朗日最小作用量原理

推廣至位形空間,拉格朗日最小作用量原理闡明,

 

其中, 廣義動量 廣義坐標

歐拉-拉格朗日最小作用量原理

拉格朗日又注意到在作用量的方程式 中,

 

將這方程式代入作用量,可以看見被積分項目是動能項目:

 

因此,作用量也可以表達為(忽略常數乘法因子)

 

歐拉-拉格朗日最小作用量原理表明,描述粒子運動的作用量必定是穩定值[13]

 

請特別注意,這方程式看起來簡易精緻,然而,隱藏在使用方面有很大的問題。歐拉的作用量積分於路徑;而這作用量積分於時間。變分法要求積分域兩端固定不變。雖然路徑兩端是固定值,轉換至時間,為了要滿足能量守恆,時間間隔的兩端可能不是固定值。亞可比因此批評拉格朗日的方法有瑕疵[13]。後來,於1816年,奧淩迪·若立格Olinde Rodrigues)想出新點子,將這時間作用量的變分詳細計算出來[1]

一般表述

 
隨着系統演化,q位形空間中描繪出一條路徑(僅畫出部分)。在系統環境(δq)發生微小變化時,系統走過的路徑(紅)具有靜態作用(δS = 0)。[14]

作用量記作 ,定義為時刻t1t2之間拉格朗日量L積分——是N廣義坐標q = (q1, q2, ... , qN)泛函,其中坐標是時間的函數,定義了系統的位形空間

    點表示時間導數t是時間。

數學原理為[15][16]   其中δ是微小變化。換句話說就是:[14]

系統在時間t1t2及構型q1、q2之間運動的路徑是一階常(無變化)作用的路徑。

常作用並不總是最小作用。[17][18]:19-6它是有限維系統路徑中足夠短的有限段的最小原則。[19]

在應用中,作用的陳述與定義結合在一起:[20]  

作用與拉格朗日量都包含了系統在所有時間的動力特性。「路徑」是指系統在位形空間中畫出的曲線,即以時間為參數的曲線q(t)(關於這一概念,另見參數方程式)。

進一步發展

拉格朗日與哈密頓

約瑟夫·拉格朗日於1760年[21][22]提出了變分法的大部分內容,並將其應用於動力學問題。在《動力分析》(1788)中,拉格朗日推導出了機械體的一般運動方程式[23]威廉·哈密頓在1834、1835年[24]將變分法應用於經典拉格朗日函數 得到了目前形式的歐拉-拉格朗日方程式

雅可比、莫爾斯和卡拉西奧多里

卡爾·雅可比於1842年解決了變分法是否總能找到最小值而非其他駐點(最大值或鞍點)的問題,他的大部分工作集中於二維曲面的測地線上。[25]馬斯頓·莫爾斯在1920年代到30年代首次給出了明確的一般性陳述,[26]形成了莫爾斯理論。例如,莫爾斯證明了軌跡中共軛點數等於拉格朗日二次變分中負特徵值的數量。康斯坦丁·卡拉西奧多里對歐拉-拉格朗日方程式進行了非常優雅的推導,發表於1935年。

高斯與赫茲

其他經典力學的極值原理有高斯最小約束原理及其推論——赫茲最小曲率原理

達朗貝爾

對於具有非完整約束的系統,哈密頓原理被達朗貝爾原理代替。這時,作用量 被強加為只在符合約束的變化 時靜止。

表觀目的論

微分運動方程式數學等價於其對應的積分運動方程式,這具有很重要的哲學意義。微分方程式描述局部於空間的一點或單獨時間的片刻。舉例而言,牛頓第二定律 解釋為瞬時作用力 施加於質量為 的粒子會造成瞬時加速度為 的運動。明顯對比地,作用量原理不會局部於一點,而牽涉到積分於一段時間間隔或一個空間的局域。更重要地,通常在經典作用量原理的表述裏,系統的初始狀態和終結狀態是固定不變的,也就是說,

設定一個移動粒子開始於位置 、時間 ,結束於位置 、時間 ,連接這兩個端點的物理軌道是作用量積分的平穩值。

特別地針對這程序,終結狀態的固定動作似乎額外地賦予了作用量原理一些目的論的特色。在物理學史裏,這特色不經意地製造出很多激烈的爭論。

參閱

參考文獻

  1. ^ 1.0 1.1 Jourdain, Philip, The principle of least action, Open Court Publishing Company: pp. 1, 54, 1913 
  2. ^ Wilson, Alistair Macintosh, The Infinite in the Finite, Oxford University Press: 38, 1995, ISBN 9780198539506 
  3. ^ Kline, Morris. Mathematical Thought from Ancient to Modern Times. New York: Oxford University Press. 1972: pp. 167–168. ISBN 0-19-501496-0. 
  4. ^ 4.0 4.1 4.2 Dugas, R., A History Of Mechanics, New York: Dover Publications, Inc.: pp. 255ff, 274, 345–346, 1988, ISBN 0-486-65632-2 
  5. ^ 5.0 5.1 Hecht, Eugene, Optics 4th, United States of America: Addison Wesley: pp. 106–111, 141, 2002, ISBN 0-8053-8566-5 (英語) 
  6. ^ P.L.M. de Maupertuis, Accord de différentes lois de la nature qui avaient jusqu'ici paru incompatibles.(1744)Mém. As. Sc. Paris p. 417.(英文翻譯
  7. ^ P.L.M. de Maupertuis, Le lois de mouvement et du repos, déduites d'un principe de métaphysique.(1746)Mém. Ac. Berlin, p. 267.(英文翻譯
  8. ^ Euler, Leonhard, Methodus Inveniendi Lineas Curvas Maximi Minive Proprietate Gaudentes, Geneva: Bousquet, Lausanne &, [1744] [2010-07-26], (原始內容存檔於2014-10-22) 
  9. ^ The MacTutor History of Mathematics網頁:O'Connor, J. J.; Robertson, R. F., The Berlin Academy and forgery, [2010-07-26], (原始內容存檔於2016-01-16) 
  10. ^ Dugas, R., A History Of Mechanics, New York: Dover Publications, Inc.: pp. 255ff, 1988, ISBN 0-486-65632-2 
  11. ^ 馬赫, 恩斯特, The science of mechanics; a critical and historical account of its development, Watchmaker Publishing: pp. 364–368, 380, 2010 [1919], ISBN 978-1603863254 
  12. ^ Euler, Leonhard, Additamentum IIexternal link頁面存檔備份,存於互聯網檔案館)), ibid.(英文翻譯
  13. ^ 13.0 13.1 Lanczos, Cornelius, The Variational Principles of Mechanics, Dovers Publications, Inc: pp. 132–138, 1970, ISBN 978-0-486-65067-8 
  14. ^ 14.0 14.1 R. Penrose. The Road to Reality. Vintage books. 2007: 474. ISBN 978-0-679-77631-4. 
  15. ^ Encyclopaedia of Physics (2nd Edition), R.G. Lerner, G.L. Trigg, VHC publishers, 1991, ISBN (Verlagsgesellschaft) 3-527-26954-1, ISBN (VHC Inc.) 0-89573-752-3
  16. ^ Analytical Mechanics, L.N. Hand, J.D. Finch, Cambridge University Press, 2008, ISBN 978-0-521-57572-0
  17. ^ Goodman, Bernard. Action. Parker, S. P. (編). McGraw-Hill Encyclopaedia of Physics 2nd. New York: McGraw-Hill: 22. 1993. ISBN 0-07-051400-3. 
  18. ^ 引用錯誤:沒有為名為:0的參考文獻提供內容
  19. ^ 引用錯誤:沒有為名為Stehle的參考文獻提供內容
  20. ^ Classical Mechanics, T.W.B. Kibble, European Physics Series, McGraw-Hill (UK), 1973, ISBN 0-07-084018-0
  21. ^ D. J. Struik (編). A Source Book in Mathematics, 1200–1800. Cambridge, Mass: MIT Press. 1969.  pp. 406–413
  22. ^ Kline, Morris. Mathematical Thought from Ancient to Modern Times . New York: Oxford University Press. 1972. ISBN 0-19-501496-0.  pp. 582-589
  23. ^ Lagrange, Joseph-Louis. Mécanique Analytique. 1788.  p. 226
  24. ^ W. R. Hamilton, "On a General Method in Dynamics", Philosophical Transactions of the Royal Society Part I (1834) p.247-308頁面存檔備份,存於互聯網檔案館); Part II (1835) p. 95-144頁面存檔備份,存於互聯網檔案館). (From the collection Sir William Rowan Hamilton (1805–1865): Mathematical Papers頁面存檔備份,存於互聯網檔案館) edited by David R. Wilkins, School of Mathematics, Trinity College, Dublin 2, Ireland. (2000); also reviewed as On a General Method in Dynamics頁面存檔備份,存於互聯網檔案館)
  25. ^ G.C.J. Jacobi, Vorlesungen über Dynamik, gehalten an der Universität Königsberg im Wintersemester 1842–1843. A. Clebsch (ed.) (1866); Reimer; Berlin. 290 pages, available online Œuvres complètes volume 8 互聯網檔案館存檔,存檔日期2007-11-22. at Gallica-Math 互聯網檔案館存檔,存檔日期2008-11-23. from the Gallica Bibliothèque nationale de France頁面存檔備份,存於互聯網檔案館).
  26. ^ Marston Morse (1934). "The Calculus of Variations in the Large", American Mathematical Society Colloquium Publication 18; New York.