訊號處理領域,取樣是將訊號連續時間域上的模擬訊號轉換到離散時間域上的離散訊號的過程,以取樣器實現。通常取樣與量化聯合進行,模擬訊號先由取樣器按照一定時間間隔取樣獲得時間上離散的訊號,再經模擬數碼轉換器(ADC)在數值上也進行離散化,從而得到數值和時間上都離散的數碼訊號。很多情況下所說的「取樣」就是指這種取樣與量化結合的過程。

通過取樣得到的訊號,是連續訊號(例如,現實生活中的表示壓力速度的訊號)的離散形式。連續訊號通常每隔一定的時間間隔被模擬數碼轉換器(ADC)取樣,當時時間點上的連續訊號的值被表現為離散的,或量化的值。

這樣得到的訊號的離散形式常常給數據帶來一些誤差。誤差主要來自於兩個方面,與連續模擬訊號頻譜有關的取樣頻率,以及量化時所用的字長。取樣頻率指的是對連續訊號取樣的頻度。它代表了離散訊號在和時域和空間域上的精確度。字長(位元的數量)用來表示離散訊號的值,它體現了訊號的大小的精確性。

在一個理論取樣器中,一個連續訊號乘以狄拉克梳英語Dirac comb將產生另外一個連續訊號。只有當訊號被量化之後它才變成數碼訊號,所有三個指數都被離散化。

訊號處理中的基礎定理取樣定理指出,被取樣訊號不能被清晰地表示出頻率超過取樣頻率一半的組成訊號。這個頻率(取樣頻率的一半)稱為奈奎斯特頻率。超過奈奎斯特頻率的頻率N能夠在數碼訊號中看到,但是它們的頻率是不確定的。也就是說,一個頻率為f的成份頻率不能從其它的成份頻率2N-f、2N+f、4N-f等中區分開來。這個不確定性稱為混疊。為了更加完美地處理這個問題,許多模擬訊號在轉換成數碼表示之前使用抗混疊濾波器(通常是低通濾波器)濾除高於奈奎斯特頻率的頻率分量。

取樣定理的推廣定理指出,最高頻率超過奈奎斯特頻率的訊號同樣能夠被取樣,前提是已知這一訊號的頻帶範圍,並且訊號帶寬與取樣頻率須滿足一定的關係。

在取樣定理的約束的範圍內,最初的訊號能夠在來自於理想樣品集合的取樣值的精度範圍內被完全地重建起來。重建的訊號是使用每個樣品衡量一個Sinc函數並且使用奈奎斯特-山農插值公式英語Whittaker–Shannon interpolation formula累加結果得到的。

理論上的取樣

一個理論/理想的取樣結果,是把連續訊號乘上梳狀脈衝波形: 

結果是一個被改變振幅的梳狀脈衝波形。 離散訊號就是一連串這個被改變振幅的波形。

實際上的取樣

實際上的取樣被稱作模擬數碼轉換器(A/D converter or ADC)。

失真

在非理想的取樣方法下會產生取樣失真。 失真的類型有以下幾種:

  • 混疊:取樣定理的一個前提為——訊號在有限的頻寬內。有限時間長度的訊號頻寬必為無限大,而我們有興趣的訊號,幾乎都是有限長度的,意味着這些訊號頻寬都是無限大。然而在現實生活中,取樣器只能處理其設計為適合的頻寬,對處理範圍以外的頻帶,則會直接截掉,進而影響輸出的準確性。
  • 抖動:取樣時基發生偏差。
  • 積分效應:取樣所得並非是瞬時的,而是一小段時間內的值,稱為積分效應。
  • 雜訊:熱雜訊,模擬電路雜訊等。
  • 量化誤差:捨去小數的誤差,發生在每次取樣時,ADC所轉換出的整數中。
  • 取樣率過慢:ADC轉換的速度不夠快,無法反映出訊號的變化。
  • 截斷誤差:當輸入訊號超過ADC所能轉換的大小時,輸出就會被截斷。

在攝影中很容易看出這些影響,當曝光時間太長,就會在影像中出現雜點。 一個理想的相機應該可以在零曝光時間完成照相。 在一個有使用電容的取樣保持電路中,因為電容無法根據取樣立刻改變電壓,需要非零寬度的取樣訊號,所以會產生積分效應。 積分效應可以被當作低頻濾波器分析。

而其他部分失真可以當成隨機雜訊來分析。

應用

聲音取樣

聲波通常使用44.1kHzCD)或48kHz(professional audio)的取樣頻率。根據取樣定理,必須使用兩倍的取樣頻率才能將該頻率的聲波記錄下來,44.1kHz的一半為22.05KHz,也就是CD可表現的最高頻率為22.05KHz。人類的聽覺系統所能聽到頻率範圍大約是15-20kHz,44.1kHz的取樣頻率已可滿足大部分用途。

最近的趨勢是使用更高的取樣頻率(大該是基本需求的兩倍或四倍),這尚未有理論支持,而且即使在吹毛求疵的聆聽環境下,也無法讓聽到的聲音有什麼不同。然而有許多錄音室正使用96kHz的配備且承諾「superaudio」格式將會和DVD一樣是個選擇。許多聲稱取樣頻率必須高於48kHz的文章都認為16bit的音訊訊號的動態響應範圍應該是96dB,這個數碼通常是簡單的對量化的最大值和最小值的取比率,也就是 ,65536。這樣的計算錯誤在於沒有考慮到訊號的峰值並非理論上允許的最大正弦波訊號值,而量化步長也並非平均雜訊值,即使它們是一致的,它也不能夠在不考慮ITU-R 468雜訊加權函數的前提下表示聲音的大小。在對典型的程式量值在聲音處理的各個環節進行嚴格的分析以後,可以發現這樣一個事實,也就是在良好的工程基礎上16位元的錄音質量可以遠遠的超過最好高傳真系統的表現力,而其中麥克風噪音和擴音器的容量才是真正的制約因素。

影像取樣

參見

參考文獻

  • Matt Pharr and Greg Humphreys, Physically Based Rendering: From Theory to Implementation, Morgan Kaufmann, July 2004. ISBN 0-12-553180-X。關於取樣的章節(在線資料)精心地配置了圖表、核心理論和代碼示例。