美國加州聖地牙哥台灣同鄉會
San Diego Taiwanese Cultural Association
http://www.taiwancenter.com/sdtca/index.html
  2010 年 10 月

淺談信號處理 (A Touch of Signal Processing)
孫治雄

什麼是信號?信號是一種物理量或現象〔如聲、光、電〕,而具有兩大特性:(1)有資訊價值,(2)可以被觀測、察覺、收集、或記錄。信號是自然界的每個生物用來探究環境,用來和同類溝通最主要的媒介。舉一些自然界的例子,例如鯨魚和海豚利用聲音來通訊,蝙蝠利用超音波來導航,貓狗利用嗅覺來巡路和找目標,候鳥利用地球磁場來導航,蚊子利用紅外光來探測動物體溫,蜜蜂靠花香來傳粉。人是萬物之靈,信號和人類文明息息相關,兩者有如「雞與蛋」的關係,信號的技術和應用隨著人類的文明而進步和擴展,相對的,人類文明也因為信號技術的發達而加速進步,人類生活的品質也因此提高。在日常生活中如語言、文字、音樂、圖像、數據、以及各種藝術表演和創作,都是信號的運作。隨著科學的進步,電話、電影、無線電廣播、攝影、等等技術也相繼發展。信號的科技更是推展到各門行業,例如在工業上很多自動控制系統需靠信號技術才能操作。在醫學上,信號技術己經普遍應用在X光檢查、超音波檢查(sonogram)、以及CAT、MRI、ECG/ECoG等的掃描檢驗系統。在國防設備上如雷達、聲納(sonar)、紅外光偵察等系統更是少不了信號科技。還有在法醫、警察、和保安 (Homeland Security) 的作業上,信號技術被應用到人臉識別、語音識別、指紋辨認等等。

知道了信號的應用就自然瞭解信號處理的目的。簡單的說,目的就是在增強資訊的偵察、收集、攝取、傳送、和存儲的效率與效果。所有的生物都賦有天生處理信號的本能,上面舉的例子也是在說明這一點。再說,自古人類就曉得在各種社交場合中應用"察言觀色",其實就是最好的一個信號處理的例子。信號的應用在近代社會更是一日比一日擴展,信號處理的技術也跟著一日比一日進步,在硬件和軟體兩方面都有相當重大的突破。硬件方面有超速電腦、微型處理機 (microprocessor),以及 nanotechnology等等重要的發展。今天要談的是軟體方面處理技術的一些例子。

處理信號的方法非常多,大部份需要比較高深的數學和複雜的邏輯。這裡就只介紹兩個最常用到的基本方法。第一個方法是針對微弱信號的處理,很簡單,從信號的來源多做測量,然後把所有測量到的信號做一個平均,這樣可以把有同樣資訊的信號增強。讓聽眾看的例子,有四張嘈雜(noisy)的圖片,每一張看不出什麼特別的圖形,但是四張合起來平均就顯示一張台灣地圖。如果把十六張合起來平均,台灣的地圖顯得更清楚。

第二個基本方法是把測量到的信號做傅立葉轉換(Fourier transform) 。這種轉換如果用在隨時間變化的信號〔如聲音〕上就會把信號的頻率特性顯示出來,最普遍的是用傅立葉轉換產生頻率分譜圖(spectrogram) ,再做分析。所以我們可以用這個方法來分別頻率不同的訊號。在許多情況下,說話的聲音、樂器的聲音、和噪音有不同的頻率特性,可以用這個方法來分開。下面兩個例子就是根據這樣原理製作的:第一個例子是把馬丁路德金最有名的演講 "I have a Dream" 一段錄音消除雜音。第二例子是把"福爾摩薩-咱的夢"一段錄音中的男聲部分和樂器聲音分開。

再來舉一些比較有趣的例子。
(一)照像振動產生模糊的照片:在理想的條件下可以用信號處理來恢復原來的清晰程度。
(二)指紋辨認:從檔案裡找出相似的指紋,因為開始檔案很大,必需利用指紋中幾個基本型態做初步辨認,選出少數可能性大的檔案再做進一部確認。
(三)威脅警告偵察眼:在軍事上需要一種能偵察地對空威脅的系統,以保障飛行人員安全。這裡信號處理的最大的問題在於如何在短時內準確的辨認威脅以作有效的應付。
(四)腦電圖(ECoG/electrocorticography) :腦電圖的信號跟人的某種動作〔包括說話〕有關連。最近有一家公司在發展羊癇瘋發作預側器便是利用ECoG信號。
(五)媒體數據壓縮:為了儲存大量的資訊〔音樂、照像、電影〕在各種媒體,特殊信號處理方法被用來壓縮含有資訊的數據。目前比較普遍的是:(1)MP3用來壓縮音樂的數據,(2)JPEG用來壓縮圖像,(3)MPEG-2 和 MPEG-4 用來壓縮電影記錄。一般說,資訊的品質和傳真會隨著壓縮的程度而變差,所以在運用這些壓縮技術時,使用者必需輸入控制品質的參數。

(1)MP3的例子:(1a)薩拉沙泰的 "流浪者之歌":(1a.1)原版CD記錄 (89MB @48kHz), (1a.2)高品質MP3記錄 (8MB @128kb/s), (1a.3)低質MP3記錄 (3MB @48kb/s). (1b)鄭智仁/鄭瑞堂的"福爾摩薩-咱的夢":(1b.1)高質MP3記錄 (0.5MBs@128kb/s), (1b.2)低質MP3記錄 (0.2MB @48kb/s) 。

(2)JPEG的例子:(2a)原版照像 (2041x1531-最高質JPEG-1.76MB), (2b)降質壓縮 (2041x1531-中質JPEG-0.13MB), (2c)降像素數(low resolution)壓縮 (720x540-高質JPEG-27kB) 。

最後講到幾點對信號處理的感想:(一)雖然信號處理技術因高科技的發展進步很多,自動機器化信號處理在很多方面還是比不上人的能力,尤其是在人臉辨認(face recognition) ,目標識別(target recognition) ,和語音辨別(speech recognition)等方面的應用,目前的系統還得靠人輔助 (man in the loop)。 (二)有些人以為可以用信號處理來預測股價的升降。不錯,信號處理常常被用來分析(如 technical analysis) 己經發生的股價變化傾向,但是要預測將來股價的升降還得靠運氣或專家的 Gut feeling。天下信號處理的高手數不勝數,就是沒有聽過靠它發大財的報導。(三) media hype常會誤導人對信號處理的功能產生一種"高深莫測"的錯覺。最好的一個例子就是電視CSI連續劇,常常聽到劇中主角說 "Let's enhance",他要從security camera 的記錄片放大幾百倍甚至幾千倍去尋找關鍵証據,實際上這是不太可能的,因為這種記錄片 resolution不是很高,這只是一種科學幻想(science fiction)而己。