所謂「音訊」(Audio Signals),泛指人類可以聽到的聲音,這些聲音可已有
很多不同的分類方式,例如,若以發音的來源,可以大概分類如下:
� 生物音:人聲、狗聲、貓聲等。
� 非生物音:引擎聲、關門聲、打雷聲、樂器聲等。
若以訊號的規律性,又可以分類如下:
� 規律音:波形具有規律性,可以看出週期的重複性,人耳可以感
覺其穩定音高的存在,例如單音絃樂器、人聲清唱等。
� 不規律音:波形不具規律性,看不出明顯的週期,人耳無法感覺
出穩定音高的存在,例如打雷聲、拍手聲、敲鑼打鼓聲、人聲
中的氣音等。
本課程將以人聲與音樂聲的處理與辨識為探討重點。
一般人聲的特性如下:
1. 長期(一個句子):變化劇烈且無規律性,例如下圖(a)
2. 短期(一個音框):變化不大且有規律性,例如下圖(b)
聲音代表了空氣的密度隨時間的變化,基本上是一個連續的函數,但是若要將此
訊號儲存在電腦裡,就必須先將此訊號數位化。一般而言,當我們將聲音儲存到
電腦時,有下列幾個參數需要考慮:
� 取樣頻率(Sample Rate):每秒鐘所取得的聲音資料點數,以
Hertz(簡寫 Hz)為單位。點數越高,聲音品質越好,但是資
料量越大,常用的取樣頻率如下: