語音晶片

Voice IC

『語音晶片定義:將語音信號通過採樣轉化為數字,存儲在IC的ROM中,再通過電路將ROM中的數字還原成語音信號。

根據語音晶片的輸出方式分為兩大類,一種是PWM輸出方式,一種是DAC輸出方式,PWM輸出音量不可連續可調,不能接普通功放,目前市面上大多數語音晶片是PWM輸出方式。另外一種是DAC經內部EQ放大,該語音晶片聲音連續可調,可數字控制調節,可外接功放。

音質的優劣取決於ADC和DAC位數的多少。』

基本概念

  1. 語音信號的量化:採樣率(f)、位數(n)、波特率(T)

採樣:將語音模擬信號轉化成數字信號。

採樣率:每秒採樣的個數(byte)。

波特率:每秒鐘採樣的位數(bit)。波特率直接決定音質。Bps: bit per second

採樣位數:指在二進制條件下的位數。一般在沒有特別說明的情況下,聲音的採樣位數指8位,由00H--FFH,靜音定為80H。

  1. 採樣率

奈奎斯特抽樣定理(Nyquist Law):要從抽樣信號中無失真地恢復原信號,抽樣頻率應大於2倍信號最高頻率。抽樣頻率小於2倍頻譜最高頻率時,信號的頻譜有混疊。抽樣頻率大於2倍頻譜最高頻率時,信號的頻譜無混疊。

嗓音的頻帶寬度為20~20K HZ左右,普通的聲音大概在3KHZ以下。所以,一般CD取的音質為44.1K和16bit,如果碰到某些特別的聲音,如樂器,音質也有用48K和24bit的情況,但不是主流。

一般在我們處理針對普通語音IC的時候,採樣率最高達到16K就夠了、說話聲一般取8K(如電話音質)、6K左右。低於6K效果比較差。而DKC系列語音晶片採樣可以做到22K。

  1. 常用語音格式
  • PCM格式:Pulse Code Modulation,脈衝編碼調製是數字通信的編碼方式之一。主要過程是將話音、圖像等模擬信號每隔一定時間進行取樣,使其離散化,同時將抽樣值按分層單位四捨五入取整量化,同時將抽樣值按一組二進制碼來表示抽樣脈衝的幅值。
  • WAV格式:WAV是最常見的聲音文件格式之一,是微軟公司專門為Windows開發的一種標準數字音頻文件,該文件能記錄各種單聲道或立體聲的聲音信息,並能保證聲音不失真。但WAV文件有一個致命的缺點,就是它所占用的磁盤空間太大(每分鐘的音樂大約需要12兆磁盤空間)。它符合資源互換文件格式(RIFF)規範,用於保存Windows平台的音頻信息資源,被Windows平台及其應用程序所廣泛支持。
  • MP3格式:MP3是一種音頻壓縮技術,其全稱是動態影像專家壓縮標準音頻層面3(Moving Picture Experts Group Audio Layer III),簡稱為MP3。它被設計用來大幅度地降低音頻數據量。 

Maxlinear Voice Telephony SLIC

Subscriber Line Interface Circuits (SLIC):用於家庭網關和企業解決方案的用戶線路接口電路。

Maxlinear的用戶線接口解決方案將CMOS編解碼器和高壓線驅動器組合在一個封裝中,這種方案提供了所需的靈活性和性能,以實現用於客戶無線終端接入設備(CPE)的成本優化的語音應用。

產品組合提供用於一個和兩個FXS埠的設備。MaxLinear的SLC210和SLC220為MaxLinear SoC提供了專有的強大SSI接口。DXS10x和DXC10x通過PCM/SPI或CSI接口與所有主要的第三方寬帶SoC提供經驗證的集成和性能。

參考資料

  1. https://www.maxlinear.com/products/interface/voice
  2. https://baike.baidu.com/item/%E8%AF%AD%E9%9F%B3%E8%8A%AF%E7%89%87/7299889?fr=aladdin#2

★博文內容均由個人提供,與平台無關,如有違法或侵權,請與網站管理員聯繫。

★文明上網,請理性發言。內容一周內被舉報5次,發文人進小黑屋喔~

評論