- 音頻編碼格式與接口
- 音頻系統(tǒng)整合策略
- 介紹三種常用的音頻格式
- 音頻系統(tǒng)中重要組成的規(guī)劃
智能型手機(jī)除了具有較強(qiáng)的數(shù)據(jù)編輯管理能力,更能提供音、視頻、游戲等多媒體應(yīng)用服務(wù),也能同時(shí)處理多項(xiàng)工作。更進(jìn)一步來看,它的功能面涵蓋了通信、信息與多媒體功能,即:
1.通信功能:語音、訊息(messaging)、認(rèn)證(Authentication)、計(jì)費(fèi)(Billing)等等通信處理功能;
2.信息功能:Email、行事歷、信息管理、Sync、安全性等信息處理功能;
3.多媒體功能:視頻、照相、游戲、TV、串流、音樂、DRM等多媒體應(yīng)用功能;
除了信息功能外,在通信與多媒體的應(yīng)用上,音頻是必要的處理任務(wù)。在過去,手機(jī)只需要處理單純的語音通話信號(hào),但今日的智能型手機(jī)中得處理的音頻任務(wù)繁重,除了多音調(diào)振鈴、MP3音樂外,可能還要有FM廣播及游戲音效,而且不能只是單聲道的效果,現(xiàn)在要求的是立體聲的臨場(chǎng)感體驗(yàn)。
過去,數(shù)字音頻的世界是截然兩分的:一邊是Hi-Fi的世界,另一邊則是語音的世界。一般而言,Hi-Fi是指16bit立體聲質(zhì)量、以44.1kHz取樣的音頻,也就是CD音樂的規(guī)格;電話語音則是8bit和8kHz的單聲道(mono)、低質(zhì)量音頻。不過,進(jìn)入智能型手機(jī)的時(shí)代,兩個(gè)音頻世界開始撞擊在一起了,如何將音頻子系統(tǒng)完善地與應(yīng)用及通信處理平臺(tái)整合在一起,就成了便攜式設(shè)備工程師開發(fā)新產(chǎn)品時(shí)的關(guān)鍵性挑戰(zhàn)。
音頻編碼格式與接口
在進(jìn)入系統(tǒng)架構(gòu)的探討前,先來看看音頻編碼的現(xiàn)狀。目前音頻編碼的格式繁多,針對(duì)聲音的編碼就有PCM、ADPCM、DM、PWM、WMA、OGG、AMR、ACC、MP3Pro以及MP3等;針對(duì)人類語音有LPC、CELP與ACELP等;其它還有MPEG-2、MPEG-4、H.264、VC-1等視聽節(jié)目的編碼格式。
以下介紹三種常用的音頻格式:
AMR格式
AMR為自適應(yīng)多碼率語音傳輸編譯碼器(AdpativeMulti-RateSpeechCodec),最初版是歐洲電信標(biāo)準(zhǔn)化協(xié)會(huì)(ETSI)為GMS系統(tǒng)所制定的語音編譯碼標(biāo)準(zhǔn),而因頻寬又分為兩種—AMR-NB(AMRNarrowband)和AMR-WB(AMRWideband)。以市場(chǎng)最大品牌Nokia來說,其多數(shù)手機(jī)都支持上述兩種格式的音頻文件。
MP3格式
MP3是MPEGAudioLayer3的縮寫,這是一種音頻壓縮技術(shù),其編碼具有10:1-12:1的高壓縮率,可以保持低頻部分不失真,但犧牲了音頻中12KHz-16KHz的高頻部份來降低文件大小,其“.mp3”格式文件一般只有“.wav”的10%。另外,MP3受到歡迎的一大原因,是它并非受到版權(quán)保護(hù)的技術(shù),所以任何人都可以使用。
MP3格式壓縮音樂的取樣頻率有很多種,可以用64kbps或更低的編碼來節(jié)省空間,亦可以用到320kbps達(dá)到極高的壓縮音質(zhì)。MP3在編碼速率上,又分為"CBR"(固定編碼),與及“VBR”(可變碼率)技術(shù),有些手機(jī)無法播放下載來的音樂,正是因?yàn)闆]有支持“VBR”格式的MP3音樂。
AAC格式
AAC即高級(jí)音頻編碼(AdvancedAudioCoding),它采用的運(yùn)算方式是與MP3不同,AAC可以同時(shí)支持多達(dá)48個(gè)音軌、15個(gè)低頻音軌、更多種取樣率和傳輸率、具有多種言語的兼容能力,以及更高的解碼效率??偨Y(jié)來說,AAC可以在比MP3格式再縮小30%的條件下提供更好的音質(zhì),而且聲音保真度好,更接近原音,所以被手機(jī)界視為是最佳的音頻編碼格式。AAC是一個(gè)大家族,他們是共分為9種規(guī)格,以適應(yīng)不同場(chǎng)合的需要:
(1)MPEG-2AACLC低復(fù)雜度規(guī)格(LowComplexity)
(2)MPEG-2AACMain主規(guī)格
(3)MPEG-2AACSSR可變?nèi)勇室?guī)格(ScaleableSampleRate)
(4)MPEG-4AACLC低復(fù)雜度規(guī)格(LowComplexity),現(xiàn)在的手機(jī)比較常見的MP4檔中的音頻部份就包括了該規(guī)格音頻文件
(5)MPEG-4AACMain主規(guī)格
(6)MPEG-4AACSSR可變?nèi)勇室?guī)格(ScaleableSampleRate)
(7)MPEG-4AACLTP長(zhǎng)時(shí)期預(yù)測(cè)規(guī)格(LongTermPrediction)
(8)MPEG-4AACLD低延遲規(guī)格(LowDelay)
(9)MPEG-4AACHE高效率規(guī)格(HighEfficiency)
上述的規(guī)格中,主規(guī)格(Main)包含了增益控制以外的全部功能,其音質(zhì)是最好,而低復(fù)雜度規(guī)格(LC)則是比較簡(jiǎn)單,沒有了增益控制,但提高了編碼效率,至于SSR與LC規(guī)格大致相同,但是多了增益的控制功能,另外,LTP/LD/HE都是用在低碼率下的編碼,其中HE采用NeroACC編碼器支持,是近來常用的一種編碼率方式。不過一般來說,Main規(guī)格和LC規(guī)格的音質(zhì)相差不大,因此考慮手機(jī)目前的內(nèi)存仍有限的情況下,目前使用最多的AAC規(guī)格是LC規(guī)格。
音頻接口
音頻接口是智能型手機(jī)設(shè)計(jì)者需考慮的重要議題。數(shù)字語音一般采用PCM(PulseCodeModulation)接口,而Hi-Fi立體聲則采用串行I2S(Inter-ICSound)接口或AC97接口。I2S是飛利浦公司為數(shù)字音頻設(shè)備之間的音頻數(shù)據(jù)傳輸而制定的一種總線標(biāo)準(zhǔn),是目前消費(fèi)性音頻產(chǎn)品中常用的接口;AC?7則是英特爾公司用于提升個(gè)人計(jì)算機(jī)音效、降低噪音的規(guī)格,由于在1997年制訂,因此稱為AC97。
因此,為特定應(yīng)用而量身定制一套整合性的解決方案是較理想的作法。在SoC的技術(shù)趨勢(shì)下,已有一些廠商將立體聲數(shù)字模擬轉(zhuǎn)換器(DAC)或編譯碼器(CODEC)整合到特定功能的IC當(dāng)中。不過,有些功能適合整合在一起,有些則可能得到反效果。
舉例來說,當(dāng)廠商將電源管理和音頻處理功能整合在一起時(shí),通常得在音質(zhì)的部分做妥協(xié),因?yàn)殡娫捶€(wěn)壓器(regulator)所產(chǎn)生的噪音會(huì)干擾到附近的音頻路徑;若將音頻功能整合到數(shù)字IC中也有困難,因?yàn)閷?duì)于Hi-Fi的組件來說,需要用到0.35mm的工藝來讓混合訊號(hào)處理得到最佳化效能,但目前數(shù)字邏輯方面的應(yīng)用已朝0.18mm以下的更高工藝發(fā)展。以上述兩種整合性的芯片策略來說,要讓兩種不同的電路同時(shí)存在于一個(gè)芯片當(dāng)中,其最終的芯片尺寸可能也會(huì)大到難以接受。
此外,揚(yáng)聲器功率放大機(jī)(louDSPeakeramplifier)特別難被整合。它所產(chǎn)生的熱是一個(gè)問題,需要做散熱處理,因此往往需要另一顆獨(dú)立的揚(yáng)聲器驅(qū)動(dòng)IC。還有一個(gè)整合上的常見問題,也就是為了讓IC盡量做到最小化,可能會(huì)產(chǎn)生模擬輸入或輸出接腳數(shù)目不足的問題。
專屬的音頻IC可避免這些問題,而音頻整合有好幾種方法可以達(dá)成。共享ADC和DAC能減少硬件成本,但卻不能同時(shí)播放或錄制兩種音頻流格式。為個(gè)別功能安排專用的轉(zhuǎn)換器(converter)可以解決這個(gè)問題,不過,此一作法會(huì)增加芯片成本。折中的作法是只共享ADC的部分,但有獨(dú)立的DAC,這樣做的話,當(dāng)電話通信在進(jìn)行時(shí),也同時(shí)可以播放其它音頻(如播放另一通電話的鈴聲,或播放音樂),但在通信時(shí)不能同時(shí)進(jìn)行錄音。ADC的耗電可以通過關(guān)掉一種功能,而以較低取樣速率的方式來加以控制。因此,為特定應(yīng)用而量身定制一套整合性的解決方案是較理想的作法。在SoC的技術(shù)趨勢(shì)下,已有一些廠商將立體聲數(shù)字模擬轉(zhuǎn)換器(DAC)或編譯碼器(CODEC)整合到特定功能的IC當(dāng)中。不過,有些功能適合整合在一起,有些則可能得到反效果。[page]
舉例來說,當(dāng)廠商將電源管理和音頻處理功能整合在一起時(shí),通常得在音質(zhì)的部分做妥協(xié),因?yàn)殡娫捶€(wěn)壓器(regulator)所產(chǎn)生的噪音會(huì)干擾到附近的音頻路徑;若將音頻功能整合到數(shù)字IC中也有困難,因?yàn)閷?duì)于Hi-Fi的組件來說,需要用到0.35mm的工藝來讓混合訊號(hào)處理得到最佳化效能,但目前數(shù)字邏輯方面的應(yīng)用已朝0.18mm以下的更高工藝發(fā)展。以上述兩種整合性的芯片策略來說,要讓兩種不同的電路同時(shí)存在于一個(gè)芯片當(dāng)中,其最終的芯片尺寸可能也會(huì)大到難以接受。
此外,揚(yáng)聲器功率放大機(jī)(loudspeakeramplifier)特別難被整合。它所產(chǎn)生的熱是一個(gè)問題,需要做散熱處理,因此往往需要另一顆獨(dú)立的揚(yáng)聲器驅(qū)動(dòng)IC。還有一個(gè)整合上的常見問題,也就是為了讓IC盡量做到最小化,可能會(huì)產(chǎn)生模擬輸入或輸出接腳數(shù)目不足的問題。
專屬的音頻IC可避免這些問題,而音頻整合有好幾種方法可以達(dá)成。共享ADC和DAC能減少硬件成本,但卻不能同時(shí)播放或錄制兩種音頻流格式。為個(gè)別功能安排專用的轉(zhuǎn)換器(converter)可以解決這個(gè)問題,不過,此一作法會(huì)增加芯片成本。折中的作法是只共享ADC的部分,但有獨(dú)立的DAC,這樣做的話,當(dāng)電話通信在進(jìn)行時(shí),也同時(shí)可以播放其它音頻(如播放另一通電話的鈴聲,或播放音樂),但在通信時(shí)不能同時(shí)進(jìn)行錄音。ADC的耗電可以通過關(guān)掉一種功能,而以較低取樣速率的方式來加以控制。
在計(jì)算機(jī)的音頻需求上,基本上與消費(fèi)性市場(chǎng)相似,但為了要能播放不同取樣速率(8kHz、44.1kHz、48kHz)下錄音的音樂文件,所以需要有更有效率和便宜的解決方案,而AC97就具有這樣的特性。在廣義的手持式設(shè)備市場(chǎng)中,三種格式各有其擁護(hù)者:CD、MD、MP3隨身聽會(huì)采用I2S接口;移動(dòng)電話會(huì)采用PCM接口;具音頻功能的PDA則使用和PC一樣的AC97編碼格式。
音頻系統(tǒng)整合策略
在較早的系統(tǒng)中,通常是將電話與PDA的電路并排放在這個(gè)設(shè)備外殼內(nèi),其中PCM語音編譯碼由通信處理器來控制,Hi-Fi立體聲(AC7或I2S)的處理則連到另一顆應(yīng)用處理器。在此架構(gòu)中,兩個(gè)音頻子系統(tǒng)之間的整合性還很低,分布式的硬件切換電路除了較占空間、需要額外的外圍組件來做信號(hào)交換和混音外,也會(huì)帶來諧波失真(harmonicdistortion)等的問題。
因此,為特定應(yīng)用而量身定制一套整合性的解決方案是較理想的作法。在SoC的技術(shù)趨勢(shì)下,已有一些廠商將立體聲數(shù)字模擬轉(zhuǎn)換器(DAC)或編譯碼器(CODEC)整合到特定功能的IC當(dāng)中。不過,有些功能適合整合在一起,有些則可能得到反效果。
舉例來說,當(dāng)廠商將電源管理和音頻處理功能整合在一起時(shí),通常得在音質(zhì)的部分做妥協(xié),因?yàn)殡娫捶€(wěn)壓器(regulator)所產(chǎn)生的噪音會(huì)干擾到附近的音頻路徑;若將音頻功能整合到數(shù)字IC中也有困難,因?yàn)閷?duì)于Hi-Fi的組件來說,需要用到0.35mm的工藝來讓混合訊號(hào)處理得到最佳化效能,但目前數(shù)字邏輯方面的應(yīng)用已朝0.18mm以下的更高工藝發(fā)展。以上述兩種整合性的芯片策略來說,要讓兩種不同的電路同時(shí)存在于一個(gè)芯片當(dāng)中,其最終的芯片尺寸可能也會(huì)大到難以接受。
此外,揚(yáng)聲器功率放大機(jī)(louDSPeakeramplifier)特別難被整合。它所產(chǎn)生的熱是一個(gè)問題,需要做散熱處理,因此往往需要另一顆獨(dú)立的揚(yáng)聲器驅(qū)動(dòng)IC。還有一個(gè)整合上的常見問題,也就是為了讓IC盡量做到最小化,可能會(huì)產(chǎn)生模擬輸入或輸出接腳數(shù)目不足的問題。
專屬的音頻IC可避免這些問題,而音頻整合有好幾種方法可以達(dá)成。共享ADC和DAC能減少硬件成本,但卻不能同時(shí)播放或錄制兩種音頻流格式。為個(gè)別功能安排專用的轉(zhuǎn)換器(converter)可以解決這個(gè)問題,不過,此一作法會(huì)增加芯片成本。折中的作法是只共享ADC的部分,但有獨(dú)立的DAC,這樣做的話,當(dāng)電話通信在進(jìn)行時(shí),也同時(shí)可以播放其它音頻(如播放另一通電話的鈴聲,或播放音樂),但在通信時(shí)不能同時(shí)進(jìn)行錄音。ADC的耗電可以通過關(guān)掉一種功能,而以較低取樣速率的方式來加以控制。
以下針對(duì)音頻系統(tǒng)中的幾個(gè)重要組成進(jìn)行規(guī)劃上的分析:
頻率與接口
共享通信與應(yīng)用子系統(tǒng)的內(nèi)部電路雖然可行,但對(duì)于接口來說并非如此,因?yàn)椴煌囊纛l應(yīng)用得在獨(dú)立的頻率區(qū)域中以自己的頻率來運(yùn)作。只要情況仍是如此,整合性智能型手機(jī)的CODEC就需要同時(shí)有PCM接口和獨(dú)立的I2S或AC97連結(jié)接口。
在非移動(dòng)性的設(shè)備(如PC)中,音頻頻率通常由一個(gè)石英振蕩器(crystaloscillator)來產(chǎn)生,但在智能型手機(jī)的設(shè)計(jì)中,為了避免額外的耗電、板面空間和頻率芯片的成本,設(shè)計(jì)者偏向于將Hi-Fi音頻所需的頻率功能從既有的頻率中獨(dú)立出來。由于低耗電、低噪音的鎖相回路(PLL)能被以相對(duì)較低成本整合到混合訊號(hào)芯片當(dāng)中,所以今日芯片廠商的作法是將一顆或兩顆PLL整合到他們的智能型手機(jī)CODEC中。
麥克風(fēng)
在智能型手機(jī)中最難的設(shè)計(jì)議題,往往與麥克風(fēng)(Mic)有關(guān)。一般來說至少有兩個(gè)麥克風(fēng)需要考慮:一是內(nèi)建的內(nèi)部麥克風(fēng)和插入耳機(jī)(headset)的外部麥克風(fēng)。此外,可能還會(huì)有用于噪音消除(noisecancellation)或立體聲錄音的額外內(nèi)部麥克風(fēng),以及車用免提功能所需要的另一個(gè)外部麥克風(fēng)。除了講話外,這些麥克風(fēng)也能透過應(yīng)用處理器的控制來錄制語音短訊或視頻短片中的音效。
若要由音頻CODEC芯片來涵蓋各種切換功能,此芯片的電路需要做好妥善的設(shè)計(jì)。除了錄音功能,CODEC也應(yīng)提供側(cè)音(sidetone)的功能,這樣一來耳機(jī)用戶也能聽到自己的聲音。插入偵測(cè)功能則能提供無縫的切換功能,也就是當(dāng)耳機(jī)插入或拔出時(shí),系統(tǒng)會(huì)自動(dòng)轉(zhuǎn)換使用內(nèi)部或外部的耳機(jī)。
人聲(acoustic)的噪噪音消除是另一個(gè)問題,它需要用到兩個(gè)麥克風(fēng),一個(gè)同時(shí)接收講話的聲音和背景噪音,另一個(gè)則只接收背景噪音。模擬的作法往往不足夠,因此需要透過數(shù)字信號(hào)處理來加強(qiáng),而音頻CODEC需達(dá)成兩個(gè)麥克風(fēng)訊號(hào)的數(shù)字化任務(wù)。
另一個(gè)問題是室外風(fēng)聲噪印的問題,它的頻率通常低于200Hz,因此透過高通(high-pass)濾波器就能處理掉,但這樣一來,在室內(nèi)錄音時(shí)就少了低頻部分的聲音。對(duì)于兩用的麥克風(fēng)來說,這個(gè)過濾器應(yīng)該是可選用的,但很多的音頻ADC中都已內(nèi)建了這顆high-pass濾波器,因此,手機(jī)廠商應(yīng)針對(duì)需求選擇合用的解決方案。
外接耳機(jī)
手機(jī)外接耳機(jī)(headset/headphone)的使用也需要特殊的模擬電路,也就是當(dāng)耳機(jī)插入時(shí),音頻輸出信號(hào)就能繞徑到耳機(jī)上頭。雖然整合機(jī)械性開關(guān)的插槽(socket)能夠滿足此要求,但它的尺寸過大且昂貴;此外,揚(yáng)聲器的音量大小可能也不適合這個(gè)耳機(jī)。為內(nèi)部與外部音頻提供獨(dú)立的音量控制可以解決此問題,而且也能使用較簡(jiǎn)單的插槽設(shè)計(jì)。這一外接耳機(jī)是否具有麥克風(fēng)也需要被偵測(cè)出來,這可以通過是否感測(cè)到偏流(biascurrent)來分辨,如果沒有電流流動(dòng),那就表示沒有麥克風(fēng)被插入。智能型手機(jī)的音頻CODEC中應(yīng)加入這一電流傳感器,進(jìn)而能因應(yīng)不同情況達(dá)成音頻輸入輸出的處理。
揚(yáng)聲器
智能電話在先后增加了多音調(diào)振鈴、MP3播放及FM廣播等功能后,其播音系統(tǒng)也朝向立體聲揚(yáng)聲器來發(fā)展。在手機(jī)揚(yáng)聲器的設(shè)計(jì)上,主要的問題是配置架構(gòu)、功率與耗電性的考慮。若要支持立體聲,手機(jī)需要有兩個(gè)外部揚(yáng)聲器,但由于手機(jī)體積太小,這兩個(gè)揚(yáng)聲器的位置難以拉開,所以立體聲的效果不易展現(xiàn),這時(shí)就需要采用特殊的3D效果處理。若是要支持免持聽筒的功能,那就需要連結(jié)到另一個(gè)較大的揚(yáng)聲器上。為個(gè)別揚(yáng)聲器提供專屬的模擬輸出是最好的方式,但電源管理上必須有相應(yīng)改變。
由于揚(yáng)聲器功率放大器會(huì)用掉大量的供電,當(dāng)它們不使用時(shí)關(guān)掉電源是很重要的。智能型手機(jī)的音頻CODEC能提供一些電源管理功能,為個(gè)別揚(yáng)聲器的輸出做好開關(guān)管理,這樣一來能避免不需要的電源消耗。此外,系統(tǒng)電源管理方案中的電壓穩(wěn)壓器通常無法為揚(yáng)聲器提供達(dá)到最大音量所需的功率,因此CODEC芯片廠商采用加入芯片內(nèi)揚(yáng)聲器的作法,也就是直接通過電池來驅(qū)動(dòng)揚(yáng)聲器。這樣做雖然不見得能降低耗電,但它也省下了對(duì)額外電壓穩(wěn)壓器的需求。
鈴聲
近幾年來,手機(jī)鈴聲愈來愈復(fù)雜,從單純的響鈴,到和弦鈴聲,再到各種聲音都能制作成立體聲的WAV和MP3格式。MIDI已成了和弦鈴聲的標(biāo)準(zhǔn)格式,很多廠商為這一應(yīng)用推出專屬的低耗電MIDI芯片。要在音頻次系統(tǒng)中整合MIDI芯片,CODEC上需要有額外的模擬輸入。
這些額外的輸入對(duì)于FM收音機(jī)IC的連結(jié)也是有用的,能為多媒體應(yīng)用提供附加功能。MIDI音頻的產(chǎn)生當(dāng)然也能由音頻CODEC來產(chǎn)生,但現(xiàn)今市場(chǎng)的趨勢(shì)是以特殊的鈴聲文件來儲(chǔ)存,并通過現(xiàn)存的Hi-FiDAC來播放,欠缺MIDI軟件庫的CODEC芯片廠商并不會(huì)積極去做這件事情。
智能型手機(jī)的下一步會(huì)如何?就Hi-Fi的立體聲來說,儼然已是必備的系統(tǒng)功能,至于I2S與AC97在手機(jī)音頻系統(tǒng)上的競(jìng)爭(zhēng)仍然會(huì)繼續(xù)下去。有些人喜歡較單純的I2S界面,但也有人更中意低引腳數(shù)和很容易可跑不同取樣速率的AC97。以智能型手機(jī)來說,目前多數(shù)低耗電的處理器對(duì)兩種規(guī)格都支持,看來兩者還是會(huì)并存下去。不過,對(duì)于CODEC的廠商來說,要同時(shí)支持兩項(xiàng)規(guī)格是比較困難的,因?yàn)锳C97的VRA(variablerateaudio)功能需要和I2S不同的頻率架構(gòu),也需要多出許多額外的數(shù)字電路才能做到。
不過,智能型手機(jī)還會(huì)不會(huì)如PC世界一樣,從立體聲走向多聲道的環(huán)繞音效格式(Intel的Azalia)呢?在近期內(nèi)還看不出這樣的可能性,因?yàn)榻袢盏亩嗦暤佬Чm然很炫,但芯片的成本和耗電性都還太高,這不是手機(jī)世界所能接受的。但今日否定的答案,在未來的電子世界仍存在很大的變量,沒有人能說得準(zhǔn)的。