http://tech.digitimes.com.tw/ShowNe...8257117003B677F
(郭長祐/DigiTimes.com) 2006/02/20
MPEG-4在原規標準的熱潮後,緊接在後的是更專注於視訊編解碼規格的H.264,亦即MPEG-4 Part 10、亦是ISO/IEC 14496-10、也是所謂的MPEG-4 AVC(Advanced Video Coding),MPEG-4 AVC被視為推展完整MPEG-4標準的仙丹妙藥、開路先鋒。
不過,MPEG-4除了引發可攜視訊(如:DVB-H手機電視、Pocket TV口袋電視、PMP可攜式媒體播放器,甚至包括PSP掌上遊樂器、PDA個人數位助理、DSC數位相機等)的新熱潮外,現在MEPG-4又有了新的標準發展,2005年12月27日,MPEG組織認可日本電信電話NTT(Nippon Telegraph and Telephone)通訊科學研究所的無失真音效壓縮演算技術提案,正式成為MPEG-4的增訂標準,並稱為MPEG-4 ALS(Audio Lossless Coding),亦稱:14496-3 3rd ED AMD 2(MPEG-4 Audio 3rd EDition AMenDment 2),在此之前MPEG-4的音效編解碼標準為失真性壓縮的MPEG-4 AAC(Advanced Audio Coding)。
附註:失真性壓縮、無失真性壓縮有時也被人稱為可逆式(非破壞性)壓縮、不可逆式(破壞性)壓縮。
至此我們會有兩個疑問:1.今日破壞性壓縮的音效編碼格式盛行,為何還要非破壞性的壓縮標準? 2.今日也已有多種非破壞性的音效壓縮標準,還需要使用MPEG-4 ALS嗎?
其實兩個問題的答案可一併回應,那即是壓縮率,破壞性壓縮通常可獲得比非破壞性壓縮更高的壓縮率,在運算力有限、傳輸頻寬有限的年代,為了能即時流暢地傳輸、播放,採行破壞性壓縮有其必要,然而運算力、頻寬短缺的情形已大幅改善,且演算技術的進步革新,讓非破壞性壓縮的壓縮率不斷提升,已逼近破壞性的表現,如此持續使用破壞性壓縮的價值便開始大減。
此外,有些應用層面並不允許失真,但又有縮小傳輸容量的需求,以視訊為例,JPEG雖然有極高的壓縮率,但卻是破壞性壓縮,之後JPEG-2000標準的制訂,即是以不失真為前提而盡可能逼近傳統JPEG的壓縮率,這對於醫療影像來說相當重要,今日分隔兩地的醫院因轉診而要異地調閱患者的X光片、核磁共振的掃描影像時,影像資料量將極大,且不能失真,以免導致醫療的誤診、誤判。
類似的,非失真音效壓縮也必然在嚴苛要求音質正確性,且又講究儲存、傳輸快縮性的領域中大大受用。此外人的天性也是:盡可能不破壞就不破壞,盡量避免失真,盡量保持可逆、可回退的選擇。
就算是MPEG-4 ALS強調不失真,但比MPEG-4 ALS早出現的非失真性音效編碼標準、格式,也還有Apple的Apple Lossless、Microsoft的Windows Media Audio Lossless,另外免費軟體方面也有FLAC、Monkeys、OptimFrog等,有必要使用MPEG-4 ALS嗎?
答案也是壓縮率,前面已述:非失真的壓縮率多半不高,而MPEG-4 ALS卻在此方面有幅度性提升,依據不同的取樣率與音效內容類型(如:會議語音、交響樂)而能有15∼70%不等的壓縮率。
此外,還有兩點是可考慮改採MPEG-4 ALS的理由:1.授權立場,MPEG組織與其他業者相比,在技術標準的使用授權上更為中立、明確。2.MPEG-4 ALS的編解碼技術更為優異。
優異不是嘴上形容說說而已,是有具體數據規格的,MEPG-4 ALS的取樣頻率最大可到192kHz,每頻率取樣的解析度為32-bit(可以是整數型態表示、記錄,也可以用IEEE 754浮點數型態表示、記錄)。
不過,上述規格數據表現還算一般,192kHz是DVD級音效的最高級,32-bit更是與HD Audio並駕齊驅(實際上24-bit已近極致),最令人訝異的是MPEG-4 ALS的壓縮聲道數,同時可達65,536個,遠遠超過今日5.1聲道(6聲道數)、7.1聲道(8聲道數)。
最後,既然MPEG-4 ALS是日本NTT通訊科學基礎研究所的發創心血,並在提案通過後獲得國際的認同,這不免讓人聯想起台灣電信總局切割民營化後的中華電信之電信研究所,具有高達一千多名專業學歷的研究陣容、團隊,是不是也能比仿NTT通訊科學研究所,立下國際性的標準規範呢?
http://www.digitimes.com.tw/NewsIma...22016205a_0.gif
▲NTT的MPEG-4 ALS與其他非失真性音效編碼格式的壓縮率、解碼效率比較圖。(圖片來源:NTT.co.jp)