AVS感知無(wú)損壓縮團(tuán)體標(biāo)準(zhǔn)正式發(fā)布
來(lái)源:智能視聽(tīng)研究院 編輯:ZZZ 2024-10-21 09:56:55 加入收藏
2024年10月14日,中關(guān)村視聽(tīng)產(chǎn)業(yè)技術(shù)創(chuàng)新聯(lián)盟正式批準(zhǔn)發(fā)布團(tuán)體標(biāo)準(zhǔn)《信息技術(shù) 感知無(wú)損壓縮 第1部分:圖像》,標(biāo)準(zhǔn)號(hào):T/AI 129.1-2024。
AVS感知無(wú)損壓縮(Perceptual Lossless Compression,以下簡(jiǎn)稱(chēng)PLLC)標(biāo)準(zhǔn)制定工作自2021年12月啟動(dòng),中國(guó)科研機(jī)構(gòu)和企業(yè)集體創(chuàng)新,專(zhuān)注于解決“8K+”超高清視頻信號(hào)傳輸中高速數(shù)據(jù)收發(fā)的性能瓶頸問(wèn)題。經(jīng)過(guò)三年的深入研發(fā),AVS視頻組研發(fā)了一系列 “超低延時(shí)、硬件友好、主觀無(wú)損”的輕量級(jí)圖像壓縮技術(shù),并最終形成團(tuán)體標(biāo)準(zhǔn)。主觀質(zhì)量測(cè)試表明,PLLC達(dá)到了國(guó)際領(lǐng)先水平,標(biāo)志著中國(guó)在視頻編解碼領(lǐng)域?qū)崿F(xiàn)了又一重大突破。
一、PLLC關(guān)鍵技術(shù)特性
圖1 PLLC參考軟件平臺(tái)(HIM)信號(hào)處理流水
PLLC標(biāo)準(zhǔn)定義了兩個(gè)編碼檔次,分別為接口檔次和幀存檔次。接口檔次主要面向信號(hào)傳輸接口的硬件芯片(Application Specific Integrated Circuit,ASIC)設(shè)計(jì),幀存檔次則可廣泛應(yīng)用于主觀無(wú)損或信號(hào)無(wú)損質(zhì)量等級(jí)的圖像緩存,減輕圖像處理系統(tǒng)中的內(nèi)存與帶寬壓力,提升系統(tǒng)總體性能。
如圖1所示,PLLC標(biāo)準(zhǔn)的關(guān)鍵技術(shù)可分為信號(hào)處理、模式預(yù)測(cè)、量化、系數(shù)編碼和碼率控制五個(gè)部分組成。下面簡(jiǎn)要介紹每部分的實(shí)現(xiàn)方案和設(shè)計(jì)目的:
1. 信號(hào)處理: PLLC支持將信號(hào)切分為等尺寸的矩形片進(jìn)行并行處理,編碼過(guò)程中最小的單元為16×2的一組像素。這種處理方式使得PLLC在保持高壓縮效率的同時(shí),能夠?qū)崿F(xiàn)超低延時(shí)的數(shù)據(jù)傳輸。
2. 模式預(yù)測(cè): PLLC包含點(diǎn)預(yù)測(cè)、普通幀內(nèi)預(yù)測(cè)和塊復(fù)制幀內(nèi)預(yù)測(cè)三類(lèi)預(yù)測(cè)模式,通過(guò)比特代價(jià)和重構(gòu)失真的綜合評(píng)估,獲得編碼單元的最優(yōu)編碼模式。這一設(shè)計(jì)支持了高度并行的硬件處理,提高了編解碼的效率。
3. 量化和系數(shù)編碼: PLLC使用移位量化和半定長(zhǎng)系數(shù)編碼,在保證低硬件成本的前提下實(shí)現(xiàn)對(duì)預(yù)測(cè)殘差的能量聚集。此外,PLLC還支持在特定點(diǎn)位逐像素點(diǎn)的量化參數(shù)微調(diào),顯著優(yōu)化紋理細(xì)節(jié)的主觀重建質(zhì)量。
4. 碼率控制: 碼率控制是恒定碼率壓縮的關(guān)鍵模塊,PLLC提出一種基于歷史先驗(yàn)自適應(yīng)更新的碼率估計(jì)模型,通過(guò)對(duì)紋理特征建模導(dǎo)出其預(yù)分配的編碼比特?cái)?shù),隨后結(jié)合視覺(jué)無(wú)損的比特下界與位流緩沖的比特上界進(jìn)行適當(dāng)放縮,最終映射導(dǎo)出實(shí)際的量化步長(zhǎng)。通過(guò)上述碼率控制技術(shù),實(shí)現(xiàn)了穩(wěn)定的恒定碼率傳輸和視覺(jué)無(wú)損的主觀質(zhì)量。
二、主客觀性能測(cè)試
在AVS工作組遴選的27組測(cè)試序列中,PLLC標(biāo)準(zhǔn)參考軟件表現(xiàn)出了優(yōu)秀的客觀重建質(zhì)量。如圖2所示,在ISO 29170-2國(guó)際主觀質(zhì)量標(biāo)準(zhǔn)的判定中,PLLC閃爍測(cè)試有25/27條序列達(dá)到主觀無(wú)損的判定標(biāo)準(zhǔn),并排測(cè)試全部27/27條序列均達(dá)到主觀無(wú)損。
圖2 客觀重建數(shù)據(jù)與主觀評(píng)測(cè)結(jié)果,序列17為噪聲序列
在測(cè)試的27組信號(hào)中,難度最高的10條信號(hào)被進(jìn)一步用來(lái)進(jìn)行PLLC與國(guó)際同類(lèi)壓縮標(biāo)準(zhǔn)DSC的主觀質(zhì)量對(duì)比,其中PLLC的主觀質(zhì)量在閃爍測(cè)試中與之持平(均為8/10條序列達(dá)到主觀無(wú)損),在并排測(cè)試中更優(yōu)(PLLC: 10/10; DSC: 9/10)。這一對(duì)比結(jié)果證實(shí)了PLLC標(biāo)準(zhǔn)達(dá)到了國(guó)際領(lǐng)先水平,為中國(guó)在國(guó)際視頻淺壓縮編碼領(lǐng)域的競(jìng)爭(zhēng)中贏得了重要的一席之地。
三、系統(tǒng)產(chǎn)品部署
國(guó)內(nèi)多家廠商已開(kāi)始基于PLLC的相關(guān)硬件產(chǎn)品開(kāi)發(fā)與部署。作為國(guó)內(nèi)領(lǐng)先的控制臺(tái)設(shè)計(jì)與制造商,北京鐵力山科技股份有限公司率先基于現(xiàn)場(chǎng)可編程門(mén)陣列(Field Programmable Gate Array,F(xiàn)PGA)實(shí)現(xiàn)了PLLC標(biāo)準(zhǔn)的部署,展示了該標(biāo)準(zhǔn)在壓縮效率與硬件適配上的卓越表現(xiàn)。
北京大學(xué)視頻與視覺(jué)技術(shù)國(guó)家工程研究中心與鐵力山緊密合作,共同研發(fā)了基于PLLC的高速實(shí)時(shí)FPGA編解碼系統(tǒng),如圖3所示。該系統(tǒng)能夠處理四路實(shí)時(shí)采集的4K視頻,通過(guò)PLLC編碼器進(jìn)行實(shí)時(shí)壓縮后,經(jīng)由局域網(wǎng)傳輸至接收端,隨后通過(guò)FPGA實(shí)時(shí)解碼器解碼并輸出至顯示屏。該系統(tǒng)可以實(shí)現(xiàn)3倍無(wú)損壓縮效果,充分展示了PLLC標(biāo)準(zhǔn)在高速高分辨率視頻高效視頻壓縮傳輸應(yīng)用中的強(qiáng)大性能。
(a)
(b)
圖3 (a)系統(tǒng)結(jié)構(gòu)圖,(b) 播放示意圖
四、未來(lái)展望
AVS感知無(wú)損壓縮團(tuán)體標(biāo)準(zhǔn)的成功發(fā)布,不僅為“8K+”超高清視頻海量信號(hào)提供了超低延時(shí)傳輸和處理的全新國(guó)產(chǎn)化技術(shù)方案,也為我國(guó)視頻行業(yè)的自主創(chuàng)新和高效發(fā)展奠定了堅(jiān)實(shí)基礎(chǔ)。隨著技術(shù)的不斷成熟和應(yīng)用的不斷拓展,AVS感知無(wú)損壓縮技術(shù)將在全球范圍內(nèi)推動(dòng)超高清視頻產(chǎn)業(yè)的快速發(fā)展,為觀眾帶來(lái)更加豐富、震撼的視覺(jué)體驗(yàn)。
評(píng)論comment