智能視頻分析技術不能大展拳腳?
來源:數(shù)字音視工程網(wǎng) 編輯:ann 2014-04-01 13:01:58 加入收藏 咨詢

所在單位: | * |
姓名: | * |
手機: | * |
職位: | |
郵箱: | * |
其他聯(lián)系方式: | |
咨詢內(nèi)容: | |
驗證碼: |
|
智能視頻分析技術領域是人工智能中的模式識別,將智能算法嵌入到DSP中,通過分析和提練人員和車輛二類目標的各種行為模式,形成核心算法。目前來看,雖然近年智能視頻技術迅速發(fā)展,而智能視頻分析本身算法的局限,在理想環(huán)境下才可實現(xiàn)其全部功能,所以在實際應用中,只能初步實現(xiàn)較簡單的功能。但強勁的需求市場下,緣何智能視頻分析技術不能大展拳腳?未來智能視頻分析技術又將會有哪些突破?
視頻分析技術目前應用三類現(xiàn)狀
從技術角度來講,目前國內(nèi)智能分析技術主要還集中在兩大類:一類是采用畫面分割前景提取等方法對視頻畫面中的目標進行提取檢測,通過各種不同的規(guī)則來區(qū)分不同的事件,從而實現(xiàn)不同判斷并產(chǎn)生相應的報警聯(lián)動等,例如:最早期的一些行為分析類功能(跨界、區(qū)域入侵、打架檢測、人員聚集等)、還有早期的交通事件檢測等都屬于這類算法技術的應用。另一類是利用模式識別技術,對畫面中特定的物體進行建模,并通過大量樣本進行訓練,從而達到對視頻畫面中的特定物體進行檢測及相關應用。如車輛檢測、人臉檢測、人頭檢測(人流統(tǒng)計)等應用。
從應用角度來講,目前國內(nèi)智能分析技術主要有四大類:第一類是實時報警類。第二類是數(shù)據(jù)統(tǒng)計類,第三類是屬性識別類。第四類是圖像處理類。
從產(chǎn)品形態(tài)來講,目前市場上主要有兩大類產(chǎn)品形態(tài),一類是前端智能產(chǎn)品。一類是后端服務器產(chǎn)品。這兩類產(chǎn)品各有優(yōu)缺點,根據(jù)不同的應用和項目類型有不同的選擇?! ∧壳笆袌錾峡梢钥吹胶芏嘀悄?a href="http://www.chenshidesign.com/product/shexiangji/list.html" target="_blank" class="inlink">攝像機,即將一些視頻分析算法移植到網(wǎng)絡攝像機中,在攝像機中實現(xiàn)對實時視頻的分析和檢查,實現(xiàn)一些智能分析的功能(例如目前有實現(xiàn)車輛檢測的車輛抓拍攝像機、實現(xiàn)區(qū)域入侵等功能的目標檢測報警的攝像機、有實現(xiàn)人類檢測抓拍的攝像機等等),智能攝像機自帶分析功能,系統(tǒng)架構(gòu)簡單,同時目前的攝像機DSP處理能力已經(jīng)完全能運行各種較為復雜的分析算法,分析效果和后端產(chǎn)品基本相同。
智能視頻分析被稱監(jiān)控智能化最為成熟技術體系
監(jiān)控平臺發(fā)展的這些年,已經(jīng)很明顯貼近監(jiān)控高清、集成性的趨勢,但智能化的應用表現(xiàn)才剛剛起步,但前景不小。我們說的監(jiān)控智能化,很多業(yè)內(nèi)人士都認為智能視頻分析就是監(jiān)控的智能化。從目前應用情況分析,智能視頻分析技術是監(jiān)控智能化技術最為成熟的技術體系。
目前智能分析技術已經(jīng)廣泛應用于各種安防領域,根據(jù)其實現(xiàn)的方式進行區(qū)分,有業(yè)內(nèi)人士將其概括為以下幾種類型的智能分析。
診斷類智能分析:診斷類智能分析主要是針對視頻圖像出現(xiàn)的雪花、滾屏、模糊、偏色、增益失衡、云臺失控、畫面凍結(jié)等常見的攝像頭故障、視頻信號干擾、視頻質(zhì)量下降進行準確分析、判斷和報警。診斷類智能分析技術實現(xiàn)起來較為簡單,通常以后端管理平臺的形式出現(xiàn),在大型的監(jiān)控項目,特別是城市級監(jiān)控的日常運維中作用十分明顯。目前市面上一些基于DSP的智能分析設備、DVR和DVS等都自帶該項輔助功能。
識別類智能分析:該項技術偏向于對靜態(tài)場景的分析處理,通過圖像識別、圖像比對及模式匹配等核心技術,實現(xiàn)對人、車、物等相關特征信息的提取與分析。在對車的識別分析應用上主要是車牌識別技術。該技術經(jīng)過多年的發(fā)展與應用,目前已十分成熟。模糊車牌還原和識別技術的出現(xiàn)使得該項技術不再局限高清,開始向標清領域普及。車牌識別技術被廣泛應用于各停車場出入口、高速公路收費站等地,近些年更是發(fā)展迅速:配合交通電子卡口系統(tǒng),車牌識別技術被大量用于車輛交通違章的抓拍,有效降低了車輛交通違章數(shù)量,大大減少了交通事故的發(fā)生。
行為類智能分析:該項技術側(cè)重于對動態(tài)場景的分析處理。典型的功能有:車輛逆行及相關交通違章檢測、防區(qū)入侵檢測、圍墻翻越檢測、絆線穿越檢測、物品偷盜檢測、占道經(jīng)營檢測和客流統(tǒng)計等。移動偵測(VMD)是該類智能分析中的“早期智能”,VMD依據(jù)視頻畫面中像素塊的運動變化來進行判別,缺點明顯:基于二維的分析,誤報太高,無法識別移動的像素塊是干擾還是目標。
而就目前監(jiān)控智能化中應用最成熟的智能視頻分析技術發(fā)展來看,它能在幾乎不需要人為干預的情況下,通過對攝像機拍錄的圖像序列進行自動分析來對動態(tài)場景中的目標進行定位、識別和跟蹤,并在此基礎上分析和判斷目標的行為,做到既能完成日常管理又能在異常情況發(fā)生的時候及時做出反應,從而解決了傳統(tǒng)監(jiān)控工作量大、效率低、反應速度慢等問題,其優(yōu)勢顯而易見,也是推動整個安防智能化最為關鍵的技術之一。
智能分析技術應用存在一些問題
早期視頻分析應用產(chǎn)品出現(xiàn)在市場上,著實引起了一段騷動,而且很多特殊的應用場景和應用環(huán)境,的確能給客戶帶來很大的價值。如商場的人流統(tǒng)計技術,為商場的數(shù)據(jù)分析帶來了巨大的技術支撐。如車牌識別技術,給公安交通管理帶來的價值是無法用數(shù)據(jù)來衡量的。但是,視頻分析技術還沒有完全成熟,目前應該還屬于技術應用的初級階段,還存在很多問題,這些問題可能也是限制視頻智能分析應用快速發(fā)展的最主要的因素。
針對100多家廠商及工程商的問卷調(diào)查顯示,2013年智能攝像機市場規(guī)模較2012年市場規(guī)模18億元增長接近40%,2013年智能攝像機市場規(guī)模達25億元左右。其中,平安城市、交通行業(yè)、機場、軍事基地是智能攝像機應用最多的行業(yè),達到了30%以上,但是相對于成熟的視頻監(jiān)控系統(tǒng)而言,智能視頻的銷量總體呈現(xiàn)平穩(wěn)的態(tài)勢。深圳市視威克總經(jīng)理巫松亮表示,智能視頻分析技術只占有總營業(yè)額的一小部分。
那么為什么廣受用戶期待與市場好評的智能視頻分析技術不能在市場上大展拳腳,占據(jù)監(jiān)控市場的更大空間呢?
(一)、檢測準確率達不到理想效果。視頻分析技術的準確率基本達不到非常理想的效果,特別是實時報警類的應用,誤報率和漏報率都是客戶最關心的問題,如果誤報太高,客戶也受不了,如果漏報,客戶更加受不了。特別是一些要求比較高的應用,只要有漏的,實際作用就不大了。
(二)、受環(huán)境干擾大。視頻分析技術最大的一個問題就是受環(huán)境和視頻質(zhì)量的干擾太大,光線、雜物、惡劣天氣、晃動、飛蟲等的干擾,就會使應用系統(tǒng)效果非常差,甚至失效,無法進行正常工作。
(三)、安裝調(diào)試復雜。智能分析應用產(chǎn)品幾乎都需要按每一個應用場景進行不同的參數(shù)調(diào)試,而且會涉及到非常多的專業(yè)的參數(shù)調(diào)試。非專業(yè)人員根本無法調(diào)試出理想效果。
問題面前需求強勁未來發(fā)展有何新趨勢?
一、智能碼流技術
智能碼流,是系統(tǒng)根據(jù)圖像識別后,根據(jù)畫面運動主體的運動速度,將正常錄制的視頻進行碼流調(diào)整,進行最后的視頻存儲。對于運動慢的運動主體,碼流記錄甚至可以低至8幀/秒(fps)以下,對于正常速度運動的主體,碼流設定正常的25fps,對于敏感圖像的運動物體的視頻碼流可設定在30fps以上。對于高速的運動主體,在高速攝像機的配合下,碼流可高達1000fps以上。智能碼流技術,可以減少非敏感圖像占用視頻存儲資源,從而對敏感圖像提供了充裕的記載能力。
二、動態(tài)區(qū)域自適應的智能監(jiān)控技術
以某車庫視頻監(jiān)控畫面為例,畫面上的敏感信息為運動的車輛和人。不敏感畫面是背景(地面和屋頂)。但在實際的視頻記錄中,背景(地面和屋頂)占據(jù)了50%以上的存儲空間。通過圖像識別技術,可以判定固定背景與運動物體圖像,因而,具備了只在記載畫面的中有運動的技術可能。動態(tài)區(qū)域智能監(jiān)控,就是只記載除背景以外的運動物體,從而大大減少了視頻存儲空間的需求,相同的存儲空間,可保留的視頻時間長度可以成倍提高。攝像系統(tǒng),通過圖像識別技術,可以智能學習,判斷哪些圖像是背景,即便是由云臺控制的攝像頭,通過設定的時間內(nèi)的自動學習,也可以自動判定錄制視頻中的新背景,從而實現(xiàn)對運動物體圖像的智能監(jiān)控。
三、非敏感區(qū)域的低碼流記載技術
視頻上方的25%到30%的區(qū)域,通常是天空或建筑的頂部圖像,基本屬于敏感要素不太可能出現(xiàn)的區(qū)域。如某些典型監(jiān)控圖像中的紅色馬賽克部分的圖像,基本不會含有人們關心的視頻內(nèi)容,因此可以把視頻圖像的非敏感區(qū)域的忽略或者用低碼流另外記錄,只需在回放的時候與高碼流的視頻做一個同步。值得說明的是,非敏感區(qū)域在不同應用場景,各有不同,有的也許在視頻圖像的下方,有的監(jiān)控場景,非敏感區(qū)域是不規(guī)則的,可以在視頻監(jiān)控系統(tǒng)安置好后,根據(jù)實際情況再進行應用層面的人工設定。
四、人臉/車輛識別(或其他敏感移動物體)驅(qū)動高清攝錄技術
在特殊的場景下,比如大樓的進口處、電梯等地方,人臉是敏感圖像。在車庫內(nèi)、小區(qū)的進出口處,車輛及其號牌是敏感圖像。若全部用高清的視頻固然可以滿足監(jiān)控需求,但視頻存儲,特別是長時間的保存就會需要海量的存儲空間;若根據(jù)圖像識別技術,判斷出現(xiàn)設定的敏感圖像的時候,才驅(qū)動攝像頭啟動高清記錄,對于一般的非敏感圖像,則啟動標清甚至低碼率的視頻流來記錄。這樣高清與標清相結(jié)合的監(jiān)控記錄,即保證了記錄敏感圖像的質(zhì)量,同時又較大程度上減少了視頻存儲量。
五、序列幀視頻文件分布存儲技術
把視頻在一秒內(nèi)產(chǎn)生的幀為標識成序列幀,同時編制存儲與播放序列,把不同序列的幀劃分為數(shù)個文件存儲;單個幀序列文件可以單獨播放,效果等同于低碼流記錄的視頻效果。
所有幀序列可以合成完全視頻一起播放時,則是高清(或標清)的視頻效果。當需要回收存儲空間的時候,可按存儲策略規(guī)劃,先將一部分序列幀視頻文件所占的區(qū)域覆蓋。另一部份則保存下來,從而更有效的利用存儲空間。
例如按原存儲能力可以保留1個月的視頻數(shù)據(jù),經(jīng)過視頻幀文件的分布存儲后,可以保留數(shù)個月的有選擇的序列幀視頻的文件數(shù)據(jù)。對已保留了中長期的序列幀視頻文件進行部分覆蓋,實現(xiàn)淡入淡出式的視頻逐漸丟棄,長期保留的視頻數(shù)據(jù)不是一下完全消失,而是慢慢的消失、丟棄。從而最大限度地延長監(jiān)控視頻保留的時間。
結(jié)語
總體來看,限制智能分析技術應用的最大因素就是準確率問題。所以智能分析技術應用的發(fā)展趨勢肯定是朝著提高準確率的方向前進的。同時另一方面,大家也會尋找一些不關心準確率,而更多關注效率的一些應用方向。
評論comment