視頻監(jiān)控邁入深度智能時代
來源:數(shù)字音視工程網(wǎng) 編輯:胡燕 2017-06-30 11:42:50 加入收藏
隨著高清視頻時代的到來,視頻監(jiān)控的點位數(shù)和數(shù)據(jù)量已呈爆發(fā)式增長,傳統(tǒng)的智能算法還停留在比較淺層的分析識別上,具體表現(xiàn)為準(zhǔn)確率低、環(huán)境適應(yīng)性差、識別種類少。然而,從97年IBM“深藍”以3.5:2.5擊敗國際象棋世界冠軍卡斯巴羅夫到17年1月谷歌“阿法狗”升級版Master在人機圍棋比賽中取得60連勝,我們不得不相信,人工智能的時代以洪荒之勢已然來臨。
人工智能的崛起離不開三要素:深度學(xué)習(xí)為算法提供了重要基石,大數(shù)據(jù)為存儲提供了高效燃料,GPU、超級計算機、云計算為運算能力提供了引擎助力。其中,深度學(xué)習(xí)作為最核心的技術(shù)支撐,其靈感來源于大腦神經(jīng)網(wǎng)絡(luò),讓機器具備了人類對事物抽象和重構(gòu)的能力,在算法層次上由淺至深,在特征設(shè)計上從人造特征到自主學(xué)習(xí),讓機器擁有接近甚至超越人類的模式識別精度、超強抗干擾的環(huán)境適應(yīng)能力以及強大的種類識別能力。作為機器視覺最具代表性的應(yīng)用,視頻監(jiān)控系統(tǒng)的發(fā)展及應(yīng)用狀況又是如何呢?
“中國芯”正在迅速崛起
網(wǎng)絡(luò)高清時代的到來為我們帶來了更好的圖像質(zhì)量,使攝像機可以更好的記錄現(xiàn)實場景,這同時也對芯片商提出了更高的要求。目前國內(nèi)工業(yè)化、標(biāo)準(zhǔn)化的加速及第三方的介入給芯片設(shè)計業(yè)者提供了快速進入市場的可能,從而推動了芯片國產(chǎn)化和產(chǎn)業(yè)化的逐步升級。而安防行業(yè)的蓬勃發(fā)展,讓國產(chǎn)芯片廠商看到了希望,以華為海思為代表的一批致力于國產(chǎn)芯片研發(fā)生產(chǎn)的企業(yè),將目光聚焦在安防芯片上,試圖在安防行業(yè)一展拳腳,發(fā)揮最大的價值。
中國安防芯片的技術(shù)演進路線越來越清晰,功能多樣化的趨勢日趨明顯。有了“中國芯”,一方面所有的芯片產(chǎn)品定義真正來自國內(nèi)客戶、系統(tǒng)集成商以及最終行業(yè)用戶需求,在源頭上保證芯片真正滿足客戶需求。另一方面,在芯片布局上緊密契合國內(nèi)客戶的產(chǎn)品演進,推動視頻監(jiān)控產(chǎn)業(yè)的持續(xù)升級。
前端設(shè)備插上了深度智能的翅膀
作為視頻監(jiān)控的前端設(shè)備,監(jiān)控攝像機是整個視頻監(jiān)控系統(tǒng)的重要組成部分,它經(jīng)歷了從模擬到數(shù)字化、網(wǎng)絡(luò)化、高清化以及智能化的發(fā)展歷程。視頻圖像來源是視頻監(jiān)控系統(tǒng)的第一環(huán),運用傳統(tǒng)的攝像機存在很大的局限性,如檢測準(zhǔn)確率不高,漏抓誤報比較多,抓拍不清晰,圖像質(zhì)量不理想等。前端攝像機內(nèi)置深度學(xué)習(xí)算法,可以對人臉、車輛等關(guān)鍵信息進行快速定位抓拍,有效解決漏抓誤報問題,也能為后端分析服務(wù)器提供更清晰、更高質(zhì)量的圖片,更出色的成像效果大大提升了后端的資源利用率,同等條件下可大幅節(jié)省中心部署空間,同樣的投入可以產(chǎn)生更大的效用。
安防行業(yè)中不少企業(yè)已經(jīng)在紛紛布局智能前端的市場,以安防龍頭企業(yè)為例,它們推出的前端攝像機中內(nèi)嵌深度學(xué)習(xí)算法,具有結(jié)構(gòu)化信息提取、小型人臉庫比對、人體屬性分析、人員流量統(tǒng)計、道路實況檢測、車輛特征識別、全景監(jiān)控等多種功能,將前端設(shè)備的智能化應(yīng)用發(fā)揮到極致。此外,還將人眼仿生、MSS多光譜成像、被動紅外熱成像技術(shù)等技術(shù)融入其中,可對因環(huán)境造成的圖像模糊昏暗進行亮度與清晰度的還原,還能實現(xiàn)環(huán)境測溫、防火防盜等功能,引導(dǎo)著前端設(shè)備在深度智能化這條路上越走越遠。
深度學(xué)習(xí)開啟智能視頻分析技術(shù)的新篇章
近年來,深度學(xué)習(xí)在語音識別、圖像識別、自然語言處理等應(yīng)用中取得了顯著的成效。深度學(xué)習(xí)也正影響著安防企業(yè),影響著智能視頻分析技術(shù)。智能視頻分析是計算機圖像視覺技術(shù)在安防領(lǐng)域應(yīng)用的一個分支,是一種基于目標(biāo)行為的智能監(jiān)控技術(shù),其支持的功能主要有:人車物特征識別采集、人員及物件行為報警、視頻信號及質(zhì)量診斷、視頻增強處理、圖像比對、視頻摘要、內(nèi)容分揀等。深度學(xué)習(xí)解決了傳統(tǒng)智能視頻分析技術(shù)人工選擇特征準(zhǔn)確率低、淺層學(xué)習(xí)模型無法解析大數(shù)據(jù)等問題,使視頻分析過程中識別準(zhǔn)確率更高、環(huán)境適應(yīng)性更好、識別種類更豐富。
在以人、車、物為核心視頻特征識別領(lǐng)域,目前最成熟的其實是車輛識別算法,在平安城市建設(shè)和公安實戰(zhàn)創(chuàng)新的推動下,車輛識別技術(shù)在智慧交通、智慧警務(wù)等行業(yè)的應(yīng)用取得了不錯的成果。國內(nèi)以深圳華尊科技為代表,在算法準(zhǔn)確率、系統(tǒng)穩(wěn)定性、識別種類、公安車輛大數(shù)據(jù)實戰(zhàn)應(yīng)用上表現(xiàn)得較為突出,且數(shù)次在華為國內(nèi)外的大型活動中亮相。人臉識別算法因其應(yīng)用的廣泛性,火爆程度遠遠大于車輛算法,但就目前的技術(shù)來看,在準(zhǔn)確率、更深層的應(yīng)用上還有很高的提升空間,以曠視、商湯為代表的算法公司也在高校人才及技術(shù)儲備、各行業(yè)的淺層應(yīng)用上做出了努力。
大數(shù)據(jù)時代為算法研究提供了高效的計算工具,而數(shù)據(jù)量的增加也意味著需要更復(fù)雜的視頻分析算法模型來詮釋和挖掘這些數(shù)據(jù),使占有巨大存儲資源的視頻數(shù)據(jù)發(fā)揮出更多的價值。目前人員行為分析、人群分析等復(fù)雜的算法還在起步階段,讓我們想象一下,基于對人體、生物體行為細節(jié)的精確捕捉和復(fù)雜分析模型,一個城市級的視頻大數(shù)據(jù)中心將能為公共安全、各類學(xué)科研究、商業(yè)發(fā)展乃至人類的進步做出多大的貢獻。
海量視頻數(shù)據(jù)存儲呈現(xiàn)前端分布式存儲、后端集中存儲和云存儲三種模式
隨著視頻圖像清晰度的不斷提高,其存儲需求也在不斷發(fā)生變化。在安防視頻監(jiān)控領(lǐng)域,目前主要存儲方式有三種:前端分布式存儲、后端集中存儲和云存儲。
原有的模擬及模數(shù)混合組網(wǎng)的視頻監(jiān)控正逐步被純IP化、全高清的網(wǎng)絡(luò)視頻監(jiān)控所取代,因此前端分布式存儲產(chǎn)品也由DVR、HDVR(混合式DVR)逐步替換成NVR產(chǎn)品。隨著前端分布式存儲的系統(tǒng)組網(wǎng)成本不斷降低,同時4K、H.265技術(shù)的推出大大提高了視頻圖像的清晰度,并通過改變編碼方式降低了存儲空間需求,使得前端NVR存儲產(chǎn)品的競爭力進一步增強。另外,NVR產(chǎn)品由于其簡單易用的特性,為不同層面的客戶所廣泛使用。
相對NVR的分布式存儲而言,后端集中存儲方式更加注重數(shù)據(jù)的集中保存、數(shù)據(jù)的可靠性及統(tǒng)一的管理維護,同時具有較好的容量擴展能力,因此后端集中存儲方式更適合大規(guī)模部署。集中存儲主要以SAN/NAS為主要代表,其中SAN因為其高性能、高穩(wěn)定性而被廣泛采用。FCSAN產(chǎn)品延時小、可靠性高,但建設(shè)成本也高很多,針對于視頻監(jiān)控的大容量存儲需求來說并不是非常合適,而IPSAN產(chǎn)品由于其互聯(lián)互通性高、管理維護簡單、建設(shè)成本相對低廉等優(yōu)勢而為安防視頻監(jiān)控行業(yè)所廣泛應(yīng)用。
采用多臺IPSAN存儲設(shè)備疊加的方式勉強實現(xiàn)視頻接入和圖像存儲需求時,由于多臺存儲設(shè)備間相互獨立,缺乏有效的數(shù)據(jù)整合與協(xié)同處理能力,因此也額外帶來了存儲設(shè)備的統(tǒng)一管理、設(shè)備冗余性能和存儲空間無法共享及利用等問題。應(yīng)需而生的云存儲利用集群化、虛擬化、分布式文件系統(tǒng)等技術(shù)對整個系統(tǒng)內(nèi)的設(shè)備資源、帶寬資源、存儲空間資源等進行統(tǒng)一整合,從而為用戶提供大容量、高性能、高可靠的透明存儲服務(wù)。在云存儲技術(shù)中,不同廠家的應(yīng)用方案也有所不同,安防廠商基于對業(yè)務(wù)的理解順勢推出安防專用云存儲,數(shù)據(jù)存儲廠商則力推通用云存儲以期滿足用戶多樣化需求。
視頻監(jiān)控在各行業(yè)的應(yīng)用情況
據(jù)立木信息咨詢發(fā)布的《中國視頻監(jiān)控市場調(diào)研與投資前景預(yù)測報告(2017版)》顯示:當(dāng)前,視頻監(jiān)控的主要需求依然來自于平安城市建設(shè)、行業(yè)延伸及民用市場開啟。伴隨著我國城鎮(zhèn)化的持續(xù)推進,政府對平安城市、智慧城市建設(shè)及升級改造的重視,各行業(yè)對視頻監(jiān)控及視頻應(yīng)用需求的進一步提升,居民對人身安全、財產(chǎn)安全的重視程度不斷提高,促進視頻監(jiān)控行業(yè)市場規(guī)模繼續(xù)保持快速增長。此外,伴隨著“中國制造”、“互聯(lián)網(wǎng)+”的開展,視頻監(jiān)控也得到政策的大力支持。
從發(fā)展勢頭來看,傳統(tǒng)的金融、能源市場趨于飽和,政府、交通市場還在持續(xù)快速增長,民用、醫(yī)療、教育等新興市場保持高速增長勢頭。
就智慧城市建設(shè)而言,目前大城市的安防基礎(chǔ)建設(shè)工作已基本完成,中小城市正處于蓬勃發(fā)展階段,視頻監(jiān)控更多的向聯(lián)網(wǎng)化、智能化和高清化方向發(fā)展,同時隨著對數(shù)據(jù)和有效信息利用要求的提高,云存儲、大數(shù)據(jù)和云計算也開始發(fā)展。
在智能交通領(lǐng)域,隨著智能手機和無線互聯(lián)網(wǎng)開始普及以來,互聯(lián)網(wǎng)的體驗型應(yīng)用越來越滲透到智能交通中,此外,視頻智能分析、車聯(lián)網(wǎng)等技術(shù)不斷突破,不僅提高了公安交警的工作效率,也給普通民眾提供了更便利、更人性化的平臺。
民用市場迎來發(fā)展期。隨著人們生活的水平提高,消費者正在成為推動消費安防的重要力量,中小企業(yè)、商鋪、家庭逐漸成為常規(guī)安防需求的中堅力量。目前,我國民用安防監(jiān)控只占了6%的市場份額,遠遠落后于發(fā)達國家(如美國民用安防監(jiān)控產(chǎn)值占據(jù)了整體的30%以上),具有非常強的發(fā)展?jié)摿?。隨著家庭市場的發(fā)展成熟,市場會向更高一級的使用便利化以及有序管理服務(wù)方向發(fā)展,家庭監(jiān)控將融合移動監(jiān)控、云存儲、隱私保護以及綜合運營服務(wù),不單單是安全功能,同時也向個人價值的滿足和分享方向發(fā)展。
視頻監(jiān)控行業(yè)化應(yīng)用能力的不足之處
國家SVAC編解碼能力亟待提升
監(jiān)控數(shù)據(jù)作為敏感的可視化信息,已經(jīng)成為國家安全的重要組成部分,敏感視頻外流給國家和地區(qū)造成的輿論壓力非常大,所以我國具有自主知識產(chǎn)權(quán)的視頻監(jiān)控專用編解碼協(xié)議SVAC得到了公安部的高度重視,也在廣東等地區(qū)進行試點推廣。原定于去年推出的SVAC2.0版本協(xié)議延至今年發(fā)布,6月1號起正式實施,但是與主流的H.264、H.265相比,SVAC技術(shù)迭代進展相對較為緩慢,在碼流壓縮傳輸方面還有較大的差距,市場產(chǎn)品線也還不夠完整。
產(chǎn)品缺乏亮點
目前視頻大數(shù)據(jù)還處于相對比較初期的階段。整個視頻大數(shù)據(jù)的領(lǐng)域,包括了云存儲、云智能,以及大數(shù)據(jù)分析和挖掘。云存儲在行業(yè)內(nèi)已經(jīng)相對比較普遍,但是各個廠家對云存儲的定義不盡相同,有很多拿傳統(tǒng)的存儲系統(tǒng)包裝一下出來就是云存儲。云智能也是面臨著同樣的問題。大數(shù)據(jù)分析和挖掘部分則還處于相對早期的探索階段,因為它依賴于數(shù)據(jù)的沉淀、匯聚和清洗。目前市場上絕大部分安防產(chǎn)品的同質(zhì)化競爭過于激烈,產(chǎn)品缺乏足夠的亮點。早期的監(jiān)控平臺并不是以云架構(gòu)方式建設(shè)的,也沒有數(shù)據(jù)開發(fā)共享的概念。在大數(shù)據(jù)時代的整體背景下,原來的很多監(jiān)控平臺難以支撐大數(shù)據(jù)的應(yīng)用,市場急需一個新的云架構(gòu)的監(jiān)控平臺來支撐未來的發(fā)展。
視頻分析準(zhǔn)確度低、缺乏深層次挖掘
視頻監(jiān)控行業(yè)發(fā)展這些年,視頻分析準(zhǔn)確度低是制約其得以大規(guī)模應(yīng)用的首要問題,系統(tǒng)針對復(fù)雜異常行為建模困難,目標(biāo)與背景接近會導(dǎo)致目標(biāo)特征信息提取困難,運動目標(biāo)被遮擋會造成目標(biāo)信息缺失,目標(biāo)移動速度過快或算法過于復(fù)雜導(dǎo)致跟蹤的有效性較低,這些因素都很容易造成誤報、漏報、跟蹤困難等結(jié)果。同時,對于視頻圖像信息也缺乏深層次的挖掘,難以支撐不同用戶的差異化應(yīng)用需求,視頻圖像信息及數(shù)據(jù)的價值仍未得到充分地利用。
視頻圖像檢索速度慢、效率低
前端采集設(shè)備不斷回傳的視頻、圖片等信息,都需要在平臺服務(wù)器上疊加算法進行分析,由于服務(wù)器本身處理性能的限制,無法并行處理日益累積的超量數(shù)據(jù)。視頻監(jiān)控每天的數(shù)據(jù)量就有高達上千PB,累計的歷史數(shù)據(jù)越來越龐大,系統(tǒng)也就逐漸暴露出數(shù)據(jù)存儲壓力大,檢索速度越來越慢,數(shù)據(jù)統(tǒng)計、分析效率越來越低等問題。因此,雖然智能分析服務(wù)器的應(yīng)用為公安、交警等需要大量檢索視頻的情況節(jié)省了人力與時間,但整體的效率仍有較大提高的空間。
在安防市場需求的催生及深度學(xué)習(xí)技術(shù)的助攻下,智能視頻分析技術(shù)目前已成為當(dāng)下最炙手可熱最前沿的技術(shù)之一。讓我們期待,在平安城市向智慧城市逐步過渡的進程中、在技術(shù)儲備與市場孕育趨于成熟之時,智能視頻分析技術(shù)將于全面化、深層次的應(yīng)用中帶領(lǐng)我們迎來一個全新的智慧時代。
評論comment