圖像識(shí)別技術(shù)在安防領(lǐng)域的應(yīng)用研究
來(lái)源:數(shù)字音視工程網(wǎng) 編輯:merry2013 2016-03-18 07:09:34 加入收藏
近一兩年來(lái),人工智能領(lǐng)域得到了媒體界、產(chǎn)業(yè)界和學(xué)術(shù)界等前所未有的關(guān)注,機(jī)器正在越來(lái)越多的取代人類(lèi)特有的優(yōu)勢(shì)和技能,這其中最為重要的可能就是圖像識(shí)別技術(shù)。本文將從圖像識(shí)別技術(shù)的原理闡述出發(fā),介紹這一技術(shù)在安防行業(yè)的具體應(yīng)用,并且闡述其在當(dāng)前安防應(yīng)用上碰到的困難。當(dāng)然,面對(duì)這些困難,圖像識(shí)別技術(shù)將以此為契機(jī),與安防技術(shù)實(shí)現(xiàn)更大范圍的融合與發(fā)展。
圖像識(shí)別技術(shù)與人工智能
說(shuō)起圖像識(shí)別,人類(lèi)的這一能力非常突出。圖形**作用于感覺(jué)器官,人們辨認(rèn)出它是經(jīng)驗(yàn)過(guò)的某一圖形,甚至能感知到與圖像距離或者形狀的改變,這一過(guò)程叫做圖像再認(rèn)。在圖像識(shí)別中,既要有當(dāng)時(shí)進(jìn)入感官的信息,也要有記憶中存儲(chǔ)的信息。只有通過(guò)存儲(chǔ)的信息與當(dāng)前的信息進(jìn)行比較的加工過(guò)程,才能實(shí)現(xiàn)對(duì)圖像的再認(rèn)。
計(jì)算機(jī)圖像識(shí)別技術(shù),則是利用計(jì)算機(jī)對(duì)圖像進(jìn)行處理、分析和理解,以識(shí)別各種不同模式的目標(biāo)和對(duì)象的技術(shù)。圖像識(shí)別所研究的問(wèn)題,是如何用計(jì)算機(jī)代替人類(lèi)去自動(dòng)處理大量的物理信息,解決人類(lèi)所無(wú)法識(shí)別或者識(shí)別過(guò)于耗費(fèi)資源的問(wèn)題,從而很大程度上解放人類(lèi)的勞動(dòng)力。
圖像識(shí)別技術(shù)是人工智能的一個(gè)重要領(lǐng)域。圖像識(shí)別技術(shù)是以圖像的主要特征為基礎(chǔ)的。每個(gè)圖像都有它的特征,對(duì)圖像識(shí)別時(shí)眼動(dòng)的研究表明,視線總是集中在圖像的主要特征上,也就是集中在圖像輪廓曲度最大或輪廓方向突然改變的地方,這些地方的信息量最大。而且眼睛的掃描路線也總是依次從一個(gè)特征轉(zhuǎn)到另一個(gè)特征上。由此可見(jiàn),在圖像識(shí)別過(guò)程中,知覺(jué)機(jī)制必須排除輸入的多余信息,抽出關(guān)鍵的信息。同時(shí),在大腦里必定有一個(gè)負(fù)責(zé)整合信息的機(jī)制,它能把分階段獲得的信息整理成一個(gè)完整的知覺(jué)映象。
為了編制模擬人類(lèi)圖像識(shí)別活動(dòng)的計(jì)算機(jī)程序,人們提出了不同的圖像識(shí)別模型。例如模板匹配模型。這種模型認(rèn)為,識(shí)別某個(gè)圖像,必須在過(guò)去的經(jīng)驗(yàn)中有這個(gè)圖像的記憶模式,又叫模板。當(dāng)前的**如果能與大腦中的模板相匹配,這個(gè)圖像也就被識(shí)別了。但這種模型強(qiáng)調(diào)圖像必須與腦中的模板完全符合才能加以識(shí)別,有一定的局限性。格式塔心理學(xué)家又據(jù)此提出了一個(gè)原型匹配模型。這種模型認(rèn)為,在長(zhǎng)時(shí)記憶中存儲(chǔ)的并不是所要識(shí)別的無(wú)數(shù)個(gè)模板,而是圖像的某些“相似性”。從圖像中抽象出來(lái)的“相似性”就可作為原型,拿它來(lái)檢驗(yàn)所要識(shí)別的圖像。如果能找到一個(gè)相似的原型,這個(gè)圖像也就被識(shí)別了。但是,這種模型沒(méi)有說(shuō)明人是怎樣對(duì)相似的刺 激進(jìn)行辨別和加工的,它也難以在計(jì)算機(jī)程序中得到實(shí)現(xiàn)。因此又有人提出了一個(gè)更復(fù)雜的模型,即“泛魔”識(shí)別模型。
隨著計(jì)算機(jī)技術(shù)及人工智能技術(shù)的發(fā)展,圖像識(shí)別技術(shù)越來(lái)越成為人工智能的基礎(chǔ)技術(shù),它將是未來(lái)科技領(lǐng)域幾大關(guān)鍵產(chǎn)業(yè)的核心技術(shù)之一。微軟、谷歌、Facebook、亞馬遜、百度、騰訊等巨頭都在傾注大量資源推動(dòng)這項(xiàng)功能進(jìn)步。比如微軟的圖像識(shí)別應(yīng)用“我看起來(lái)有多大”(How Old Do I Look?),成為網(wǎng)絡(luò)上紅極一時(shí)的話題。在去年舉行的第六屆ImageNet圖像識(shí)別技術(shù)比賽中,微軟憑借“圖像識(shí)別的深度殘差學(xué)習(xí)”(Deep Residual Learning for Image Recognition)系統(tǒng)獲得第一名。科技公司如此熱衷于圖像識(shí)別技術(shù)的應(yīng)用和創(chuàng)新,這種進(jìn)步顯然會(huì)大大方便互聯(lián)網(wǎng)、傳媒行業(yè)及科研領(lǐng)域的相關(guān)工作。
圖像識(shí)別技術(shù)與安防技術(shù)的融合
現(xiàn)在,圖像識(shí)別技術(shù)的應(yīng)用范圍已經(jīng)遠(yuǎn)遠(yuǎn)突破視覺(jué)的范圍,而更多地體現(xiàn)為機(jī)器智能、數(shù)字技術(shù)的特點(diǎn)。可以說(shuō),圖像識(shí)別技術(shù)就是人類(lèi)視覺(jué)認(rèn)知的延伸。
視頻監(jiān)控在過(guò)去的實(shí)際應(yīng)用中,面臨的最大問(wèn)題就是必須由人工查看視頻。視頻智能分析技術(shù)正是為解決這一問(wèn)題而生,它通過(guò)對(duì)視頻進(jìn)行智能分析、有效信息的結(jié)構(gòu)化數(shù)據(jù)提取,從而讓視頻監(jiān)控的使用者真正告別人工安防而走進(jìn)自動(dòng)化安防的新時(shí)代。
目前視頻智能分析主要有兩種產(chǎn)品形態(tài):前端智能和后端智能。前端智能以科達(dá)感知型攝像機(jī)為代表,將智能分析算法嵌入到前端攝像機(jī),前端攝像機(jī)對(duì)采集的視頻內(nèi)容立即進(jìn)行分析,提取出畫(huà)面中關(guān)鍵的、感興趣的、有效的信息,形成結(jié)構(gòu)化的數(shù)據(jù),將后端感興趣的內(nèi)容實(shí)時(shí)傳給后端做存儲(chǔ)或深入分析。后端智能是前端攝像機(jī)只負(fù)責(zé)采集視頻圖像,將碼流傳遞到后端服務(wù)器做集中處理。這樣對(duì)于后端的計(jì)算壓力比較大,也不利于實(shí)時(shí)處理。更合理的方式是前端攝像機(jī)進(jìn)行基礎(chǔ)的結(jié)構(gòu)化數(shù)據(jù)提取,后端服務(wù)器再進(jìn)行深度二次分析;也就是說(shuō),將前端和后端配合起來(lái)做智能分析,才真正讓視頻圖像智能分析實(shí)現(xiàn)最大化價(jià)值。
視頻監(jiān)控領(lǐng)域是圖像識(shí)別技術(shù)一直在尋求突破的主要領(lǐng)域之一。視頻智能分析技術(shù)目前在公安、交通、零售、司法、教育等行業(yè)都獲得了普及性應(yīng)用。
公安
公安行業(yè)借助智能視頻分析主要用于實(shí)現(xiàn)城市道路、廣場(chǎng)及各類(lèi)重點(diǎn)場(chǎng)所的人、車(chē)、物等目標(biāo)的識(shí)別,提取包括人的性別、人臉、全身等信息,車(chē)的車(chē)標(biāo)、車(chē)牌、車(chē)身顏色等信息,這些信息均可提煉為計(jì)算機(jī)能識(shí)別的結(jié)構(gòu)化數(shù)據(jù),送入后端進(jìn)行專(zhuān)業(yè)的安全管理應(yīng)用,主要包括實(shí)時(shí)布控、高危人員比對(duì)、以圖搜圖、多點(diǎn)碰撞、語(yǔ)義搜索等方面。
交通
具有分析、感知能力的智能攝像機(jī)通過(guò)視頻識(shí)別分析技術(shù),可對(duì)每輛車(chē)進(jìn)行完整的違法行為分析、識(shí)別、抓拍和錄像,記錄車(chē)輛違法的整個(gè)過(guò)程,再將每條記錄生成非結(jié)構(gòu)化的視頻、照片數(shù)據(jù)和結(jié)構(gòu)化的文本數(shù)據(jù)提交給后端智能管理與分析系統(tǒng),由系統(tǒng)進(jìn)行高度智能的交通違法行為處理?;谥悄芤曨l分析技術(shù),智能交通管理系統(tǒng)還能得出不同品牌的車(chē)型擁有量、過(guò)車(chē)高峰期、車(chē)輛進(jìn)出城高峰期及行駛方向等豐富的交通數(shù)據(jù),為城市交通流量管控、交通道路規(guī)劃等提供詳實(shí)的數(shù)據(jù)支撐。
零售
視頻智能分析在零售門(mén)店視頻監(jiān)控方面的領(lǐng)先應(yīng)用,是科達(dá)為聯(lián)合利華門(mén)店建設(shè)的熱點(diǎn)統(tǒng)計(jì)系統(tǒng),系統(tǒng)通過(guò)感知型攝像機(jī)和后端的大數(shù)據(jù)分析平臺(tái)相配合,用于開(kāi)展個(gè)人護(hù)理類(lèi)商品陳列和貨架布局的顧客行為數(shù)據(jù)收集及分析,比如顧客在不同商品前的停留時(shí)間是多少、商品陳列和貨架布局調(diào)整前后的人流動(dòng)向?qū)Ρ群唾?gòu)買(mǎi)金額對(duì)比等,進(jìn)而作為最終的經(jīng)營(yíng)決策參考。這一系統(tǒng)不僅創(chuàng)新了視頻監(jiān)控系統(tǒng)遠(yuǎn)程管理零售門(mén)店的應(yīng)用,更為連鎖零售行業(yè)如何通過(guò)視頻監(jiān)控系統(tǒng)開(kāi)展消費(fèi)數(shù)據(jù)比對(duì)、分析等大數(shù)據(jù)應(yīng)用開(kāi)創(chuàng)了有益啟示。
司法和教育
在監(jiān)獄和看守所,視頻智能分析技術(shù)更是較早得到了運(yùn)用。除傳統(tǒng)的智能分析技術(shù)應(yīng)用之外,感知型攝像機(jī)也被用在AB門(mén)等出入口,用于對(duì)所有過(guò)往人員進(jìn)行臉部和全身的圖像采集,同時(shí)提供結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)給后端管理平臺(tái),平臺(tái)對(duì)人員進(jìn)行實(shí)時(shí)比對(duì),用于有效杜絕非法出入。學(xué)校采用視頻智能分析技術(shù)可以開(kāi)展安全管理和教育錄播兩種應(yīng)用,后者通過(guò)教室內(nèi)的智能跟蹤攝像機(jī)自動(dòng)識(shí)別、跟蹤老師的運(yùn)動(dòng)圖像,同時(shí)對(duì)視頻和聲音進(jìn)行記錄,再生成錄播課程。
應(yīng)該說(shuō),圖像識(shí)別技術(shù)對(duì)于整個(gè)安防方案來(lái)說(shuō)都是一項(xiàng)艱巨而又關(guān)鍵的任務(wù),直接決定了后續(xù)圖像處理與分析的準(zhǔn)確性和便捷性。在視頻監(jiān)控領(lǐng)域,圖像識(shí)別技術(shù)正面臨著不小的挑戰(zhàn),具體可闡釋為:其一,對(duì)圖像質(zhì)量的要求越來(lái)越高,圖像識(shí)別與處理的算法也越來(lái)越復(fù)雜;其二,對(duì)圖像的實(shí)時(shí)性處理和傳輸要求越來(lái)越高;其三,圖像識(shí)別的算法更加個(gè)性化,也更加成為市場(chǎng)競(jìng)爭(zhēng)力的關(guān)鍵所在;其四,圖像數(shù)據(jù)往往涉及隱私,因此也需要提供可以信任的安全保證。面對(duì)這些挑戰(zhàn),科達(dá)深知要使圖像識(shí)別技術(shù)與安防技術(shù)實(shí)現(xiàn)更好的融合,任重而道遠(yuǎn)。盡管在業(yè)界已經(jīng)擁有了一定的知名度,科達(dá)仍然深耕于安防行業(yè),把感知型攝像機(jī)視為視頻監(jiān)控的未來(lái),在將圖像識(shí)別技術(shù)更好地應(yīng)用于具體的行業(yè)需求方面,為其他人工智能的應(yīng)用提供了一條有價(jià)值的參考路徑。
評(píng)論comment