智能視覺(jué)技術(shù)在安防領(lǐng)域的應(yīng)用與發(fā)展
來(lái)源:數(shù)字音視工程網(wǎng) 編輯:航行150 2015-03-26 09:55:55 加入收藏
通俗地說(shuō),智能視覺(jué)技術(shù),就是通過(guò)計(jì)算機(jī)自動(dòng)對(duì)攝像頭采集的視頻信息進(jìn)行分析處理,從視頻序列中捕捉存在的感興趣區(qū)域及目標(biāo),并進(jìn)一步獲取目標(biāo)的出現(xiàn)時(shí)間、運(yùn)動(dòng)軌跡、顏色等諸多信息,通過(guò)對(duì)各個(gè)目標(biāo)的上述信息的分析。
智能視覺(jué)技術(shù)核心是運(yùn)動(dòng)目標(biāo)檢測(cè)、分類、跟蹤與識(shí)別技術(shù)等。運(yùn)動(dòng)目標(biāo)檢測(cè)是將視頻圖像序列中的感興趣目標(biāo)(如車輛或人)檢測(cè)出來(lái),以備后續(xù)步驟的使用;目標(biāo)檢測(cè)的目的就是準(zhǔn)確地從通過(guò)運(yùn)動(dòng)檢測(cè)得到的運(yùn)動(dòng)區(qū)域中提取出與目標(biāo)相對(duì)應(yīng)的團(tuán)點(diǎn)。
研究人員已經(jīng)開(kāi)發(fā)了多種運(yùn)動(dòng)目標(biāo)檢測(cè)的方法,包括幀間差分法,光流法和背景減除算法。根據(jù)實(shí)際應(yīng)用需求的不同,不同的檢測(cè)算法都是在可靠性、實(shí)時(shí)性和準(zhǔn)確性之間折衷得到的。目標(biāo)分類的目的是從檢測(cè)到的運(yùn)動(dòng)區(qū)域中將對(duì)應(yīng)于人的運(yùn)動(dòng)區(qū)域提取出來(lái).不同的運(yùn)動(dòng)區(qū)域可能對(duì)應(yīng)于不同的運(yùn)動(dòng)目標(biāo),比如交通道路上監(jiān)控?cái)z像機(jī)所捕捉的序列圖像中可能包含行人、車輛及其它諸如飛鳥(niǎo)、流云、搖動(dòng)的樹(shù)枝等運(yùn)動(dòng)物體,為了便于進(jìn)一步對(duì)行人進(jìn)行跟蹤和行為分析,運(yùn)動(dòng)目標(biāo)的正確分類是完全必要的.注意,這個(gè)步驟在一些情況下可能是不必要的(比如已經(jīng)知道場(chǎng)景中僅僅存在人的運(yùn)動(dòng)時(shí))。運(yùn)動(dòng)目標(biāo)跟蹤是在需要監(jiān)控的環(huán)境里,如何能夠判斷出進(jìn)入特定區(qū)域的目標(biāo),并且能夠跟蹤目標(biāo)的軌跡。
具體可分為兩種情況:一是靜態(tài)背景下的目標(biāo)跟蹤;二是動(dòng)態(tài)背景下的目標(biāo)跟蹤。靜態(tài)背景下的目標(biāo)跟蹤方法具體可分為單目標(biāo)跟蹤與多目標(biāo)跟蹤。單目標(biāo)的靜態(tài)背景下的目標(biāo)跟蹤指的是攝像頭是固定在某一方位,其所觀察的視野也是靜止的。多目標(biāo)跟蹤是指在靜態(tài)環(huán)境下的多目標(biāo)跟蹤,需要確定每個(gè)目標(biāo)的特征,位置,運(yùn)動(dòng)方向,速度等信息。動(dòng)態(tài)背景下的目標(biāo)跟蹤指的是攝像頭在云臺(tái)控制下旋轉(zhuǎn),會(huì)使得他所采集的圖像時(shí)可在變化,所以,對(duì)于整個(gè)目標(biāo)跟蹤過(guò)程來(lái)說(shuō),背景是變化,目標(biāo)也是在整個(gè)過(guò)程中運(yùn)動(dòng)的,所以跟蹤起來(lái)較有難度。人的行為理解與描述是越來(lái)越被廣泛關(guān)注的研究熱點(diǎn),它是指對(duì)人的運(yùn)動(dòng)模式進(jìn)行分析和識(shí)別,并用自然語(yǔ)言等加以描述.行為理解可以簡(jiǎn)單地認(rèn)為是時(shí)變數(shù)據(jù)的分類問(wèn)題,即將測(cè)試序列與預(yù)先標(biāo)定的代表典型行為的參考序列進(jìn)行匹配。
當(dāng)前的智能視覺(jué)技術(shù)主要集中在基于RGB光學(xué)圖像的處理上,根據(jù)各種顏色空間、目標(biāo)的紋理結(jié)構(gòu)分析或者灰度特征、運(yùn)動(dòng)特征等來(lái)檢測(cè)與跟蹤目標(biāo),但由于RGB圖像無(wú)法獲取物體在三維空間中的距離信息,相關(guān)的算法受到周圍環(huán)境、光照變化、背景等因素的影響,在目標(biāo)檢測(cè)與跟蹤上魯棒性較差,難以實(shí)現(xiàn)復(fù)雜場(chǎng)景下的任意目標(biāo)檢測(cè)和在線跟蹤,應(yīng)用受到很大的限制。
因?yàn)椴噬珨z像頭獲取的圖像只保留了空間的二維信息,所以這些方法都是二維空間上進(jìn)行處理,只能獲得目標(biāo)的二維運(yùn)動(dòng)信息。真實(shí)世界中的目標(biāo)是在三維空間運(yùn)動(dòng)的,如果只獲取二維運(yùn)動(dòng)信息將難以達(dá)到實(shí)際應(yīng)用的魯棒性要求。因此,越來(lái)越多的研究者開(kāi)始利用深度圖像來(lái)進(jìn)行目標(biāo)的檢測(cè)、跟蹤與識(shí)別。目前通過(guò)圖像感應(yīng)器獲取三維信息主要有兩種方式。其中一種原理與人眼視覺(jué)系統(tǒng)類似,采用兩個(gè)彩色攝像頭同時(shí)拍攝同一場(chǎng)景,通過(guò)兩個(gè)攝像頭的視差推導(dǎo)出場(chǎng)景中像素離攝像機(jī)的遠(yuǎn)近,即深度(Depth)。這種方式通常稱為雙目立體視覺(jué)(BinocularStereoVision)。利用雙目圖像推導(dǎo)深度信息需要先計(jì)算兩幅圖像像素之間的對(duì)應(yīng)關(guān)系,即左邊圖像的像素與右邊圖像的哪個(gè)像素是描述的空間中的同一個(gè)點(diǎn)。根據(jù)投影關(guān)系,距離較遠(yuǎn)的點(diǎn)投射到兩個(gè)圖像平面的坐標(biāo)偏差較小。利用這一原理可以通過(guò)坐標(biāo)偏差推導(dǎo)出深度。
評(píng)論comment