解讀 云視鏈背后的“讀眼”技術(shù)
來源:數(shù)字音視工程網(wǎng) 作者:黃通兵 編輯:航行150 2015-07-30 15:19:42 加入收藏 咨詢

所在單位: | * |
姓名: | * |
手機(jī): | * |
職位: | |
郵箱: | * |
其他聯(lián)系方式: | |
咨詢內(nèi)容: | |
驗(yàn)證碼: |
|
今天整個(gè)科技圈都被云視鏈霸了屏,又是一個(gè)青年才俊創(chuàng)業(yè)的勵(lì)志故事,22歲就擁有哈佛大學(xué)高材生、創(chuàng)業(yè)公司CEO、6億估值、福布斯創(chuàng)業(yè)榜單最年輕創(chuàng)業(yè)者等諸多光環(huán),而透過這些光環(huán)我們?cè)摽匆豢丛埔曟準(zhǔn)欠裾娴挠锌雌饋砟敲碿ool。
看看媒體是怎么說的吧:
拋開用戶在觀看視頻過程中是否愿意那么多的互動(dòng)(廣告)不說,今天主要探討一下,一聽就覺得吊炸天的通過捕捉眼球信息來實(shí)現(xiàn)觀眾情緒和思維在視頻中的實(shí)時(shí)反饋互動(dòng)。
作為眼球追蹤行業(yè)的從業(yè)者,我的分析可能讓很多剛剛有點(diǎn)興奮的讀者失望了,從報(bào)道中所提到的云視鏈的技術(shù)來看,通過普通家用攝像頭捕捉人眼注視點(diǎn)可是沒那么容易實(shí)現(xiàn)的!
1、技術(shù)現(xiàn)狀
目前在世界范圍內(nèi)眼球追蹤技術(shù)的實(shí)現(xiàn)主要是通過眼電圖法、鞏膜接觸鏡法、眼圖錄像法、角膜反射法。
眼電圖法應(yīng)用較早,它是通過放置于眼鏡附近的電極測量皮膚的電勢(shì)差,實(shí)現(xiàn)眼動(dòng)測量。
眼電圖法在40年前就已經(jīng)廣泛應(yīng)用,至今仍有部分領(lǐng)域使用此法測量。
鞏膜接觸鏡法是將光學(xué)部件置于一個(gè)接觸鏡上,并將接觸鏡輕置于眼球上,這種方法在5°范圍內(nèi)可以達(dá)到5“~10”的精度,因此也是被認(rèn)為精度最高的眼球追蹤法。但是因?yàn)椴僮骶雀?,并且?duì)于人眼有一定的傷害因此并未廣泛應(yīng)用。
以上兩種方法普及性太差,對(duì)于普通用戶來說根本無法實(shí)現(xiàn)。
眼圖錄像法主要是通過辨認(rèn)眼球的特征如瞳孔外形、異色邊緣(虹膜、虹膜邊界)、近距指向光源的角膜反射來實(shí)現(xiàn)眼動(dòng)跟蹤。
根據(jù)云視頻的宣傳,其所提到的能夠讀懂人“眼神意識(shí)”的視頻技術(shù),就是基于此項(xiàng)技術(shù),也就是眼圖錄像法。
2、技術(shù)實(shí)現(xiàn)的硬傷在哪里?
然而虹膜識(shí)別+瞳孔運(yùn)動(dòng)識(shí)別雖然可以捕捉人眼的動(dòng)作,但是卻無法檢測到人眼的注視點(diǎn),這才是最大的硬傷!
首先,虹膜識(shí)別和瞳孔識(shí)別都是基于一個(gè)平面的,要測量注視點(diǎn)就必須保證頭部是固定的,讓眼睛同頭部和注視點(diǎn)的相對(duì)位置一致才可以。人眼作為人體最精細(xì)的器官之一,注視點(diǎn)轉(zhuǎn)移僅需要一個(gè)微小的動(dòng)作,而人類僅僅因?yàn)楹粑斐傻念^部動(dòng)作就足以讓測量誤差造成定位偏移。
然后我們?cè)偻艘蝗f步講,即使的頭部是固定的,對(duì)于虹膜的識(shí)別也沒那么容易,歐洲人的人眼特征較為明顯,識(shí)別相對(duì)容易,但也不是一個(gè)家用普通攝像頭就可以判斷眼球特征的,而亞洲人瞳孔多為深褐色,人眼特征較弱,普通攝像頭幾乎無法捕捉。
因此從云視鏈的眼球追蹤技術(shù)的出發(fā)點(diǎn)來說,通過眼神就能推送出你想要的信息是無法實(shí)現(xiàn)的!
那么,云視鏈的視頻與觀眾眼神關(guān)注點(diǎn)的實(shí)時(shí)反饋也是根本無法實(shí)現(xiàn)的嗎?其實(shí)并非如此。
剛也已經(jīng)提到,云視鏈以虹膜識(shí)別+瞳孔運(yùn)動(dòng)識(shí)別為出發(fā)點(diǎn)的,就是這個(gè)起點(diǎn)讓他們走錯(cuò)了路。不知道有沒有細(xì)心的讀者注意到,其實(shí)眼球追蹤技術(shù)的實(shí)現(xiàn)還有一種方法我沒有說?那就是角膜反射法。接下來就介紹一下這種可以通過普通攝像頭即可捕捉人眼注視點(diǎn)的方法,搬好板凳,買好瓜子。
角膜反射法是目前眼球追蹤領(lǐng)域被廣泛認(rèn)可并應(yīng)用的方法,主要通過攝像頭捕捉人眼特征,通過算法建立人眼二維或者三維注視點(diǎn)估計(jì)模型,通過算法判斷人眼動(dòng)作和注視點(diǎn)。
眼球的特殊構(gòu)造會(huì)形成一到多個(gè)浦肯野像,基于這種方法的眼球追蹤一般定位第一浦肯野像,通過定標(biāo)步驟,可以測量出在垂直平面現(xiàn)實(shí)定標(biāo)點(diǎn)表面上人眼的注視點(diǎn)。
來張示意圖看看:
為了從頭部運(yùn)動(dòng)中區(qū)分眼球動(dòng)作,需要眼球上的兩個(gè)參考點(diǎn)。這種瞳孔中心與角膜反射之間的位置差異之隨眼球轉(zhuǎn)動(dòng)而變化,同輕微的頭部運(yùn)動(dòng)相對(duì)恒定,不管瞳孔在眼眶中如何轉(zhuǎn)動(dòng),浦肯野像同眼球相對(duì)固定。目前我在七鑫易維了解到的眼球追蹤算法,已經(jīng)做到了頭部的正常動(dòng)作不影響注視點(diǎn)的判斷,并且采用紅外弱光進(jìn)行彌補(bǔ)了亞洲人人眼特征不明顯的問題,可以很精準(zhǔn)地捕捉到人眼的注視點(diǎn)。可以說,這樣的技術(shù)已經(jīng)不是問題。
根據(jù)大腦——眼睛一致性假設(shè),人們所看的一般是其大腦中正在處理的內(nèi)容,這是人類視覺系統(tǒng)的工作方式?;谶@個(gè)假設(shè),采用眼動(dòng)跟蹤技術(shù)來研究人類心理已有近百年的歷史。在人機(jī)交互過程中,注視等同于注意力。
所以說云視鏈的“讀眼神”完全可以實(shí)現(xiàn),但是路徑要正確。
以“眼神推薦系統(tǒng)”為例。
首先,根據(jù)角膜反射技術(shù)及相關(guān)算法,完全可以捕獲到用戶的注視點(diǎn)。接下來,可以對(duì)用戶的注視目標(biāo)進(jìn)行模式識(shí)別(例如,識(shí)別出他注視的形狀是一個(gè)紅色的女士手提包)。進(jìn)而可以根據(jù)用戶的瀏覽記錄提取一些框架信息,比如,用戶看的都是紅色、細(xì)帶的手提包,并且注視點(diǎn)經(jīng)常停留在包的發(fā)行時(shí)間上,可以推斷這個(gè)用戶目前就是想買一個(gè)紅色的細(xì)帶手提包,而且很關(guān)注它是不是新上市的潮流產(chǎn)品;可以通過分析瞳孔直徑的變化,推斷用戶的情緒。
在以上三點(diǎn)的基礎(chǔ)上,完全可以給用戶實(shí)現(xiàn)精準(zhǔn)推送,匹配某寶、某東的物品給用戶。這和很多購物網(wǎng)站上的“猜你喜歡”之類的標(biāo)簽?zāi)撤N意義上原理是一致的,不過過去只能通過分析用戶點(diǎn)擊、分析購物車等操作才能記錄喜好,現(xiàn)在只要一個(gè)眼神。從對(duì)用戶認(rèn)知的把握與實(shí)現(xiàn)簡易程度兩個(gè)層面來講,可以說,眼動(dòng)跟蹤技術(shù)產(chǎn)生的數(shù)據(jù)非常寶貴,且是其他輸入通道所無法替代的。
對(duì)于眼球追蹤技術(shù)方面產(chǎn)業(yè)鏈,國內(nèi)目前有很多,而真正實(shí)現(xiàn)技術(shù)突破的并不多,這也導(dǎo)致國人對(duì)新技術(shù)狂歡。但是,反觀眼球追蹤方面的突破給特定人群帶來的希望也很勵(lì)志,比如“中國的霍金”王甲用眼睛寫出了兩本書,漸凍人“好想飛”也用眼睛打字開起了網(wǎng)店。這些都是技術(shù)帶來的美好。
視覺在人類獲取信息渠道所占比例超過80%,注視點(diǎn)信息就是視覺信息中最重要的,眼球追蹤技術(shù)會(huì)給很多行業(yè)帶來翻天覆地的變化,也會(huì)孕育出新的偉大公司,但絕不會(huì)是沒有核心技術(shù)的忽悠型公司。
(本文作者黃通兵,系七鑫易維CEO,眼控行業(yè)相關(guān)人士。本文僅代表作者個(gè)人觀點(diǎn))
評(píng)論comment