別自嗨了,看看中美人工智能差距有多大
來源:數(shù)字音視工程網(wǎng) 編輯:davedit26 2019-03-22 09:39:33 加入收藏
文/周超臣
人工智能不能“舉國體制”。
這是我在3月20日聽完長江商學(xué)院發(fā)布《2018中國人工智能指數(shù)》之后最大的收獲和感觸。
這份報告從學(xué)術(shù)、人才、產(chǎn)業(yè)、開源/平臺及公共認(rèn)知和媒體報道五個領(lǐng)域?qū)υu估了中美在人工智能領(lǐng)域的發(fā)展現(xiàn)狀及差距,它綜合了斯坦福指數(shù)、牛津指數(shù)、麥肯錫報告、領(lǐng)英以及國內(nèi)的騰訊 、華為、清華的報告等。
中國的牛津指數(shù)得分是17分,美國得分33分,這意味著美國在人工智能潛力上幾乎是中國的2倍。
引人矚目的是在學(xué)術(shù)期刊及專業(yè)會議發(fā)表論文方面,總數(shù)上中國呈現(xiàn)快速接近美國的趨勢,在2016之后這一趨勢尤其明顯。
藍(lán)色曲線代表中國
黃色曲線代表中國
而中國的中、低引用率(0引用)的論文的發(fā)表總數(shù)在最近幾年逐漸接近美國的總數(shù),但在最具原創(chuàng)性、最具影響力的極高引用率(被引用1000次以上)和高引用率(被引用100次以上)的論文方面,中國與美國的差距巨大。
具體到領(lǐng)域,在機(jī)器學(xué)習(xí)、文本分析和NLP、計算機(jī)圖像與視頻分析、虛擬代理及群體智能等領(lǐng)域,中國的論文發(fā)表總數(shù)和被引用總數(shù)在最近幾年里大幅度縮小了與美國的差距。但是在深度學(xué)習(xí)、機(jī)器人流程自動化、以及包括推理學(xué)習(xí)等在內(nèi)的其他領(lǐng)域,從發(fā)表總數(shù)和引用率方面,中國與美國的差距仍然顯著。
至于中國在人工智能領(lǐng)域零引用論文數(shù)量比美國突出、而高引用論文數(shù)量又少得可憐的原因,長江商學(xué)院經(jīng)濟(jì)學(xué)教授、人工智能與制度研究中心主任許成鋼分析認(rèn)為主要有兩個:
第一,中國這些論文討論的問題是在比較狹窄范圍里的應(yīng)用問題,由于應(yīng)用的范圍非常狹窄,所以超出了他的范圍之外別人就沒有興趣了,因為都是應(yīng)用型的,所以也就沒有人引用了。
第二,中國的激勵機(jī)制的原因,在學(xué)校里面是要數(shù)數(shù)的,數(shù)你在國際期刊上發(fā)了多少篇。“當(dāng)你的評價體制高度偏重于數(shù)數(shù)字的時候,就會引導(dǎo)著他們追求數(shù)字大,而不是追求質(zhì)量高。這兩個中間是有矛盾的,因為你要為了質(zhì)量高,你可能就要慢下來,你要是為了數(shù)字高,你可能把一篇論文拆成三篇,拆了以后每一篇就都不重要了,合成一篇可能就是一篇很重要的文章。”
長江商學(xué)院經(jīng)濟(jì)學(xué)教授、人工智能與制度研究中心主任許成鋼
許成鋼在接受虎嗅采訪時強(qiáng)調(diào),無論是國際期刊還是國際會議,都是經(jīng)過同行評議的,也就是說,能在國際期刊上發(fā)表的論文,其基本質(zhì)量是有保證的。
武漢大學(xué)大數(shù)據(jù)與云計算實(shí)驗室主任崔曉暉與許成鋼的觀點(diǎn)不謀而合:“我們在中國體制內(nèi)大學(xué),大家可能應(yīng)該知道有一個SCI現(xiàn)象(Scientific Citation Index,《科學(xué)引文索引》),也就是你的水平高和低,或者你從講師評到副教授或者是教授,人事處就數(shù)這個教授發(fā)了多少篇SCI文章,從來不管你這篇文章到底有多大的影響力。這就是SCI現(xiàn)象。”
除了學(xué)術(shù)領(lǐng)域,在人工智能人才方面中美的對比也非常有趣,據(jù)領(lǐng)英人才數(shù)據(jù)庫統(tǒng)計,中國的AI人才總數(shù)為5萬,而美國的AI人才總數(shù)為83萬。具體到工作年限和分布領(lǐng)域的話——
工作年限。在中國,工作10年以下人工智能領(lǐng)域的人在各個年限都超過美國同行,而美國則在工作10年以上的人才方面遠(yuǎn)超中國,美國超過71.5%的人工智能領(lǐng)域的人工作了10年以上,而中國這一比例為38.7%。
分布領(lǐng)域。在人工智能的基本算法、芯片、傳感器等方面中國都落后于世界上多數(shù)的發(fā)達(dá)國家,尤其美國。
除了上面說的,報告還對其他領(lǐng)域進(jìn)行了總結(jié),如下:
在產(chǎn)業(yè)領(lǐng)域,中國的活躍的人工智能初創(chuàng)公司整體上呈快速發(fā)展趨勢,2016年超過400家,達(dá)到頂峰。中國活躍的人工智能初創(chuàng)公司數(shù)字在2012年之前多于美國,但是在2012年以后美國超過中國,而且在2016年之后,美國快速上升,在2018超過600家,而中國則在2016之后下降,在2018降至不到200家。
在人工智能的學(xué)術(shù)人才方面,除了有特大影響的人才外,中國發(fā)表有影響(即被引用的)論文的作者人數(shù)與美國之間的差距持續(xù)縮小。發(fā)表沒有被引用的論文的作者人數(shù),最近幾年大幅增加,超過美國。但特大影響(特高引用率)作者的人數(shù)顯著少于美國。
開源軟件包,作為度量人工智能研發(fā)程度的指標(biāo)。中國在最近三年里,關(guān)注人工智能開源軟件包的總數(shù)迅速上升,并在2017年秋超過了美國。但是,幾乎93%的中國研究者使用的人工智能開源軟件包,是美國的機(jī)構(gòu)開發(fā)提供的。中美兩國人工智能研究者使用最多的軟件包是Google開發(fā)的TensorFlow。在2018年初,中美研究人員對此的關(guān)注人數(shù),分別達(dá)到將近9000和約7000。
公共認(rèn)知和媒體報道方面,在2014年之前,中國媒體對人工智能的正面報道略多于負(fù)面,差距不大。此后,負(fù)面報道持續(xù)下降,正面報道逐年增加,全面壓倒負(fù)面報道。相比之下,全球英語世界的報道,多數(shù)屬于沒有正負(fù)之分的中性。在2013到201年之間,正負(fù)報道之間的差距曾經(jīng)大幅度縮小。在2016之后,正面報道大幅度提高,而負(fù)面報道則沒有顯著變化。 這個趨勢與2016年之后美國人工智能投資初創(chuàng)企業(yè)的快速增長高度相關(guān)。
武漢大學(xué)大數(shù)據(jù)與云計算實(shí)驗室主任崔曉暉教授
崔曉暉教授在接受虎嗅采訪時表示,在基礎(chǔ)人才培養(yǎng)方面不應(yīng)該在大學(xué)里專門設(shè)一個人工智能相關(guān)的學(xué)科或?qū)W院:“人工智能是一個高度交叉的學(xué)科,應(yīng)該把人工智能做成一個通識課,分布在各個專業(yè)里,從小學(xué)、中學(xué)乃至大學(xué)都應(yīng)該讓學(xué)生去學(xué)一點(diǎn)。”
他說,學(xué)科建設(shè)更多的是高端人工智能人才的培養(yǎng):“在這方面更多的是基礎(chǔ)理論,這就需要一個學(xué)科,在資源獲取上更容易一些,因為中國在資源分配方面是按照學(xué)科給你分配的。這也就是為什么很多體制內(nèi)大學(xué)的教授一直強(qiáng)調(diào)要建一個學(xué)科,其實(shí)是為了更好的獲取資源。”
《科技日報》總編輯劉亞東則建議,中國在搞重大的國家科學(xué)發(fā)展規(guī)劃的時候,應(yīng)該更多地發(fā)揮市場功能,調(diào)動企業(yè)特別是企業(yè)家參與的熱情,這個事情政府是不能取代的。
“如果給我們國家的人工智能國家計劃提建議的話,就是政府的作用、角色要發(fā)生轉(zhuǎn)換,要從領(lǐng)導(dǎo)變成引導(dǎo),從定規(guī)劃變成定規(guī)則,得完成這樣一個角色的轉(zhuǎn)換,這樣的話人工智能產(chǎn)業(yè)才能夠健康發(fā)展。”劉亞東說。
一句話總結(jié),就是搞人工智能不能搞“舉國體制”。
崔曉暉表示,任何的創(chuàng)新都是不可能預(yù)知和不可規(guī)劃的,更多的是在一些隨機(jī)事件中所產(chǎn)生的,“甚至有一些創(chuàng)新剛出來我們本身并不知道它有很大影響或者是很大的創(chuàng)新。”
如何避免“舉國體制”呢?許成鋼對虎嗅表示,問題在于資源如何配置,尤其在一個快速發(fā)展的、新的、高度不確定性的領(lǐng)域:“基礎(chǔ)科學(xué)的資源應(yīng)該是由本行的專家來決定配置,應(yīng)用性的工作資源由風(fēng)險投資來決定,風(fēng)險投資是政府沒有辦法做的。”
也就是說,應(yīng)避免把大量的社會資源調(diào)動起來、人為地朝某些地方投入,因為你投入最大的那個領(lǐng)域,最大的可能是失敗。
政府主導(dǎo)的風(fēng)險投資和私人基金主導(dǎo)的風(fēng)險投資的根本區(qū)別在于,前者更關(guān)心的是你申請了多少個專利,而不在乎你的死活,因為它不會讓你死,而后者則相反,它要求企業(yè)的第一要務(wù)是活下去。
“你把目的放到了專利上,你就引導(dǎo)了他們生產(chǎn)大量沒有用的專利,那么這樣子的企業(yè),它就不可能在激烈的技術(shù)發(fā)展和競爭的過程中脫穎而出。”許成鋼解釋說。
在他看來,只要你不是真正創(chuàng)新創(chuàng)出來能制造價值的,你在市場上就要死,這是市場機(jī)制里的最基本部分,因為優(yōu)勝劣汰的基本機(jī)制,靠的就是多數(shù)的企業(yè)要死。
許成鋼教授補(bǔ)充說:“在過去超過半個世紀(jì)的所有的創(chuàng)新,最大的創(chuàng)新的工作都產(chǎn)生于小企業(yè),這也是一個基本規(guī)律。”
上面提到,美國在基礎(chǔ)科學(xué)領(lǐng)域做得遠(yuǎn)遠(yuǎn)比中國好,中國則更多的是在應(yīng)用層。從去年或更早些時候開始,中國的企業(yè)才開始意識到要往基礎(chǔ)科學(xué)方面下沉和側(cè)重,比如阿里成立達(dá)摩院,馬化騰呼吁關(guān)注基礎(chǔ)科學(xué),都是這樣的例子。
中國在基礎(chǔ)科學(xué)上和美國等發(fā)達(dá)國家的差距,許成鋼認(rèn)為,有兩個方面的原因,一個是歷史上積累的,從來差距就很大;第二就是直接跟這個制度尤其是大學(xué)制度有關(guān),在美國等發(fā)達(dá)國家的大學(xué)制度里,講究的是教授治校自由。
許成鋼跟虎嗅分析道:“創(chuàng)造性的工作是很難靠評價體系引導(dǎo)出來的,它更多的是靠人的想象力,而想象力很難通過評價體系引導(dǎo)出來。”
忠言逆耳,希望有關(guān)部門能明白。
評論comment