中國人工智能崛起直追美國 但在這些方面還有差距
中國人工智能崛起直追美國 但在這些方面還有差距
作為人工智能國際頂級會議,由美國人工智能協(xié)會(American Association for Artificial Intelligence)組織的AAAI大會在美國舊金山召開,在今年的大會上中國面孔成為不可忽視的力量。在2571篇投稿論文中,中國和美國的投稿數(shù)量分別占到31%和30%,雖然在被接收論文數(shù)量上,中國還是低于美國,但數(shù)量已經(jīng)大幅提升。
一個小插曲則是,今年的AAAI大會原計劃在新奧爾良召開,由于和中國春節(jié)沖突,AAAI Fellow、AAAI現(xiàn)任執(zhí)委楊強(qiáng)教授和幾位教授緊急向組委會發(fā)送郵件,使得最終破格更改了時間和地點。
可見,中國在AI領(lǐng)域正在蓄勢,逐步成長為中堅力量。據(jù)《烏鎮(zhèn)指數(shù):全球人工智能發(fā)展報告》,在全球人工智能專利數(shù)量方面,中國以15745個緊跟在美國26891個之后位列第二,日本以14604個排名第三。值得一提的是,三國占總體專利的73.85%。
華人勢力
“不僅僅是學(xué)者,來參會的中國公司也變多了?!睏顝?qiáng)表示。從今年的活動贊助商而言,百度、騰訊和亞馬遜、IBM一并成為金牌贊助商,小i機(jī)器人、今日頭條也躋身銀牌贊助商之列。在今年收錄的論文中,百度、騰訊、華為、360、今日頭條、攜程等中國公司的人工智能團(tuán)隊也有出現(xiàn)。
百度研究院院長林元慶對第一財經(jīng)記者說,過去幾年里,她在參加國際上人工智能領(lǐng)域的頂級會議中,確實可以看到參加會議的華人非常多,而且在過去幾年里增長很快。他認(rèn)為這同時也和國內(nèi)幾家公司在人工智能領(lǐng)域的投入有關(guān)系。
“中國人適合做人工智能,世界上43%的人工智能論文都是中國人寫的?!眲?chuàng)新工場創(chuàng)始人李開復(fù)(微博)曾向第一財經(jīng)表示。根據(jù)美國白宮此前發(fā)布的《國家人工智能研究與發(fā)展策略規(guī)劃》來看,從2013年到2015年,SCI收錄的論文中,“深度學(xué)習(xí)”或“深度神經(jīng)網(wǎng)絡(luò)”的文章增長了約6倍,按照文章數(shù)量計算,美國已經(jīng)不再是世界第一。在增加“文章必須至少被引用過一次”附加條件后,中國在2014年和2015年都超過美國,位居前列。
“這一輪人工智能并不是一個新的革命,而是18世紀(jì)工業(yè)革命自動化的一個延續(xù),技術(shù)一旦掌握到手里,可以迅速擴(kuò)展到做全世界的生意,所以這對于中國起到了一個彎道超車的作用?!睏顝?qiáng)表示。
中國人數(shù)學(xué)好、刻苦努力無疑為中國發(fā)展人工智能提供了良好的基礎(chǔ),但更大的驅(qū)動力在于產(chǎn)業(yè)需求。一方面對于傳統(tǒng)企業(yè)而言,需要新技術(shù)來推動產(chǎn)業(yè)變革,“中國的經(jīng)濟(jì)結(jié)構(gòu)還有很多不合理、低效率的地方,通過人工智能浪潮,就形成了一種新的競爭。”楊強(qiáng)強(qiáng)調(diào)。
對于互聯(lián)網(wǎng)巨頭或新興獨角獸公司而言,同樣需要借助人工智能技術(shù),激發(fā)已經(jīng)存儲的海量數(shù)據(jù),提升服務(wù)精準(zhǔn)度,創(chuàng)造潛在盈利機(jī)會,“互聯(lián)網(wǎng)大市場孕育的應(yīng)用到C輪需要人工智能。”李開復(fù)表示。例如今日頭條在借助人工智能技術(shù),將新聞內(nèi)容和視頻進(jìn)行重新排序,實現(xiàn)資訊分發(fā)的千人千面,美圖也利用人像數(shù)據(jù)庫,對數(shù)據(jù)進(jìn)行標(biāo)記、結(jié)構(gòu)化,優(yōu)化圖像算法。
“全世界只有中美兩國有如此大量的數(shù)據(jù)、大規(guī)模的計算和應(yīng)用場景,在應(yīng)用層面中美基本處于同一起跑線?!钡仄骄€機(jī)器人技術(shù)創(chuàng)始人兼首席執(zhí)行官余凱向第一財經(jīng)表示。余凱曾擔(dān)任百度研究院副院長、深度學(xué)習(xí)實驗室(IDL)主任,帶領(lǐng)的團(tuán)隊將深度學(xué)習(xí)技術(shù)成功應(yīng)用于廣告、搜索、圖像、語音等方面,在此之前他也曾在美國NEC研究院、西門子數(shù)據(jù)研究部、微軟亞洲研究院工作。
在余凱看來,中國有世界上最大的互聯(lián)網(wǎng)公司,且擁有搜索、社交、電商、互聯(lián)網(wǎng)金融等很好的應(yīng)用場景,“大規(guī)模的計算平臺都需要大規(guī)模的應(yīng)用場景,在小實驗室是做不了的,年輕人在這樣的工作環(huán)境中會得到持續(xù)的鍛煉,包括工程實驗?zāi)芰?、對算法的理解等。?/p>
“最大的優(yōu)勢是人多,這種優(yōu)勢體現(xiàn)在三個層面,人多意味著市場大,有更強(qiáng)的驅(qū)動力去把這件事情做好。其次針對社會服務(wù)層面,需要很多數(shù)據(jù)。第三,人才基數(shù)比較大,冒出頂尖人才相對多一些。”第四范式創(chuàng)始人、首席執(zhí)行官戴文淵告訴記者,“從數(shù)據(jù)量、投入的人力財力來看,中美之間沒有多少差距,且中國更有優(yōu)勢?!?/p>
中美差異
但將論文數(shù)量視為中國人工智能發(fā)展水平有失公允,雖然在靠近商業(yè)價值應(yīng)用層面中美并駕齊驅(qū),但在基礎(chǔ)性、原創(chuàng)性研究、創(chuàng)新土壤、人才儲備層面,中國相較美國還存在不小的差距。
“國內(nèi)更多是技術(shù)的落地、產(chǎn)業(yè)化和應(yīng)用,國外仍然有很多人在公司和研究院做前沿研究,包括尋求方法論上的突破,我們擅長把事情做得更細(xì)致,相對而言突破性和奠基性的工作還不夠多?!钡仄骄€機(jī)器人技術(shù)聯(lián)合創(chuàng)始人、算法副總裁黃暢告訴第一財經(jīng)。
黃暢畢業(yè)于清華大學(xué)計算機(jī)科學(xué)與技術(shù)系,曾在美國南加州大學(xué)和NEC美國研究院擔(dān)任研究員,2012年加入百度美國研發(fā)中心,2013年和余凱參與組建百度深度學(xué)習(xí)研究院,任高級科學(xué)家、主任研發(fā)架構(gòu)師。在黃暢看來,做研究無外乎尋找新的問題和研究新的方法,而在這兩方面國內(nèi)和國外相比還存在不小的差距。
楊強(qiáng)認(rèn)為,深度學(xué)習(xí)是不斷發(fā)展的,研究領(lǐng)域的領(lǐng)導(dǎo)者應(yīng)該是開拓新的領(lǐng)域,而不是在原有的基礎(chǔ)上深挖?!鞍岩粋€10層的深度模型拓展到100層甚至1000層,我覺得這個確實是一個進(jìn)步,中國人目前是這個層次,但這些在我看來并不是一個原創(chuàng)?!睏顝?qiáng)舉例說道。
“現(xiàn)在很多高校是看教授和學(xué)生的論文達(dá)標(biāo)情況,頂級會議論文的發(fā)表對學(xué)生申請院校、教授評級、申請科研經(jīng)費等都有幫助,真正做出突破性理論研究,不迎合考核體系的非常少?!贝魑臏Y直言。在他看來,雖然有相當(dāng)數(shù)量的人參與到人工智能研究,但優(yōu)秀的研究成果并不與參與人數(shù)的激增成正比。
余凱認(rèn)為,有一些中國學(xué)生很擅長“刷分”、“刷榜”。“別人做到99.5%,我做了99.7%,并不一定有實質(zhì)性突破,世界也沒有因為這個刷分而變得不一樣。原創(chuàng)性的創(chuàng)新需要不一樣的思考,現(xiàn)在講深度學(xué)習(xí)比較多,所有的人都進(jìn)行深度學(xué)習(xí),而不是思考What is wrong ?How to be different?”余凱強(qiáng)調(diào)。
在人工智能領(lǐng)域浸染十年有余的戴文淵也有同樣的感受,“很多人用力的方向有問題,準(zhǔn)確率達(dá)到99.1%、99.15%或者99.2%,其實沒有什么差別,并不應(yīng)該把精力用在這些地方,而應(yīng)該關(guān)注不到60分的領(lǐng)域,去把它做及格。”
回歸至深度學(xué)習(xí)的歷史發(fā)展脈絡(luò)來看,正是一個邊緣化課題走向主流技術(shù)的路徑。早在上世紀(jì)80年代初期,深度學(xué)習(xí)學(xué)派的開山人物Hinton一直堅持神經(jīng)網(wǎng)絡(luò)的探索,但受限于當(dāng)時的電腦速度、數(shù)據(jù)量等問題,深度學(xué)習(xí)理論是一項邊緣化的研究,當(dāng)時AI的主流研究方向與之截然相反,推崇小樣本學(xué)習(xí),主推SVM學(xué)習(xí)。
正是以Hinton為代表的一群人對深度學(xué)習(xí)的堅持,才一步步將邊緣課題變成人工智能核心技術(shù)?!笆昵斑M(jìn)入這個領(lǐng)域,中國學(xué)生都在學(xué)優(yōu)化理論,現(xiàn)在一窩蜂地學(xué)習(xí)深度學(xué)習(xí),很少有人在懷疑深度學(xué)習(xí)是不是最優(yōu)解,就像之前很少有人去思考優(yōu)化是不是最優(yōu)解?!贝魑臏Y說道。
人員成本居高不下
在余凱看來,中美之間的差距表現(xiàn)在兩方面,一方面是人才儲備的匱乏,很多高校在很長時間內(nèi)并沒有人工智能專業(yè),而在美國基本上大的院校都有人工智能教授。以美國卡梅隆大學(xué)為例,設(shè)有專門的機(jī)器人研究所,其中光教授就有100多位,縱向而言,中國布局的時間也比較晚。
早在2012年余凱回國在百度成立了人工智能團(tuán)隊,擔(dān)任百度人工智能研究院執(zhí)行院長,在他的記憶里,當(dāng)時在高校招人非常困難,很多是在招進(jìn)百度之后再自己培養(yǎng)。
其次從產(chǎn)業(yè)鏈而言,谷歌(微博)或者Facebook的人工智能團(tuán)隊不僅可以從斯坦福等院校招人,還可以從微軟、IBM、HP等大公司挖走人工智能領(lǐng)域的人才,“當(dāng)時別的企業(yè)還想著從百度挖人,無論從科研教育還是整個產(chǎn)業(yè)界,起步都是晚的,規(guī)模還是小的?!?/p>
至今余凱仍會頻繁去美國參加一些學(xué)術(shù)會議,讓自己保持更多的思考,“國外技術(shù)創(chuàng)業(yè)比較多,大家探討的是數(shù)學(xué)公式及算法,而在中國大部分在講趨勢、概念,如果PPT上放上公式就變得很無聊,心態(tài)比較浮躁?!?/p>
資本驅(qū)動之下,人工智能成為創(chuàng)業(yè)最火熱的領(lǐng)域,也在加速人才的流動。根據(jù)華創(chuàng)資本發(fā)布的《2016早期企業(yè)薪酬調(diào)研報告》來看,人工智能和大數(shù)據(jù)領(lǐng)域類的早期企業(yè)在過去一年的員工離職率高達(dá)44%,人員流動活躍。
“付不起工資、搶不到人”成為人工智能企業(yè)在人才招聘方面面臨的最大博弈?!叭瞬疟容^少,需要的公司又多,人工智能的人員成本因此居高不下?!贝魑臏Y表示,“我們想要尋找突破常規(guī)的人才,需要找到能夠?qū)?0分的東西做到60分甚至80分的人才,例如目前做深度學(xué)習(xí)的人有很多,但遷移學(xué)習(xí)的人才就非常少。”
“德才兼?zhèn)洹笔怯鄤P選人的標(biāo)準(zhǔn),所謂德即對人工智能本身的熱情,愿意為之做長期奮斗,而不是短期的?!按蟛糠秩耸窃谮s時髦,如果冰天雪地的時候心還是熱的,那才叫熱情”,才則是數(shù)學(xué)功底、統(tǒng)計功底、編程能力等等。
“優(yōu)秀的人才、優(yōu)質(zhì)的研究成果永遠(yuǎn)匱乏,好比人工智能領(lǐng)域論文從每年800篇漲到3000篇,但真正出色的論文在數(shù)量上基本不會有太大變化,許多人是在隨大流、挖坑灌水、解決細(xì)枝末節(jié)的問題,產(chǎn)生的真實價值并不大?!秉S暢補充道。
與O2O、電商等產(chǎn)業(yè)不同,人工智能的技術(shù)創(chuàng)新仍舊需要長期且基礎(chǔ)性的理論研究工作,如何從頂層設(shè)計出發(fā),加強(qiáng)人工智能基礎(chǔ)理論研究和核心技術(shù)突破,加強(qiáng)人工智能科研人才、技術(shù)人才的培養(yǎng)與引進(jìn),才是人工智能發(fā)展的持續(xù)動力。
人工智能挑戰(zhàn)
一派繁榮之下,正視人工智能的作用變得更為重要。“相較于告訴人們?nèi)斯ぶ悄苣茏鍪裁?,目前更重要的反倒是告訴人們,人工智能不能做什么。”余凱笑著說道。結(jié)合當(dāng)下的發(fā)展情況人工智能仍然面臨諸多挑戰(zhàn)。
首要挑戰(zhàn)就是數(shù)據(jù)不足的問題。眾所周知,人工智能建立在海量數(shù)據(jù)基礎(chǔ)之上,通過大數(shù)據(jù)訓(xùn)練,來優(yōu)化算法模型,以人臉識別技術(shù)為例,訓(xùn)練這一算法模型需要至少百萬級別的圖片數(shù)據(jù)。
目前人工智能主要是監(jiān)督式學(xué)習(xí),有監(jiān)督的訓(xùn)練就需要帶標(biāo)簽的數(shù)據(jù),因此數(shù)據(jù)的質(zhì)量和精準(zhǔn)度及輸出結(jié)果密切相關(guān)?!叭绾翁蕹龜?shù)據(jù)中的噪音、垃圾信息,獲取優(yōu)質(zhì)且?guī)в袠?biāo)簽的數(shù)據(jù)成為新挑戰(zhàn),也正是因為這個原因,半監(jiān)督式甚至無監(jiān)督式學(xué)習(xí)方法必然成為未來的研究熱點。”黃暢說道。
另一大挑戰(zhàn)在于深度學(xué)習(xí)的推廣和場景遷移能力不足,每個領(lǐng)域的數(shù)據(jù)都需要重新收集、標(biāo)準(zhǔn)和再訓(xùn)練,很難進(jìn)行跨領(lǐng)域推廣。這些挑戰(zhàn)也是人工智能工業(yè)界和學(xué)術(shù)界急需突破的問題?!霸谡衅傅倪^程中,學(xué)習(xí)深度學(xué)習(xí)的人很多,而懂得遷移學(xué)習(xí),具備思辨能力的人很少?!贝魑臏Y表示。反映到人才培養(yǎng)和教育而言,如何引導(dǎo)并鼓勵學(xué)生進(jìn)行跨領(lǐng)域、原創(chuàng)性的探索研究尤為重要。
例如今年AAAI最佳論文來自斯坦福大學(xué)計算機(jī)科學(xué)系的Russell Stewart、Stefano Drmon,他們所撰寫的論文《用物理和特定領(lǐng)域知識讓神經(jīng)網(wǎng)絡(luò)進(jìn)行不帶標(biāo)簽的監(jiān)督學(xué)習(xí)》,就是將物理知識與深度學(xué)習(xí)相結(jié)合,通過跨領(lǐng)域研究給AI帶來新的啟發(fā)。
繼續(xù)閱讀與本文標(biāo)簽相同的文章