中國人工智能崛起直追美國 但在這些方面還有差距

來源:網(wǎng)絡 時間:2017-04-13 15:38:08

中國人工智能崛起直追美國 但在這些方面還有差距

作為人工智能國際頂級會議,由美國人工智能協(xié)會(American Association for Artificial Intelligence)組織的AAAI大會在美國舊金山召開,在今年的大會上中國面孔成為不可忽視的力量。在2571篇投稿論文中,中國和美國的投稿數(shù)量分別占到31%和30%,雖然在被接收論文數(shù)量上,中國還是低于美國,但數(shù)量已經(jīng)大幅提升。

一個小插曲則是,今年的AAAI大會原計劃在新奧爾良召開,由于和中國春節(jié)沖突,AAAI Fellow、AAAI現(xiàn)任執(zhí)委楊強教授和幾位教授緊急向組委會發(fā)送郵件,使得最終破格更改了時間和地點。

可見,中國在AI領(lǐng)域正在蓄勢,逐步成長為中堅力量。據(jù)《烏鎮(zhèn)指數(shù):全球人工智能發(fā)展報告》,在全球人工智能專利數(shù)量方面,中國以15745個緊跟在美國26891個之后位列第二,日本以14604個排名第三。值得一提的是,三國占總體專利的73.85%。

華人勢力

“不僅僅是學者,來參會的中國公司也變多了?!睏顝姳硎?。從今年的活動贊助商而言,百度、騰訊和亞馬遜、IBM一并成為金牌贊助商,小i機器人、今日頭條也躋身銀牌贊助商之列。在今年收錄的論文中,百度、騰訊、華為、360、今日頭條、攜程等中國公司的人工智能團隊也有出現(xiàn)。

百度研究院院長林元慶對第一財經(jīng)記者說,過去幾年里,她在參加國際上人工智能領(lǐng)域的頂級會議中,確實可以看到參加會議的華人非常多,而且在過去幾年里增長很快。他認為這同時也和國內(nèi)幾家公司在人工智能領(lǐng)域的投入有關(guān)系。

“中國人適合做人工智能,世界上43%的人工智能論文都是中國人寫的?!眲?chuàng)新工場創(chuàng)始人李開復(微博)曾向第一財經(jīng)表示。根據(jù)美國白宮此前發(fā)布的《國家人工智能研究與發(fā)展策略規(guī)劃》來看,從2013年到2015年,SCI收錄的論文中,“深度學習”或“深度神經(jīng)網(wǎng)絡”的文章增長了約6倍,按照文章數(shù)量計算,美國已經(jīng)不再是世界第一。在增加“文章必須至少被引用過一次”附加條件后,中國在2014年和2015年都超過美國,位居前列。

“這一輪人工智能并不是一個新的革命,而是18世紀工業(yè)革命自動化的一個延續(xù),技術(shù)一旦掌握到手里,可以迅速擴展到做全世界的生意,所以這對于中國起到了一個彎道超車的作用?!睏顝姳硎尽?/p>

中國人數(shù)學好、刻苦努力無疑為中國發(fā)展人工智能提供了良好的基礎,但更大的驅(qū)動力在于產(chǎn)業(yè)需求。一方面對于傳統(tǒng)企業(yè)而言,需要新技術(shù)來推動產(chǎn)業(yè)變革,“中國的經(jīng)濟結(jié)構(gòu)還有很多不合理、低效率的地方,通過人工智能浪潮,就形成了一種新的競爭?!睏顝姀娬{(diào)。

對于互聯(lián)網(wǎng)巨頭或新興獨角獸公司而言,同樣需要借助人工智能技術(shù),激發(fā)已經(jīng)存儲的海量數(shù)據(jù),提升服務精準度,創(chuàng)造潛在盈利機會,“互聯(lián)網(wǎng)大市場孕育的應用到C輪需要人工智能。”李開復表示。例如今日頭條在借助人工智能技術(shù),將新聞內(nèi)容和視頻進行重新排序,實現(xiàn)資訊分發(fā)的千人千面,美圖也利用人像數(shù)據(jù)庫,對數(shù)據(jù)進行標記、結(jié)構(gòu)化,優(yōu)化圖像算法。

“全世界只有中美兩國有如此大量的數(shù)據(jù)、大規(guī)模的計算和應用場景,在應用層面中美基本處于同一起跑線。”地平線機器人技術(shù)創(chuàng)始人兼首席執(zhí)行官余凱向第一財經(jīng)表示。余凱曾擔任百度研究院副院長、深度學習實驗室(IDL)主任,帶領(lǐng)的團隊將深度學習技術(shù)成功應用于廣告、搜索、圖像、語音等方面,在此之前他也曾在美國NEC研究院、西門子數(shù)據(jù)研究部、微軟亞洲研究院工作。

在余凱看來,中國有世界上最大的互聯(lián)網(wǎng)公司,且擁有搜索、社交、電商、互聯(lián)網(wǎng)金融等很好的應用場景,“大規(guī)模的計算平臺都需要大規(guī)模的應用場景,在小實驗室是做不了的,年輕人在這樣的工作環(huán)境中會得到持續(xù)的鍛煉,包括工程實驗能力、對算法的理解等?!?/p>

“最大的優(yōu)勢是人多,這種優(yōu)勢體現(xiàn)在三個層面,人多意味著市場大,有更強的驅(qū)動力去把這件事情做好。其次針對社會服務層面,需要很多數(shù)據(jù)。第三,人才基數(shù)比較大,冒出頂尖人才相對多一些?!钡谒姆妒絼?chuàng)始人、首席執(zhí)行官戴文淵告訴記者,“從數(shù)據(jù)量、投入的人力財力來看,中美之間沒有多少差距,且中國更有優(yōu)勢?!?/p>

中美差異

但將論文數(shù)量視為中國人工智能發(fā)展水平有失公允,雖然在靠近商業(yè)價值應用層面中美并駕齊驅(qū),但在基礎性、原創(chuàng)性研究、創(chuàng)新土壤、人才儲備層面,中國相較美國還存在不小的差距。

“國內(nèi)更多是技術(shù)的落地、產(chǎn)業(yè)化和應用,國外仍然有很多人在公司和研究院做前沿研究,包括尋求方法論上的突破,我們擅長把事情做得更細致,相對而言突破性和奠基性的工作還不夠多。”地平線機器人技術(shù)聯(lián)合創(chuàng)始人、算法副總裁黃暢告訴第一財經(jīng)。

黃暢畢業(yè)于清華大學計算機科學與技術(shù)系,曾在美國南加州大學和NEC美國研究院擔任研究員,2012年加入百度美國研發(fā)中心,2013年和余凱參與組建百度深度學習研究院,任高級科學家、主任研發(fā)架構(gòu)師。在黃暢看來,做研究無外乎尋找新的問題和研究新的方法,而在這兩方面國內(nèi)和國外相比還存在不小的差距。

楊強認為,深度學習是不斷發(fā)展的,研究領(lǐng)域的領(lǐng)導者應該是開拓新的領(lǐng)域,而不是在原有的基礎上深挖?!鞍岩粋€10層的深度模型拓展到100層甚至1000層,我覺得這個確實是一個進步,中國人目前是這個層次,但這些在我看來并不是一個原創(chuàng)?!睏顝娕e例說道。

“現(xiàn)在很多高校是看教授和學生的論文達標情況,頂級會議論文的發(fā)表對學生申請院校、教授評級、申請科研經(jīng)費等都有幫助,真正做出突破性理論研究,不迎合考核體系的非常少?!贝魑臏Y直言。在他看來,雖然有相當數(shù)量的人參與到人工智能研究,但優(yōu)秀的研究成果并不與參與人數(shù)的激增成正比。

余凱認為,有一些中國學生很擅長“刷分”、“刷榜”?!皠e人做到99.5%,我做了99.7%,并不一定有實質(zhì)性突破,世界也沒有因為這個刷分而變得不一樣。原創(chuàng)性的創(chuàng)新需要不一樣的思考,現(xiàn)在講深度學習比較多,所有的人都進行深度學習,而不是思考What is wrong ?How to be different?”余凱強調(diào)。

在人工智能領(lǐng)域浸染十年有余的戴文淵也有同樣的感受,“很多人用力的方向有問題,準確率達到99.1%、99.15%或者99.2%,其實沒有什么差別,并不應該把精力用在這些地方,而應該關(guān)注不到60分的領(lǐng)域,去把它做及格。”

回歸至深度學習的歷史發(fā)展脈絡來看,正是一個邊緣化課題走向主流技術(shù)的路徑。早在上世紀80年代初期,深度學習學派的開山人物Hinton一直堅持神經(jīng)網(wǎng)絡的探索,但受限于當時的電腦速度、數(shù)據(jù)量等問題,深度學習理論是一項邊緣化的研究,當時AI的主流研究方向與之截然相反,推崇小樣本學習,主推SVM學習。

正是以Hinton為代表的一群人對深度學習的堅持,才一步步將邊緣課題變成人工智能核心技術(shù)?!笆昵斑M入這個領(lǐng)域,中國學生都在學優(yōu)化理論,現(xiàn)在一窩蜂地學習深度學習,很少有人在懷疑深度學習是不是最優(yōu)解,就像之前很少有人去思考優(yōu)化是不是最優(yōu)解。”戴文淵說道。

人員成本居高不下

在余凱看來,中美之間的差距表現(xiàn)在兩方面,一方面是人才儲備的匱乏,很多高校在很長時間內(nèi)并沒有人工智能專業(yè),而在美國基本上大的院校都有人工智能教授。以美國卡梅隆大學為例,設有專門的機器人研究所,其中光教授就有100多位,縱向而言,中國布局的時間也比較晚。

早在2012年余凱回國在百度成立了人工智能團隊,擔任百度人工智能研究院執(zhí)行院長,在他的記憶里,當時在高校招人非常困難,很多是在招進百度之后再自己培養(yǎng)。

其次從產(chǎn)業(yè)鏈而言,谷歌(微博)或者Facebook的人工智能團隊不僅可以從斯坦福等院校招人,還可以從微軟、IBM、HP等大公司挖走人工智能領(lǐng)域的人才,“當時別的企業(yè)還想著從百度挖人,無論從科研教育還是整個產(chǎn)業(yè)界,起步都是晚的,規(guī)模還是小的。”

至今余凱仍會頻繁去美國參加一些學術(shù)會議,讓自己保持更多的思考,“國外技術(shù)創(chuàng)業(yè)比較多,大家探討的是數(shù)學公式及算法,而在中國大部分在講趨勢、概念,如果PPT上放上公式就變得很無聊,心態(tài)比較浮躁。”

資本驅(qū)動之下,人工智能成為創(chuàng)業(yè)最火熱的領(lǐng)域,也在加速人才的流動。根據(jù)華創(chuàng)資本發(fā)布的《2016早期企業(yè)薪酬調(diào)研報告》來看,人工智能和大數(shù)據(jù)領(lǐng)域類的早期企業(yè)在過去一年的員工離職率高達44%,人員流動活躍。

“付不起工資、搶不到人”成為人工智能企業(yè)在人才招聘方面面臨的最大博弈?!叭瞬疟容^少,需要的公司又多,人工智能的人員成本因此居高不下。”戴文淵表示,“我們想要尋找突破常規(guī)的人才,需要找到能夠?qū)?0分的東西做到60分甚至80分的人才,例如目前做深度學習的人有很多,但遷移學習的人才就非常少?!?/p>

“德才兼?zhèn)洹笔怯鄤P選人的標準,所謂德即對人工智能本身的熱情,愿意為之做長期奮斗,而不是短期的?!按蟛糠秩耸窃谮s時髦,如果冰天雪地的時候心還是熱的,那才叫熱情”,才則是數(shù)學功底、統(tǒng)計功底、編程能力等等。

“優(yōu)秀的人才、優(yōu)質(zhì)的研究成果永遠匱乏,好比人工智能領(lǐng)域論文從每年800篇漲到3000篇,但真正出色的論文在數(shù)量上基本不會有太大變化,許多人是在隨大流、挖坑灌水、解決細枝末節(jié)的問題,產(chǎn)生的真實價值并不大。”黃暢補充道。

與O2O、電商等產(chǎn)業(yè)不同,人工智能的技術(shù)創(chuàng)新仍舊需要長期且基礎性的理論研究工作,如何從頂層設計出發(fā),加強人工智能基礎理論研究和核心技術(shù)突破,加強人工智能科研人才、技術(shù)人才的培養(yǎng)與引進,才是人工智能發(fā)展的持續(xù)動力。

人工智能挑戰(zhàn)

一派繁榮之下,正視人工智能的作用變得更為重要?!跋噍^于告訴人們?nèi)斯ぶ悄苣茏鍪裁?,目前更重要的反倒是告訴人們,人工智能不能做什么?!庇鄤P笑著說道。結(jié)合當下的發(fā)展情況人工智能仍然面臨諸多挑戰(zhàn)。

首要挑戰(zhàn)就是數(shù)據(jù)不足的問題。眾所周知,人工智能建立在海量數(shù)據(jù)基礎之上,通過大數(shù)據(jù)訓練,來優(yōu)化算法模型,以人臉識別技術(shù)為例,訓練這一算法模型需要至少百萬級別的圖片數(shù)據(jù)。

目前人工智能主要是監(jiān)督式學習,有監(jiān)督的訓練就需要帶標簽的數(shù)據(jù),因此數(shù)據(jù)的質(zhì)量和精準度及輸出結(jié)果密切相關(guān)?!叭绾翁蕹龜?shù)據(jù)中的噪音、垃圾信息,獲取優(yōu)質(zhì)且?guī)в袠撕灥臄?shù)據(jù)成為新挑戰(zhàn),也正是因為這個原因,半監(jiān)督式甚至無監(jiān)督式學習方法必然成為未來的研究熱點?!秉S暢說道。

另一大挑戰(zhàn)在于深度學習的推廣和場景遷移能力不足,每個領(lǐng)域的數(shù)據(jù)都需要重新收集、標準和再訓練,很難進行跨領(lǐng)域推廣。這些挑戰(zhàn)也是人工智能工業(yè)界和學術(shù)界急需突破的問題?!霸谡衅傅倪^程中,學習深度學習的人很多,而懂得遷移學習,具備思辨能力的人很少?!贝魑臏Y表示。反映到人才培養(yǎng)和教育而言,如何引導并鼓勵學生進行跨領(lǐng)域、原創(chuàng)性的探索研究尤為重要。

例如今年AAAI最佳論文來自斯坦福大學計算機科學系的Russell Stewart、Stefano Drmon,他們所撰寫的論文《用物理和特定領(lǐng)域知識讓神經(jīng)網(wǎng)絡進行不帶標簽的監(jiān)督學習》,就是將物理知識與深度學習相結(jié)合,通過跨領(lǐng)域研究給AI帶來新的啟發(fā)。

繼續(xù)閱讀與本文標簽相同的文章

分享至:

你可能感興趣 換一換

分享到微信朋友圈 ×
打開微信,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。