身為全球最大社交網(wǎng)絡(luò),F(xiàn)acebook的人工智能究竟是什么水平?

來源:網(wǎng)絡(luò) 時間:2017-03-01 14:10:17

身為全球最大社交網(wǎng)絡(luò),F(xiàn)acebook的人工智能究竟是什么水平?

【AI世代編者按】美國科技新聞網(wǎng)站BackChannel近日刊文,介紹了Facebook內(nèi)部的人工智能團隊及其發(fā)展現(xiàn)狀。

以下為AI世代(微信:tencentAI)編譯整理的文章內(nèi)容:

在被任命為Facebook應(yīng)用機器學(xué)習(xí)事業(yè)部(以下簡稱“AML”)負責人,幫助這家全球最大社交網(wǎng)絡(luò)部署人工智能技術(shù)時,杰奎因·奎諾內(nèi)羅·坎德拉(Joaquin Quinonero Candela)有些遲疑。

杰奎因·坎德拉,F(xiàn)acebookAML事業(yè)部工程總監(jiān)

坎德拉是一位出生在西班牙的科學(xué)家,他總是自稱“機器學(xué)習(xí)人士”。之所以有所遲疑,并不是因為他沒有目睹人工智能給Facebook帶來了多大的幫助。自從2012年加盟這家社交網(wǎng)絡(luò)巨頭以來,他已經(jīng)見證了該公司廣告業(yè)務(wù)的轉(zhuǎn)變——他們利用機器學(xué)習(xí)技術(shù)提升了贊助內(nèi)容的相關(guān)性和營銷效果。

更重要的是,他通過一種獨特的方式用技術(shù)武裝自己部門的下屬——即便這些人并沒有接受過專業(yè)的人工智能技術(shù)培訓(xùn)。不僅如此,他還擴大了機器學(xué)習(xí)技術(shù)在整個廣告部門的普及程度。

但他并不確定同樣的“魔法”能在更大范圍內(nèi)展現(xiàn)出來,因為這個平臺上的數(shù)十億用戶之間的聯(lián)系取決于模糊的價值觀,而不是用來衡量廣告的硬性數(shù)據(jù)?!拔倚枰_定這么做的確有價值?!彼岬竭@次任命時如是說。

盡管有些懷疑,坎德拉還是接受了任命。而現(xiàn)在雖然距離那時僅僅過去兩年時間,但他當初的遲疑卻變得非常可笑。

究竟有多可笑?坎德拉上月在紐約的一次會議上對臺下的一眾工程師發(fā)表了演講?!拔乙l(fā)表一份重要聲明?!彼嬲f,“如果沒有人工智能,F(xiàn)acebook如今已經(jīng)無法存在下去。你或許并未意識到,但每當你使用Facebook或Instagram或Messenger時,你的使用體驗都有人工智能的一份功勞。”

去年11月,我來到Facebook位于門羅帕克的總部采訪坎德拉和他的團隊時,便得以目睹人工智能如何在突然之間成為Facebook的生存養(yǎng)料。目前為止,提到Facebook在這一領(lǐng)域的發(fā)展,很多目光都會集中于該公司組建的世界級Facebook人工智能研究事業(yè)部(以下簡稱“FAIR”),該部門的領(lǐng)導(dǎo)者是著名的神經(jīng)網(wǎng)絡(luò)專家嚴·勒坤(Yann LeCun)。

與谷歌(微博)微軟、百度、亞馬遜和蘋果(這家以保密著稱的公司如今也允許其科學(xué)家發(fā)布研究成果)等競爭對手一樣,F(xiàn)AIR也成為供不應(yīng)求的頂尖人工智能項目畢業(yè)生優(yōu)先選擇的公司。計算機在視覺、聽覺甚至對話能力上取得的進步都得益于這種類似于大腦的數(shù)字神經(jīng)網(wǎng)絡(luò),而FAIR則是這方面研究成果最為豐厚的機構(gòu)之一。

但坎德拉的AML事業(yè)部則負責將FAIR的研究成果與Facebook的實際產(chǎn)品融合到一起,更重要的是,他們還將幫助該公司的所有工程師,把機器學(xué)習(xí)技術(shù)融合到自己的工作中。

由于Facebook已經(jīng)離不開人工智能,所以所有工程師都必須使用這項技術(shù)。

把人工智能塞到每個人手中

就在我造訪Facebook前兩天,美國剛剛結(jié)束總統(tǒng)大選,而該公司CEO馬克·扎克伯格(Mark Zuckerberg)也剛剛在一天前回應(yīng)稱,那些宣稱Facebook傳播假新聞幫助唐納德·特朗普(Donald Trump)當選美國總統(tǒng)的想法“太瘋狂”。由于人們之前就對Facebook的假新聞泛濫狀況心懷不滿,所以扎克伯格的這番評論無異于火上澆油。

盡管很多爭議并不在坎德拉的職責范圍內(nèi),但他知道,F(xiàn)acebook需要借助機器學(xué)習(xí)技術(shù)來解決假新聞危機,而這恰恰是他團隊的職責之一。

但為了讓公司內(nèi)部的公關(guān)人員安心,坎德拉還向我展示其他一些東西,以此體現(xiàn)他的團隊正在從事的工作。令我意外的是,這其實是一套有點無聊的把戲:它可以將一張照片或一段視頻按照某位著名畫家的獨特風(fēng)格進行渲染。這很容易讓我們想起Snapchat上的各種噱頭——把照片轉(zhuǎn)化成畢加索風(fēng)格的畫作早已不是什么新鮮技術(shù)。

“這種技術(shù)名為神經(jīng)風(fēng)格轉(zhuǎn)移。”他解釋道,“就是一套大規(guī)模的神經(jīng)網(wǎng)絡(luò),它可以通過訓(xùn)練將一張照片重新繪制成特定風(fēng)格的畫作?!?他掏出自己的手機,拍了一張照片,然后在屏幕上操作了一番,照片很快就被渲染稱梵高名畫《星夜》(The Starry Night)的風(fēng)格。

更令人驚奇的是,他還能在視頻播放過程中將內(nèi)容渲染成類似的風(fēng)格。但他表示,真正重要的東西其實是在肉眼無法看到的:Facebook開發(fā)的神經(jīng)網(wǎng)絡(luò)已經(jīng)可以在手機上獨立運行。

這同樣不算新奇——蘋果之前也宣稱已經(jīng)可以在iPhone上完成一些神經(jīng)網(wǎng)絡(luò)計算。但由于Facebook并不控制硬件,所以他們面臨的難度要大得多。坎德拉表示,他的團隊之所以能完成這套“把戲”,是因為他們積累了大量經(jīng)驗——每個項目都可以降低其他項目的工作難度,每個項目也都可以讓未來的產(chǎn)品在接受更少培訓(xùn)的情況下,開發(fā)類似的產(chǎn)品——從而加快類似項目的開發(fā)速度。

“從啟動項目到公開測試,我只花了8個星期,這太瘋狂了?!彼f。

他表示,在這么短時間內(nèi)完成任務(wù)還有另外一個秘訣,那就是合作——這也恰恰是Facebook文化的基石。具體到這個項目,正是因為能夠輕易接觸到其他事業(yè)部的研究成果——尤其是熟悉iPhone硬件的移動部門——才使得他們能夠把原本需要借助數(shù)據(jù)中心才能完成的圖像渲染任務(wù),通過手機來獨立實現(xiàn)。

從左到右依次為AML事業(yè)部工程總監(jiān)杰奎因·坎德拉,應(yīng)用計算機視覺團隊負責人馬諾哈·帕魯麗,技術(shù)產(chǎn)品精力里塔·阿奎諾,工程經(jīng)理拉簡·蘇巴

這項技術(shù)不僅可以方便用戶為自己的親友拍攝《吶喊》風(fēng)格的短片,還能讓整個Facebook變得更加強大。從短期來看,這讓該公司得以更好地解讀語言、理解文本。從長期來看,他還能對你的所見、所言展開實時分析。

“我們以秒為單位,甚至比秒還短——必須實時完成?!彼f,“我們是社交網(wǎng)絡(luò),如果我要預(yù)測人們對某段內(nèi)容的反饋,我的系統(tǒng)就要立刻作出反應(yīng),對嗎?”

坦德勒又看了一眼他剛才拍的那張梵高風(fēng)格的自拍像,完全不屑于掩飾自豪之情。“能夠在手機上運行復(fù)雜的神經(jīng)網(wǎng)絡(luò),便能將人工智能放到所有人的手上?!彼f,“這并不是偶然發(fā)生的,這都得益于我們在公司內(nèi)部展示人工智能的方式?!?/p>

“這是一場漫長的旅程?!彼a充道。

微軟老兵大顯神威

坎德拉出生在西班牙,他3歲時隨家人搬到摩洛哥,在那里的法語學(xué)校就讀。盡管畢業(yè)時的文理學(xué)科都獲得高分,但他還是決定入讀馬德里的一所學(xué)校,學(xué)習(xí)一門在他看來最難的學(xué)科:通信工程。這門學(xué)科不僅需要掌握天線和放大器等物理知識,還要對數(shù)據(jù)有充分的理解,他認為這“很酷”。

坎德拉對開發(fā)自適應(yīng)系統(tǒng)的教授非常著迷。他自己開發(fā)了一套系統(tǒng),利用智能過濾器來改善手機漫游信號,他現(xiàn)在將其稱做“嬰兒階段的神經(jīng)網(wǎng)絡(luò)”。他對訓(xùn)練算法格外著迷,而不太喜歡大量編寫代碼。2000年在丹麥度過的一個學(xué)期進一步激發(fā)了他在這方面的興趣,他在那里見到了機器學(xué)習(xí)教授卡爾·拉斯穆森(Carl Rasmussen)。

拉斯姆森曾在多倫多師從傳奇人物、機器學(xué)習(xí)鼻祖吉奧夫·辛頓(Geoff Hinton)。畢業(yè)前夕的坎德拉原本要參加寶潔的領(lǐng)導(dǎo)力項目,但卻接到了拉斯姆森的博士項目邀請。于是,他選擇了機器學(xué)習(xí)。

2007年,他來到位于英國劍橋的微軟研究院工作。入職后不久,他獲悉微軟正在舉行一項面向所有員工的競賽:該公司即將推出必應(yīng)搜索,所以需要對關(guān)鍵字搜索廣告進行改進——精確預(yù)測用戶何時會點擊一則廣告。

優(yōu)勝團隊的方案將被投入實體測試,以便了解它是否有最終發(fā)布的價值。而優(yōu)勝團隊本身也將獲得免費的夏威夷旅行作為獎勵。共有19個團隊參與競賽,坎德拉的團隊與另外一個團隊并列第一。他獲得了免費旅行的機會,但由于微軟遲遲沒有推進更重要的獎勵,導(dǎo)致他感覺自己被欺騙了——微軟一直沒有對他的方案展開測試,以判斷這個方案能否最終作為產(chǎn)品推出。

接下來發(fā)生的事情展示出坎德拉的堅決態(tài)度。他展開了一場“瘋狂的運動”,說服微軟給他一次機會。他在微軟內(nèi)部展開了五十多次對話,還開發(fā)了一個模擬器來展示自己算法的優(yōu)越性。他甚至找到直接負責這項決策的副總裁:他在吃自助餐時主動坐到那位副總裁身邊,甚至?xí)プ「黄鹕蠋臋C會向其宣傳自己的方案。他還在沒有事先請示的情況下闖入這位高管的辦公室,聲稱說話必須算數(shù),他的算法的確更好。

最終,坎德拉的算法在2009年隨同必應(yīng)一起推出。

Facebook 20號樓內(nèi)景

2012年初的一個周五,坎德拉到Facebook門羅帕克園區(qū)拜訪了一個朋友。讓他震驚的是,他聽說該公司的員工不需要獲得上司批準,也可以測試自己的項目。他們就是這么做的。于是他星期一便去Facebook參加面試,周末就拿到了錄取通知。

加入Facebook廣告團隊后,坎德拉的工作是領(lǐng)導(dǎo)一個小組來展示相關(guān)性更強的廣告。當時的確使用了機器學(xué)習(xí)技術(shù),“但我們當時使用的模型不算先進,太過簡單”。坎德拉說。

還有一位與坎德拉同時加盟Facebook的工程師,他叫侯賽因·梅哈納(Hussein Mehanna),他對該公司在人工智能集成度方面的落后程度同樣感到驚訝?!耙酝馊说纳矸菘创麄兊漠a(chǎn)品質(zhì)量時,我以為一切都已成型,但顯然并非如此?!泵饭{說,“沒過幾個星期,我就告訴杰奎因,F(xiàn)acebook真正缺乏的是一個行之有效的世界級機器學(xué)習(xí)平臺。我們雖然擁有機器,但卻沒有合適的軟件幫助機器對數(shù)據(jù)展開盡可能深入的學(xué)習(xí)?!保壳皳蜦acebook核心機器學(xué)習(xí)負責人的梅哈納同樣是微軟老兵——接受本文采訪的其他幾名工程師也都有著相同的身份。這僅僅是巧合嗎?)

梅哈納所說的“機器學(xué)習(xí)平臺”指的是部署一套最先進的人工智能范式:憑借著基于人腦行為模式的幾種模型,這種范式把這項技術(shù)從上個世紀的“寒冬”(當時,早期的“思維機”想法已經(jīng)提不起人們的興趣)帶到了最近的繁榮時期。

具體到廣告業(yè)務(wù),F(xiàn)acebook需要讓它的系統(tǒng)完成一些人力無法企及的任務(wù):實時而精確地預(yù)測有多少人會點擊某一條廣告。坎德拉和他的團隊希望根據(jù)機器學(xué)習(xí)流程開發(fā)一套新系統(tǒng)。而由于該團隊希望以平臺的方式來打造這套系統(tǒng),讓該部門內(nèi)的所有工程師都可以使用,所以他們在開發(fā)過程中努力確保建模和訓(xùn)練都能廣泛推廣和復(fù)制。

構(gòu)建機器學(xué)習(xí)系統(tǒng)的重要因素之一便是獲得海量數(shù)據(jù)——數(shù)據(jù)越多,效果越好。幸運的是,這恰恰是Facebook最大的資產(chǎn)之一:如果每天都有十多億人與你的產(chǎn)品互動,你就可以收集大量培訓(xùn)資料,獲得數(shù)不清的用戶行為范例。

這也讓整個廣告團隊的開發(fā)速度從幾個星期推出一個新模型,變成了每個星期推出幾個新模型。而由于這將成為一個平臺,讓其他人也可以在內(nèi)部開發(fā)自己的產(chǎn)品,所以坎德拉必須在開發(fā)過程中讓多個團隊都參與其中。他們把整個過程精確地分成三個步驟:“先關(guān)注性能,再關(guān)注實用性,然后構(gòu)建一個社區(qū)?!彼f。

坎德拉的廣告團隊已經(jīng)證明機器學(xué)習(xí)給Facebook帶來的巨大轉(zhuǎn)變?!拔覀冊陬A(yù)測點擊、點贊、轉(zhuǎn)化等指標時實現(xiàn)了不可思議的成功?!彼f。接下來自然是將這種方法延伸到更多服務(wù)中。事實上,F(xiàn)AIR負責人勒坤一直主張設(shè)立一個與之配合的部門,負責將人工智能技術(shù)應(yīng)用到實際產(chǎn)品中。

“我非常希望成立這樣一個部門,因為你需要組織一群頂尖工程師,雖然他們不必直接關(guān)注產(chǎn)品,但卻需要關(guān)注基礎(chǔ)技術(shù),好讓很多產(chǎn)品部門都可以對其加以利用?!崩绽ふf。

2015年10月,坎德拉成為新成立的AML團隊負責人(但只擔任了一段時間,原因在于他很謹慎,而且同時保留了廣告部門的職位,需要同時身兼二職。)他與FAIR保持了密切關(guān)系,后者在紐約、巴黎、門羅帕克都設(shè)立了辦事處。事實上,無論FAIR的研究員與AML的工程師在哪里比鄰而坐,就相當于在那里設(shè)立了一個FAIR辦事處。

雙方的合作方式可以通過一款正在開發(fā)的產(chǎn)品全面體現(xiàn)出來:這款產(chǎn)品可以針對用戶發(fā)表在Facebook上的照片提供語音描述。過去幾年,訓(xùn)練一套系統(tǒng)識別某個場景中的物體,并得出一般性的結(jié)論,已經(jīng)成為標準的人工智能實踐模式。例如,可以通過這項技術(shù)判斷一張照片究竟是在室內(nèi)還是室外拍攝的。

但FAIR的科學(xué)家最近發(fā)現(xiàn)了一些方式來訓(xùn)練神經(jīng)網(wǎng)絡(luò),幾乎可以描述一張圖片中所有有趣的問題,并通過這些物體在圖片中的位置以及與其他物體的關(guān)系,判斷這張照片的主題——從而精確分析出某張照片的主題是人與人的擁抱,還是某人正在騎馬。

“我們把這項成果展示給AML的人?!崩绽ふf,“他們想了一會兒說,‘你知道,這在一種情況下非常有用。’” 他們之后便開發(fā)了一款原型功能,當盲人和視力受損的人將手指放在一張照片上時,便可用手機為其描繪照片上的內(nèi)容。

“我們一直在溝通。”坎德拉提到FAIR時說道,“整體目標是把基礎(chǔ)科學(xué)轉(zhuǎn)化成具體項目,這就需要一種粘合劑,對吧?我們就是粘合劑?!?/p>

把基礎(chǔ)研究用于實踐

坎德拉將人工智能應(yīng)用分為四大領(lǐng)域:視覺、語言、語音和拍攝效果。他表示,這四大領(lǐng)域都可以促成一套“內(nèi)容理解引擎”。Facebook希望了解如何才能真正理解某段內(nèi)容的含義,從而判斷評論背后的細微意圖;參透語言背后的精確含義;在飛速而過的視頻畫面中識別朋友的面部;解讀你的面部表情并將其復(fù)制到虛擬現(xiàn)實的化身上。

“我們希望實現(xiàn)人工智能技術(shù)的通用應(yīng)用?!笨驳吕f,“我們需要理解和分析的內(nèi)容呈現(xiàn)爆炸式增長,但我們添加標簽和區(qū)分事物的能力卻沒有同步提升?!?要解決這個問題,就要開發(fā)一套通用系統(tǒng),使得一個項目的成果可以進行累積,還能為其他從事相關(guān)項目的團隊提供幫助。

坎德拉說:“如果我能開發(fā)許多算法,把一項任務(wù)的知識轉(zhuǎn)移到另一項任務(wù),那豈不是很了不起?”

這種轉(zhuǎn)化可以對Facebook推出產(chǎn)品的速度產(chǎn)生重大影響。以Instagram為例。自從推出以來,這款圖片服務(wù)都以逆向時間順序展示用戶的照片。但在2016年初,該公司決定使用相關(guān)性算法展示圖片。

好消息是,由于AML已經(jīng)在News Feed等產(chǎn)品中應(yīng)用了這種算法,“不必從頭開始。”坎德拉說,“他們有一兩個精通機器學(xué)習(xí)的工程師與幾十個正在部署各種排名應(yīng)用的團隊展開聯(lián)系。之后便可復(fù)制這些模式,一旦有問題,還可以與這些模式的負責人溝通?!闭蛉绱耍琁nstagram才得以在短短幾個月內(nèi)完成如此重大的轉(zhuǎn)變。

AML團隊一直在探索各種用例,用自己的神經(jīng)網(wǎng)絡(luò)與不同團隊的成果進行結(jié)合,從而開發(fā)一項適用于“Facebook規(guī)?!钡莫毺毓δ??!拔覀冊谑褂脵C器學(xué)習(xí)技術(shù)構(gòu)建自己的核心能力,同時取悅我們的用戶?!盇ML感知團隊首席工程師唐默·萊萬德(Tommer Leyvand)說。(他同樣來自微軟。)

最近推出的一項名為“社交推薦”(Social Recommendations)的功能就是典型例子。大約一年前,一位AML工程師跟一位Facebook共享團隊產(chǎn)品經(jīng)理談到了人們在向好友征求當?shù)氐牟宛^和服務(wù)建議時展開的深度互動。

“問題在于如何向用戶展示相關(guān)信息。”AML自然語言團隊產(chǎn)品經(jīng)理里塔·阿奎諾(Rita Aquino)說。共享團隊曾經(jīng)嘗試對特定短語進行文字匹配。“當你每天接受10億個帖子時,這未必很精確,也未必可以大范圍應(yīng)用?!卑⒖Z說。

Facebook技術(shù)產(chǎn)品經(jīng)理里塔·阿奎諾

通過訓(xùn)練神經(jīng)網(wǎng)絡(luò),然后用實時行為來測試各種模型,該團隊便可察覺細微的語言差異,從而精確判斷用戶何時針對某一區(qū)域詢問就餐或購物建議。這便會觸發(fā)一條請求,顯示在相應(yīng)聯(lián)系人的News Feed信息流中。接下來,仍然由機器學(xué)習(xí)來判斷他人何時提供有用的建議,并將企業(yè)或餐廳的地點顯示在用戶News Feed信息流里的地圖上。

阿奎諾表示,她在Facebook任職的一年半期間,人工智能從產(chǎn)品中難得一見的元素,變成了從初始階段就融入其中的技術(shù)?!叭藗兿Mc之互動的產(chǎn)品更加智能?!彼f,“其他團隊看到社交推薦功能和我們的代碼后會問:‘你們我們?nèi)绾尾拍茏龅??’你不必非得是機器學(xué)習(xí)專家,也可以根據(jù)自己所在部門的經(jīng)驗進行嘗試?!?/p>

具體到自然語言處理領(lǐng)域,該團隊也開發(fā)了一套可以方便其他團隊使用的Deep Text系統(tǒng)。它對Facebook翻譯功能使用的機器學(xué)習(xí)技術(shù)起到了幫助,這項技術(shù)每天被應(yīng)用到40多億帖子中。

在圖片和視頻領(lǐng)域,AML團隊則開發(fā)了一套名為Lumos的機器學(xué)習(xí)視覺平臺。這個平臺最早源自馬諾哈·帕魯麗(Manohar Paluri),當時身為FAIR實習(xí)生的他負責開發(fā)一個宏偉的機器學(xué)習(xí)項目,他稱之為“Facebook的視覺皮質(zhì)”——其目的是處理和理解Facebook上發(fā)布的所有圖片和視頻內(nèi)容。

應(yīng)用計算機視覺團隊負責人馬諾哈·帕魯麗

在2014年的一場黑客松活動上,帕魯麗和同事尼基爾·喬里(Nikhil Johri)用一天半時間開發(fā)了一個原型產(chǎn)品,并將結(jié)果展示給滿懷熱情的扎克伯格和Facebook COO雪莉·桑德伯格(Sheryl Sandberg)。

當坎德拉組建AML事業(yè)部后,帕魯麗與他一同領(lǐng)導(dǎo)計算機視覺團隊,并開發(fā)了Lumos,幫助所有Facebook工程師(包括Instagram、Messenger、WhatsApp和Oculus)充分利用這個視覺皮質(zhì)。

有了Lumos,“公司里的任何人都可以使用這些多樣化的神經(jīng)網(wǎng)絡(luò)上的功能,然后針對他們特定的場景構(gòu)建各種模型,了解實際運行效果。”帕魯麗說,他同時任職于AML和FAIR兩個團隊,“最后可以讓一個人來給系統(tǒng)糾錯,對其重新訓(xùn)練,然后推動它進步,不需要AML團隊再介入其中?!?/p>

帕魯麗給我簡單地展示了效果。他在筆記本上啟動Lumos,然后運行了一個樣本任務(wù):提煉神經(jīng)網(wǎng)絡(luò)對直升機的識別能力。有一個頁面上包含很多圖片——如果我們不斷滾屏,大約會有5000張圖片——里面有很多直升機照片,還有一些類似直升機的東西。(一個是玩具直升機,還有一些則是像直升機一樣飄在空中的物體。)

在訓(xùn)練過程中,F(xiàn)acebook使用了公開發(fā)布的圖片(不包括僅限于好友或部分用戶查看的內(nèi)容)。即便我并不是工程師,對人工智能技術(shù)更談不上精通,但我卻可以輕而易舉地找到負面例子來訓(xùn)練系統(tǒng)構(gòu)建“直升機圖片分類器”。

最終,這個被稱作“監(jiān)督式學(xué)習(xí)”的歸類步驟可能更加自動化,因為該公司正在追求機器學(xué)習(xí)領(lǐng)域的圣杯——“非監(jiān)督式學(xué)習(xí)”——在這種模式下,神經(jīng)網(wǎng)絡(luò)可以自己判斷這些圖片中究竟是什么內(nèi)容。帕魯麗表示,該公司已經(jīng)取得了一些進展?!拔覀兊哪繕耸窃谖磥?年將人類的注釋減少100倍?!彼f。

從長遠來看,F(xiàn)acebook認為視覺皮質(zhì)將與自然語言平臺共同成為坎德拉所謂的通用內(nèi)容理解引擎?!拔覀冏罱K無疑會將它們?nèi)跒橐惑w。”帕魯麗說,“到那時,我們就會直接開發(fā)‘皮質(zhì)’。”

Facebook希望他們在技術(shù)進步中使用的核心原則可以通過發(fā)表論文等方式傳播到公司外部,利用這種民主化模式更加廣泛地傳播機器學(xué)習(xí)技術(shù)?!澳悴槐卦倩ㄙM漫長的時間開發(fā)智能應(yīng)用,速度可以大幅加快?!泵饭{說,“想象一下這項技術(shù)對制藥、安全和交通的影響。我認為,在這些領(lǐng)域開發(fā)應(yīng)用的速度可以加快好幾百個量級。”

面臨無解難題

盡管AML已經(jīng)深度融合到研發(fā)流程之中,為該公司的產(chǎn)品賦予了視覺、分析甚至語言能力,但該公司CEO扎克伯格還認為,在他努力利用Facebook為社會創(chuàng)造福利的過程中,這項技術(shù)將起到至關(guān)重要的作用。

在扎克伯格之前發(fā)表的5700字宣言中,這位CEO 7次提到了“人工智能”或“AI”,都是在描述如何利用機器學(xué)習(xí)和其他技術(shù)提升社會安全性和信息量的背景下提到的。

要實現(xiàn)這些目標并非易事,這與坎德拉最初對AML的職位猶豫不決時的原因相同。如果你試圖成為主要的信息來源,并為數(shù)十億用戶構(gòu)建個人關(guān)系,即使是機器學(xué)習(xí)也無法解決這一過程中面臨的所有人為問題。正因如此,F(xiàn)acebook才不斷修改News Feed算法——當你自己都無法真正確定時,又該如何通過訓(xùn)練讓系統(tǒng)給出最優(yōu)組合呢?

“我認為這個問題幾乎無解?!笨驳吕f,“如果隨機展示新聞,你會覺得浪費時間。如果只展示來自朋友的新聞,那就會贏家通吃。最終會不停地討論兩種極端情況之間的哪個狀態(tài)才是最好的。我們試圖展開一些探索?!?/p>

Facebook將繼續(xù)使用人工智能來解決這個問題,這已經(jīng)成為其在每個領(lǐng)域發(fā)展的基礎(chǔ)動力。“機器學(xué)習(xí)和人工智能領(lǐng)域有很多研究都希望能夠優(yōu)化合適的探索水平?!笨驳吕瓭M懷希望地說。

當Facebook被人當做假新聞的元兇時,他們自然會要求人工智能團隊盡快從該平臺上清洗所有的新聞毒瘤。這是一場罕見的全員行動,甚至連一向著眼長期前景的FAIR團隊也參與進來。勒坤表示,該團隊擔任顧問的角色。

結(jié)果,在FAIR的努力下,他們已經(jīng)開發(fā)出一款有助于解決該問題的工具:一個名為WorldVec(vec是“向量”的縮寫)的工具。WorldVec為神經(jīng)網(wǎng)絡(luò)增加了某種記憶能力,幫助Facebook給所有內(nèi)容都貼上信息標簽,例如它的來源,以及都有哪些人分享過這些內(nèi)容。

借助這些信息,F(xiàn)acebook便可了解假新聞的分享特征,并使用該公司的機器學(xué)習(xí)算法根除毒瘤?!敖Y(jié)果表明,尋找假新聞并不像判斷人們最喜歡哪些內(nèi)容那么困難?!崩绽ふf。

坎德拉的團隊之前開發(fā)的系統(tǒng)加快了Facebook推出這些審核產(chǎn)品的速度。這些產(chǎn)品的具體表現(xiàn)仍然有待觀察。坎德拉表示,現(xiàn)在就通過數(shù)據(jù)展示該公司利用算法減少了多少假新聞,還為時過早。

但無論這些新的措施是否奏效,這些困惑本身還是引發(fā)了一個問題:這種用算法解決問題的模式——在機器學(xué)習(xí)時代得以進一步加強——是否會不可避免地帶來有害的結(jié)果。很顯然,有人認為這已經(jīng)在2016年發(fā)生了。

坎德拉否認這種觀點。“我認為我們把世界變得更加美好?!笨驳吕€主動講了個故事。就在他接受采訪的那天,坎德拉給他在Facebook上的一個聯(lián)系人打了個電話——那人是他朋友的父親,他們之前只見過一面。

他看到那人發(fā)了許多支持特朗普的內(nèi)容,并對這些內(nèi)容感到困惑。隨后,坎德拉意識到,他的工作是根據(jù)數(shù)據(jù)制定決策,而他卻忽視了重要信息。所以,他給那人發(fā)了信息,希望跟他聊聊。那位聯(lián)系人同意了,于是,他撥通了電話。

“這并沒有改變我身處的現(xiàn)實,但卻讓我以截然不同的方式來看待事情?!笨驳吕f,“在沒有Facebook的世界里,我永遠不會有這樣的聯(lián)系人?!?/p>

換句話說,盡管人工智能成為Facebook的關(guān)鍵元素,甚至事關(guān)這個平臺的存亡,但它卻并非唯一答案?!艾F(xiàn)在的挑戰(zhàn)在于,人工智能仍處于初級階段?!笨驳吕f,“我們才剛剛起步?!保ň幾g/長歌)

繼續(xù)閱讀與本文標簽相同的文章

分享至:

你可能感興趣 換一換

分享到微信朋友圈 ×
打開微信,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。