外媒:百度玩不轉(zhuǎn)移動互聯(lián)網(wǎng),轉(zhuǎn)而全力押注人工智能
外媒:百度玩不轉(zhuǎn)移動互聯(lián)網(wǎng),轉(zhuǎn)而全力押注人工智能
【AI世代編者按】外媒近日刊文稱,移動互聯(lián)網(wǎng)時代鮮有建樹的百度已經(jīng)將目光投向了人工智能,甚至開始全力押注這項技術(shù),希望提前卡位新一輪科技趨勢。
以下為AI世代(微信號:tencentAI)編譯整理的原文內(nèi)容:
2016年12月6日,成千上萬名翻譯在中國各地的辦公樓里注視著用外語寫成的宣傳冊、信件和技術(shù)手冊,煞費苦心地將其翻譯成中文。這場馬拉松每天進(jìn)行15小時,總共持續(xù)一個月時間。
提供材料的客戶將以低價獲得專業(yè)級別的中文譯文。但作為這場大型翻譯活動的組織者,百度看重的卻是更有價值的東西:他們希望用數(shù)以百萬的英漢詞對來訓(xùn)練其在線翻譯引擎。
中國向來以“山寨大國”著稱,無論是名牌手包還是互聯(lián)網(wǎng)創(chuàng)業(yè)公司都概莫能外。但該國領(lǐng)導(dǎo)人似乎意識到,在人工智能領(lǐng)域,成本低廉的模仿策略已經(jīng)無法奏效——尤其是在面對Alphabet、Facebook、IBM和微軟這樣的競爭對手時。
今年2月,國家發(fā)改委指定百度領(lǐng)導(dǎo)成立一個新的人工智能實驗室,表明中國政府認(rèn)為該公司是這一領(lǐng)域的領(lǐng)頭羊。
百度聯(lián)合創(chuàng)始人兼CEO李彥宏在這個實驗室上月舉行的成立儀式上表示,百度過去兩年半的研發(fā)開支達(dá)到200億元人民幣(29億美元),多數(shù)都投向了人工智能領(lǐng)域。但他發(fā)展這項技術(shù)的主要動機(jī)并不是為了迎合政府:百度去年營收增速萎縮到6%左右,而之前3年平均每年都增長30%以上。
在截至12月31日的財年內(nèi),百度實現(xiàn)銷售額705億元人民幣,作為其中的重要來源,搜索廣告業(yè)務(wù)正在面臨本土競爭對手的圍攻。美國市場研究公司eMarketer今年9月發(fā)布報告稱,阿里巴巴集團(tuán)已經(jīng)超過百度,成為中國數(shù)字廣告市場的領(lǐng)導(dǎo)者。百度希望人工智能可以幫助其重新增加搜索份額,同時確保新業(yè)務(wù)取得成功。
由于這家成立至今17年的公司在實施多元化的過程中喜憂參半,所以此次嘗試顯得格外重要。中金分析師納塔利·吳(Natalie Wu)預(yù)計,在截至2017年2月的12個月內(nèi),百度旗下團(tuán)購網(wǎng)站糯米的日用戶訪問量下滑59%。百度外賣也僅位居行業(yè)第三。
該公司旗下的視頻網(wǎng)站愛奇藝雖然廣受歡迎,但華興資本分析師艾拉·季(Ella Ji)預(yù)計其今年的內(nèi)容費用高達(dá)120億元人民幣。
正是因為有過這些失敗的經(jīng)歷,因此百度進(jìn)軍人工智能領(lǐng)域被賦予更重要的意義?!耙苿踊ヂ?lián)網(wǎng)時代已經(jīng)結(jié)束?!崩顝┖暝?月10日接受采訪時說,“我們會大舉投資人工智能,我們認(rèn)為這會讓很多人獲益,還將改變很多行業(yè)?!?/p>
今年1月,該公司任命微軟高管陸奇為COO,負(fù)責(zé)圍繞深度學(xué)習(xí)、增強(qiáng)現(xiàn)實和圖像識別等技術(shù)重塑該公司。在此之前,該公司還挖來了斯坦福大學(xué)學(xué)者、Alphabet深度學(xué)習(xí)部門前負(fù)責(zé)人吳恩達(dá)擔(dān)任首席科學(xué)家。
在吳恩達(dá)的領(lǐng)導(dǎo)下,百度的人工智能團(tuán)隊已經(jīng)擴(kuò)大到1300人,分布在北京、深圳、上海和加州桑尼韋爾的多個實驗室。他們今年還有望再招聘幾百人?!坝泻芏嗳嗽谥袊惆l(fā)明,還有很多人在美國搞發(fā)明?!眳嵌鬟_(dá)說,“在兩個國家都有人,我們就能看清最新趨勢?!?/p>
吳恩達(dá)
2014年5月,就在桑尼韋爾研發(fā)中心開張的當(dāng)天,吳恩達(dá)和他的副手亞當(dāng)·考特斯(Adam Coates)坐在一塊白板前,確定他們的第一個項目。在規(guī)劃了一系列可能性(和挑戰(zhàn))之后,他們將語音識別確定為一大基礎(chǔ),認(rèn)為可以基于此開發(fā)一系列產(chǎn)品。
到2015年中,這個由50人組成的團(tuán)隊推出了一款名為Deep Speech的產(chǎn)品,可以分辨出許多英語語音。這款軟件并非挨個單詞進(jìn)行識別,而是通過理解大量的語言數(shù)據(jù)來推測某種形態(tài)——這一過程被稱作深度學(xué)習(xí)。
吳恩達(dá)表示,由于考慮了文字背景來判斷其含義,該系統(tǒng)的識別準(zhǔn)確率高于依靠詞匯表和語音詞典的傳統(tǒng)引擎。
但始終難以克服的是隨著時間推移從其他從語言引入英語的詞匯和姓名?!叭绻阏f‘Play music by Tchaikovsky’(放一首柴可夫斯基的音樂),軟件會理解成‘Play music and try cough ski’?!睆乃固垢4髮W(xué)跳槽來的考特斯說,“我們將此稱作‘柴可夫斯基問題’?!?/p>
百度的程序員沒有簡單地把“Tchaikovsky”加入系統(tǒng)的詞匯表,而是幫助Deep Speech通過自學(xué)來理解這個詞。這就需要通過更多數(shù)據(jù)幫助系統(tǒng)理解上下文。
百度自然語言處理部門副主任趙世奇回憶道,當(dāng)他在哈爾濱工業(yè)大學(xué)讀書時,計算機(jī)翻譯還只有200萬個英漢詞對,百度目前約有1億個。然而,根據(jù)2016年發(fā)表在《科學(xué)》雜志上的論文,這仍然遠(yuǎn)低于Alphabet的5億個。
為了縮小這一差距,百度采取了“人海戰(zhàn)術(shù)”的老辦法。該公司現(xiàn)在一年到頭都會為人工翻譯提供幫助,還會定期舉行去年12月那樣的馬拉動活動,并為客戶提供智能手機(jī)和凈水器等獎品。他們會借助這一過程中的數(shù)據(jù)來提升百度翻譯引擎的表現(xiàn),同時進(jìn)一步促進(jìn)Deep Speech的發(fā)展。
桑尼韋爾團(tuán)隊在2016年7月發(fā)布了自己的軟件TalkType,這是一款帶有語音輸入功能的鍵盤。這項技術(shù)此后又整合到其他功能中,包括一款類似于Siri的個人助手——度秘。通過在Deep Speech中整合機(jī)器學(xué)習(xí)技術(shù),便可為其他產(chǎn)品賦予智能,包括今年1月在拉斯維加斯國際消費電子展(CES)上展示的的小魚在家語音控制機(jī)器人。
借助多樣化的網(wǎng)絡(luò)業(yè)務(wù),百度掌握了中國規(guī)模最大、最詳細(xì)的消費者數(shù)據(jù)庫之一。這應(yīng)該為其開發(fā)人工智能產(chǎn)品和服務(wù)帶來優(yōu)勢——至少理論上如此。
通過糯米和百度外賣,該公司可以了解中國家庭的購買和就餐習(xí)慣,而攜程則可以幫助其了解消費者的休假目的地。每個月都有6.65億智能手機(jī)用戶訪問該公司的移動門戶和應(yīng)用,還有3.41億使用百度地圖搜索目的地。“把人工智能當(dāng)成一款產(chǎn)品是一種錯誤觀念——它是一種底層技術(shù),可以催生其他產(chǎn)品?!眳R豐銀行分析師Chi Tsang說,“可以設(shè)想各種用例?!?/p>
新的人工智能產(chǎn)品并沒有為百度的業(yè)績做出太大貢獻(xiàn)。但該公司在這一領(lǐng)域的技能卻可以幫助其主導(dǎo)已經(jīng)涉足的領(lǐng)域,并推動其進(jìn)軍云計算和無人駕駛汽車等新領(lǐng)域。
“未來3至5年,這些領(lǐng)域都有望成為另一個百度。”百度總裁張亞勤(微博)說,他指的是百度602億美元的市值?!艾F(xiàn)在該下注了?!保ň幾g/長歌)
繼續(xù)閱讀與本文標(biāo)簽相同的文章