4月29日,2016全球移動互聯(lián)網(wǎng)大會(GMIC)昨日在北京-國家會議中心開幕。微軟亞洲研究院常務(wù)副院長芮勇在接受騰訊科技的專訪中表示,AI技術(shù)一直在螺旋式前進(jìn),距離超越人類的大腦還有很遠(yuǎn)的距離,希望業(yè)界對這個技術(shù)的發(fā)展趨勢以平和的心態(tài)看待。
今年是“人工智能”這個詞被發(fā)明出來的第60年。過去60年里,人工智能經(jīng)歷過兩次春天和冬天。第一次春天源于AI概念的產(chǎn)生,彼時業(yè)內(nèi)人對很多技術(shù)懷有不切實際的期待,認(rèn)為包括自然語言處理這樣的問題在五到十年內(nèi)都可以解決;而第二次春天則發(fā)生在十幾年前,第五代個人計算機(jī)、專家系統(tǒng)等等概念的出現(xiàn),又讓人工智能火了一把。
“現(xiàn)在是第三個春天,其實人工智能一直在以螺旋的方式前進(jìn),希望大家對此有平和的心態(tài)”,芮勇說。
而對于AI與人類的碰撞,芮勇的觀點現(xiàn)在還無需到恐慌的時候,接下來是人類和機(jī)器共存的年代。AI在計算和記憶能力上已經(jīng)超過了人類,“但凡是有規(guī)則的事情,機(jī)器超過人類都是時間問題”,但人類的右腦——那些產(chǎn)生想象力和藝術(shù)創(chuàng)造的部分,是目前機(jī)器無法做到的部分。
“人對自己的理解還很膚淺。今天我們能夠上太空、下海洋,但是對人類自己大腦的理解是很皮毛。有一天對于自己的了解能夠再向前發(fā)展的話,可能這個瓶頸會稍微小一點,但是那一天真的還很遠(yuǎn)”,芮勇對騰訊科技說。
芮勇在今天的主題演講中也提出了“5個AI”的概念,除了人工智能之外,還包括聚合智能、自適應(yīng)智能、隱形智能和增強(qiáng)智能四個技術(shù)概念。而微軟最新的產(chǎn)品HoloLens,也在“隱于環(huán)境的智能”技術(shù)基礎(chǔ)上,提出了包括醫(yī)療、建筑和工業(yè)設(shè)計、城市規(guī)劃等等更多的應(yīng)用場景。
“我想我們今后談的話題是人類+機(jī)器,人類利用人工智能很強(qiáng)的東西,使得我們?nèi)祟愖兊酶鼜?qiáng)”,芮勇說,“這會是第五個AI。”
以下是專訪實錄:
騰訊科技:我們先從大家最感興趣的HoloLens方面開始聊,您剛才在會上介紹了很多HoloLens未來的應(yīng)用場景、工業(yè)設(shè)計、醫(yī)療等等。但是如果想要這些場景成為現(xiàn)實,我們現(xiàn)在的AI技術(shù)還需要發(fā)展到什么程度?我們現(xiàn)在大概做到了什么樣的程度?
芮勇:還是有很多技術(shù)要去進(jìn)一步開發(fā),比如說像三維視覺的重建,比如像物體的掃描等等,還有很多的技術(shù)。今天做到了什么程度呢?大家也知道微軟公司是在今年的上半年會出開發(fā)者工具包,我覺得等開發(fā)者工具包出來之后很多第三方的發(fā)燒友、開發(fā)者就可以在上面開發(fā)自己想要的一些應(yīng)用。
騰訊科技:這個工具包現(xiàn)在是還沒有推出來?
芮勇:應(yīng)該是今年的上半年。
騰訊科技:是基于HoloLens的工具包?
芮勇:是的。其實上我們的官網(wǎng)都可以看到,那里有準(zhǔn)確的信息。
騰訊科技:您今天也提到了今年是人工智能這個詞被創(chuàng)造出來的第六十年,這六十年當(dāng)中您覺得發(fā)生過哪些比較有標(biāo)志性的,或者可以稱之為節(jié)點的事件呢?
芮勇:非常非常多。首先人工智能有很多的分支,有計算機(jī)視覺、語音識別、機(jī)器學(xué)習(xí)等等各個方面。從大的趨勢上,其實有兩次起起伏伏,有春天,后來又冬天,又有春天和冬天,現(xiàn)在是第三次春天了。我很希望媒體界的朋友也幫助一下做科研和做產(chǎn)業(yè)界的朋友,現(xiàn)在不要把期望值設(shè)得太高,因為原來的兩次冬天的來臨就是因為兩次春天期待能到很高,但其實只能在這兒。我們要以平和的心態(tài)去面對人工智能各種技術(shù)的發(fā)展,有很多好的技術(shù)但是不要過于擴(kuò)大。在這個過程當(dāng)中有很多劃時代的一些故事和一些算法,簡單提一提微軟自己做的一些,很有意思的事情。
我剛才在演講里面也略提了一下,一個是計算機(jī)視覺。計算機(jī)視覺是你拿一張圖片給計算機(jī)看,計算機(jī)可以識別出這個圖片里面包含什么物體,這個物體在什么地方,以及精確到像素屬于什么物體,這還是做得非常了不起的,幾乎可以跟人的水平一樣了。
第二個是Skype Translator實時語音翻譯技術(shù)。比如說你只會說法語,我只會說中文,咱們倆怎么交流呢?必須要有一個大的技術(shù)做得非常好,語音的識別、文本校正,實時的機(jī)器翻譯,以及TTS語音合成。這些串聯(lián)在一起才能成為可以用的系統(tǒng)。因為我也有參加過其中的一些工作,我覺得這還是非常值得驕傲和激動的一件事情。
騰訊科技:您剛才提到了兩次春天,這兩次春天大概是發(fā)生在什么時候,契機(jī)是什么呢?
芮勇:第一次春天是因為這個詞造出來不久,人們覺得人工智能太厲害了,有人預(yù)言五到十年后很多事情就可以解決了。春天的意思是政府、企業(yè)也好都投入了很多錢,但是后來發(fā)現(xiàn)這個問題遠(yuǎn)比我們想象得復(fù)雜得多。舉個例子,大家覺得語音識別是五到十年就可以做成了,但是五到十年后發(fā)現(xiàn)還需要五到十年,直到2009年、2010年前后深度學(xué)習(xí)出現(xiàn)之后,才把原來很難降下去的錯誤率一下降下去了30%,因為新的算法出來了。第一次冬天是你說能做好,結(jié)果沒有做好,所有的政府把所有的資助都停了。
第二次春天也是十好幾年以前的事情了,那時候有一些像專家系統(tǒng)、國外的第五代個人計算機(jī)等等,又是有一套東西起來。但是后來泡吹得有點大,所以又有了冬天。
所以在第三次春天來的時候,希望借助媒體的力量呼吁大家有平和的心態(tài)。其實過去的六十年人工智能一直是在前進(jìn)的,只不過外界對它的印象是在春天和冬天,其實一直過的是秋天而已。
騰訊科技:這60年人工智能是這樣穩(wěn)步上升的曲線嗎?
芮勇:也不是穩(wěn)步上升的,是螺旋式上升,因為還是有幾個臺階的。中間有神經(jīng)元網(wǎng)絡(luò)的出現(xiàn),有符號推理的出現(xiàn),有動態(tài)貝葉斯網(wǎng)絡(luò)的出現(xiàn),有專家系統(tǒng)的出現(xiàn),最近最熱的是深度學(xué)習(xí)的出現(xiàn),還是有幾個臺階的,不是很平滑的?;旧鲜锹菪缴仙?,不是說一個谷一個峰。
騰訊科技:大家最近很關(guān)心圍棋,可能也是春天的契機(jī)。從您專業(yè)角度看,機(jī)器戰(zhàn)勝人類的事情是里程碑嗎?還是比較自然的事情?
芮勇:從兩個方面來講,第一是有強(qiáng)人工智能和弱人工智能之分,弱人工智能是把某一件事情,尤其是一些有規(guī)律、有規(guī)則的事情給實現(xiàn),讓計算機(jī)進(jìn)行實現(xiàn),這就是弱人工智能。不管是下圍棋、跳棋、國際象棋等等基本上是屬于這一類的范疇。這一類的范疇,慢慢的人工智能都會超過人類,其實不超過人類才是很奇怪的事情。
另外一類是強(qiáng)人工智能,強(qiáng)人工智能是全面的把所有事情都做好,而不是只會下棋、倒一杯咖啡,是要全面超過人類,這個還要有很遠(yuǎn)的路要走。我們可能要區(qū)分一下弱人工智能和強(qiáng)人工智能,弱人工智能方面會有很大的發(fā)展,強(qiáng)人工智能還有很遠(yuǎn)的路要走。我有點擔(dān)心,大眾有時候會把強(qiáng)人工智能和弱人工智能混淆在一起,這是第一點。
第二點,每個公司有每個公司發(fā)展人工智能的不同角度和看法,有的公司是去做一個象棋,有的公司說做一個圍棋或跳棋。微軟公司對棋類不感興趣,我們想把過去二三十年在人領(lǐng)域各個方面的研究成果,比如說讓機(jī)器像人一樣可以看到外面的世界、聽到外面的聲音,以及像人一樣去思考和推理,把二三十的研究成果做在智能云的服務(wù)上面,使得第三方開發(fā)者不用花二三十年去做這樣的事情,而直接調(diào)用一個API就把這個事情做了,所以各個公司對人工智能的看法不一樣。
騰訊科技:但凡是有規(guī)則的事情機(jī)器都會超過人類。
芮勇:就是時間的問題,不超過人類是很奇怪的事情。
騰訊科技:人工智能有很多分支,微軟選擇這些分支來做的理由是什么?
芮勇:2016年是人工智能這個詞被造出來的第60年,也是微軟研究院成立的25周年。25年前微軟是很小的公司,1991年的時候微軟并不大。當(dāng)時比爾蓋茨先生是很有遠(yuǎn)見的,希望今后的所有計算機(jī)能像人類一樣去看到、聽到、說話以及思考。在我們1991年的時候就決定成立研究院做基礎(chǔ)科研,最早的幾個方向剛好是人工智能幾個大的分支,包括計算機(jī)視覺、語音識別、機(jī)器學(xué)習(xí)、自然語言處理,當(dāng)時就有這樣的愿景希望計算機(jī)像人類一樣。
騰訊科技:在中國或亞洲有什么側(cè)重點嗎?
芮勇:我們有幾個側(cè)重點,微軟亞洲研究院至少有四個大的側(cè)重點,第一個是在人機(jī)交互方面。為什么我們一定要用鍵盤、鼠標(biāo),人和人交流的時候是用語言和手勢,更好的交流方式在哪里是一個方向。
第二是跟多媒體的分析和理解是有關(guān)系的,比如說音頻、視頻的壓縮、傳輸、理解、搜索、分享,我覺得這也是非常重要的一個方面。
第三是對大數(shù)據(jù)的挖掘,對一些大數(shù)據(jù)的分析,對一些人工智能本身算法進(jìn)一步提升成新的算法。比如說有沒有辦法做成152層這么深,不是什么人都可以做這么深的,怎么去做,初始化條件在哪里,中間的結(jié)構(gòu)跟原來是不是有不一樣,這是一塊。
第四是我們還做一些跟整個計算機(jī)領(lǐng)域最基礎(chǔ)的科研有關(guān)系的東西,比如像操作系統(tǒng)、分布式計算等等,我覺得這是微軟亞洲研究院比較專注的四個大的研究方向。
騰訊科技:您剛才提到AI在計算能力上已經(jīng)很強(qiáng)了,但是有可能發(fā)展出來創(chuàng)造力和想象力嗎?就是發(fā)展出創(chuàng)造力或想象力的瓶頸在哪里?
芮勇:我個人覺得發(fā)展出像人類一樣的創(chuàng)造力和想象力,我覺得可能還很遠(yuǎn)、很遠(yuǎn)。就以下棋來舉例,下棋其實不是人工智能打敗了一個人,而是一批很聰明的人加上了一個很強(qiáng)大的計算機(jī)打敗了另外一個人,因為那個程序是我們?nèi)藢懙?。如果有一個計算機(jī)程序?qū)懗鰜砹硗庖粋€計算機(jī)程序打敗了人類,我覺得這是創(chuàng)造力?;蛘甙延嬎銠C(jī)放在一棵蘋果樹底下,一個蘋果砸在計算機(jī)上它想到了這是萬有引力,這個叫創(chuàng)造力,但在這個之前我們說的還都是弱人工智能。
騰訊科技:所以瓶頸在哪里?
芮勇:因為我們完全不知道人類的意識或創(chuàng)造力,人對自己的理解還很膚淺。今天我們能夠上太空、下海洋,但是對人類自己大腦的理解是很皮毛。有一天對于自己的了解能夠再向前發(fā)展的話,可能這個瓶頸會稍微小一點,但是那一天真的還很遠(yuǎn)。
騰訊科技:瓶頸其實在人類對于自身的了解。
芮勇:對,在對自身的了解。
請輸入驗證碼