——習(xí)近平總書(shū)記在致中國(guó)科學(xué)院建院70周年賀信中作出的“兩加快一努力”重要指示要求
——中國(guó)科學(xué)院辦院方針
語(yǔ)音播報(bào)
自從1956年美國(guó)達(dá)特茅斯會(huì)議提出概念以來(lái),人工智能(Artificial Intelligence)已經(jīng)從科學(xué)家的假設(shè)變得觸手可及,siri語(yǔ)音助手、叮咚智能音箱、賢二機(jī)器僧等人工智能產(chǎn)品讓普通人感受到人工智能帶來(lái)的智慧便利,也創(chuàng)造了更多的創(chuàng)業(yè)創(chuàng)新機(jī)會(huì)。
根據(jù)新智元近日發(fā)布的《中國(guó)人工智能產(chǎn)業(yè)發(fā)展報(bào)告》(以下簡(jiǎn)稱《報(bào)告》)的統(tǒng)計(jì),中國(guó)人工智能領(lǐng)域的創(chuàng)業(yè)公司約有200~250家,大部分創(chuàng)建于2010年后,絕大多數(shù)融資仍處于天使輪或者A輪,語(yǔ)音和視覺(jué)依然是人工智能創(chuàng)業(yè)公司的兩大方向,深度學(xué)習(xí)、機(jī)器學(xué)習(xí)都占據(jù)了絕對(duì)重要的地位,其次是計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理和語(yǔ)音識(shí)別。
在這些創(chuàng)業(yè)方向上,現(xiàn)在的人工智能已經(jīng)發(fā)展到了什么程度?人工智能領(lǐng)域的創(chuàng)新創(chuàng)業(yè)機(jī)會(huì)和難點(diǎn)在哪里?圍繞這些問(wèn)題,近日,中國(guó)青年報(bào)·中青在線記者專訪了科大訊飛輪值總裁、訊飛研究院院長(zhǎng)胡郁。
作為企業(yè)家,胡郁在1999年參與創(chuàng)立了科大訊飛,負(fù)責(zé)科大訊飛公司的智能語(yǔ)音及語(yǔ)言核心技術(shù)的研究工作,總體牽頭科大訊飛的人工智能前瞻項(xiàng)目——訊飛超腦計(jì)劃;作為科學(xué)家,胡郁擔(dān)任設(shè)在中國(guó)科技大學(xué)的語(yǔ)音及語(yǔ)言信息處理國(guó)家工程實(shí)驗(yàn)室執(zhí)行主任,憑借在語(yǔ)音合成與識(shí)別、自然語(yǔ)言理解等領(lǐng)域的研究成果,他曾獲得國(guó)家信息產(chǎn)業(yè)重大技術(shù)發(fā)明獎(jiǎng)、國(guó)家科學(xué)技術(shù)進(jìn)步二等獎(jiǎng)各兩次。
現(xiàn)在還是“弱智能”,期待“漣漪效應(yīng)”
上述新智元發(fā)布的《報(bào)告》稱,人工智能在60年的發(fā)展中經(jīng)過(guò)了“三起三落”:20世紀(jì)50年代到80年代初仍處于誕生和基礎(chǔ)階段,神經(jīng)元模型得以提出,感知器得以發(fā)明;從20世紀(jì)80年代到21世紀(jì)初,人工智能成功商用但跨越式發(fā)展失??;當(dāng)今,隨著摩爾定律和云計(jì)算帶來(lái)計(jì)算能力的提升,以及互聯(lián)網(wǎng)和大數(shù)據(jù)廣泛應(yīng)用帶來(lái)海量數(shù)據(jù)的積累,人工智能有望實(shí)現(xiàn)規(guī)?;瘧?yīng)用,并將深入到金融、交通、醫(yī)療、工業(yè)等各個(gè)領(lǐng)域。
《報(bào)告》的觀點(diǎn)跟胡郁的判斷不謀而合。在他看來(lái),如果將來(lái)的人工智能可以發(fā)展到一定程度,就會(huì)像現(xiàn)在日常生活所用的水、電、煤氣、互聯(lián)網(wǎng)一樣成為日常生活中的必需品。
事實(shí)上,科大訊飛的語(yǔ)音智能技術(shù)已經(jīng)在教育、醫(yī)療、汽車、客服等領(lǐng)域應(yīng)用和融合。據(jù)科大訊飛董事長(zhǎng)劉慶峰介紹,目前科大訊飛的人工智能機(jī)器已經(jīng)替代了30%的人工客服,安徽移動(dòng)甚至有75%的客服內(nèi)容都被人工智能的機(jī)器替代了。
人工智能的大時(shí)代已經(jīng)到來(lái)。但胡郁認(rèn)為,目前的人工智能技術(shù)還處于“弱智能”階段,大多還只能達(dá)到語(yǔ)音助手的水平,要想獲得與人類大腦類似或同等的智慧,擁有自主學(xué)習(xí)、舉一反三的能力,人工智能還需要將深度學(xué)習(xí)、大數(shù)據(jù)等技術(shù)相結(jié)合,實(shí)現(xiàn)“漣漪效應(yīng)”。
他進(jìn)一步解釋稱,以目前的技術(shù)水平生產(chǎn)出的人工智能產(chǎn)品在剛開(kāi)始投入市場(chǎng)的時(shí)候,有些性能和體驗(yàn)往往不夠好,比如難以實(shí)現(xiàn)人機(jī)互動(dòng)。但隨著更多人使用,不斷累積的真實(shí)數(shù)據(jù)和使用經(jīng)驗(yàn)就會(huì)幫助人工智能產(chǎn)品自我學(xué)習(xí)和更新?!爱?dāng)它擴(kuò)散到更多人群的時(shí)候,就像波紋覆蓋的水面擴(kuò)大,這時(shí)候就已經(jīng)是改進(jìn)以后的系統(tǒng)了”。
他把這種“漣漪效應(yīng)”的優(yōu)化歸功于第一批用戶的貢獻(xiàn)?!扒耙磺f(wàn)人免費(fèi)使用的同時(shí)也貢獻(xiàn)了寶貴的數(shù)據(jù)和經(jīng)驗(yàn),當(dāng)?shù)谝磺f(wàn)零一個(gè)人使用的時(shí)候,他往往會(huì)驚異于系統(tǒng)的優(yōu)異性能”。
實(shí)際上,科大訊飛最為人熟知的產(chǎn)品——訊飛語(yǔ)音輸入法也是在這種“漣漪效應(yīng)”的作用下才逐漸成長(zhǎng)的。
2010年以前,科大訊飛的語(yǔ)音識(shí)別技術(shù)無(wú)法在真實(shí)場(chǎng)景下使用,在實(shí)驗(yàn)室里,科大訊飛語(yǔ)音輸入法的測(cè)試識(shí)別準(zhǔn)確率是90%,在真實(shí)的環(huán)境下識(shí)別準(zhǔn)確率只能達(dá)到55.8%,但是在“漣漪效應(yīng)”的優(yōu)化下,現(xiàn)在的語(yǔ)音識(shí)別準(zhǔn)確率已經(jīng)達(dá)到95%,并且識(shí)別錯(cuò)誤率還在以每年30%的速度降低。
讓機(jī)器從“能聽(tīng)會(huì)說(shuō)”到“能理解會(huì)思考”
在國(guó)內(nèi)的人工智能領(lǐng)域中,百度和科大訊飛是體量最大、投入最早的公司。依托資金、科研等實(shí)力,這兩家公司的選擇往往會(huì)帶動(dòng)和影響國(guó)內(nèi)的人工智能發(fā)展和創(chuàng)業(yè)方向。
在今年9月舉行的百度世界大會(huì)上,百度公司首席科學(xué)家吳恩達(dá)宣布將開(kāi)放百度機(jī)器學(xué)習(xí)方面的能力,推出深度學(xué)習(xí)和百度大腦兩大開(kāi)放平臺(tái),讓開(kāi)發(fā)者不用再?gòu)念^寫(xiě)代碼。與百度從機(jī)器學(xué)習(xí)入手的考慮不一樣,胡郁希望科大訊飛能以語(yǔ)音和語(yǔ)言為入口,掀起一場(chǎng)人工智能的認(rèn)知革命。
“七萬(wàn)年前人類發(fā)生了‘認(rèn)知革命’,其中的核心是當(dāng)時(shí)的智人擁有了豐富的語(yǔ)言,從而更好地描述自然世界,執(zhí)行更復(fù)雜的計(jì)劃,可以描述他們腦子里面想到的東西,產(chǎn)生虛構(gòu),產(chǎn)生宗教,產(chǎn)生各種概念。”胡郁表示,之前的人工智能是以“深藍(lán)”計(jì)算機(jī)為代表的邏輯計(jì)算階段,現(xiàn)在則還處于可以精準(zhǔn)識(shí)別圖像和語(yǔ)音的感知階段,未來(lái)更高級(jí)的人工智能應(yīng)該是讓機(jī)器學(xué)會(huì)認(rèn)知。
在他看來(lái),要想讓人工智能走出“弱智能”階段的瓶頸,就必須讓機(jī)器從“能聽(tīng)會(huì)說(shuō)”到“能理解會(huì)思考”,這就需要讓人工智能也來(lái)一次“認(rèn)知革命”,讓機(jī)器和人能對(duì)話溝通,讓機(jī)器學(xué)會(huì)認(rèn)知,而以語(yǔ)音和語(yǔ)義為代表的自然語(yǔ)言理解技術(shù)應(yīng)該是一個(gè)突破口。
從國(guó)際經(jīng)驗(yàn)看來(lái),他的這一判斷也是人工智能的一種實(shí)現(xiàn)路徑。今年6月初,美國(guó)“互聯(lián)網(wǎng)女皇”Mary Meeker發(fā)布的《2016年互聯(lián)網(wǎng)趨勢(shì)報(bào)告》也認(rèn)為,語(yǔ)音將成為最重要的交互入口。今年年初,美國(guó)麻省理工學(xué)院評(píng)選出的十大創(chuàng)新預(yù)測(cè)中,語(yǔ)音接口也被列為第三名,被認(rèn)為是能解決重大問(wèn)題、帶來(lái)全新機(jī)遇的希望所在。
胡郁所負(fù)責(zé)執(zhí)行的“訊飛超腦計(jì)劃”就是想實(shí)現(xiàn)感知智能和認(rèn)知智能的突破:在感知智能方面,語(yǔ)音識(shí)別、手寫(xiě)識(shí)別技術(shù)要保證每年30%~50%的錯(cuò)誤率下降,要能夠識(shí)別方言,還要能理解人和機(jī)器、人和人之間的對(duì)話;在認(rèn)知智能方面的關(guān)鍵則是讓機(jī)器能理解、會(huì)思考,這就必須在自然語(yǔ)言理解、聯(lián)想推理、自主學(xué)習(xí)等多個(gè)方面實(shí)現(xiàn)突破。
作為“訊飛超腦”計(jì)劃的重要組成部分,由訊飛牽頭的科技部863重大專項(xiàng)——“基于大數(shù)據(jù)的類人智能關(guān)鍵技術(shù)與系統(tǒng)”相關(guān)研發(fā)工作也在有序進(jìn)行。這個(gè)項(xiàng)目的目標(biāo)是讓機(jī)器也能參加高考,并且考上一本,甚至清華、北大和中科大。
“當(dāng)人工智能掌握的技能越來(lái)越多的時(shí)候,希望我們?nèi)祟惪梢杂懈嚅e暇的工夫去玩,而不是被機(jī)器人奪去工作?!焙粽f(shuō)。
中國(guó)需要更多“爬山型”公司
雖然科大訊飛語(yǔ)音輸入法等產(chǎn)品已經(jīng)獲得了用戶的歡迎,離線和在線的交互次數(shù)每日達(dá)到20億,合作開(kāi)放伙伴突破15萬(wàn),但在胡郁眼中,科大訊飛并不是一家互聯(lián)網(wǎng)公司,而是一家正在爬山的科技公司。
之所以要強(qiáng)調(diào)二者的區(qū)別,是因?yàn)樵谒壑?,做人工智能的公司很像爬山者,需要?jiān)持目標(biāo)、不改方向,一步步地爬到頂峰,“我們今天是人工智能公司,昨天是人工智能公司,明天還會(huì)是人工智能公司”。但互聯(lián)網(wǎng)公司更像是個(gè)沖浪選手,互聯(lián)網(wǎng)的每一波浪潮都不一樣,它要不停地迎接下一個(gè)浪潮,“如果下個(gè)浪潮不是人工智能,也許他們就換了(方向)”。
此外,胡郁還認(rèn)為,人工智能的發(fā)展需要跟傳統(tǒng)產(chǎn)業(yè)深入磨合,就像爬山時(shí)要走穩(wěn)每一步、摸清每一塊石頭一樣,雖然過(guò)程繁瑣但卻是必不可少的?!盎ヂ?lián)網(wǎng)公司要有很高的收益性,這些是累活兒,互聯(lián)網(wǎng)公司不一定愿意去干”。
作為科學(xué)家轉(zhuǎn)型創(chuàng)業(yè)的代表,胡郁認(rèn)為人工智能領(lǐng)域的創(chuàng)業(yè)更加需要長(zhǎng)期的堅(jiān)守和持之以恒的投入?!澳莒o下心來(lái)坐10年板凳的這種決心,我覺(jué)得更重要”。
他堅(jiān)持認(rèn)為,中國(guó)還需要更多“爬山型”公司:“不管外部環(huán)境是PC互聯(lián)網(wǎng)還是移動(dòng)互聯(lián)網(wǎng),公司爬山的本質(zhì),你要征服的這個(gè)東西是不可變的。如果你堅(jiān)守都沒(méi)有,你后面做創(chuàng)新是不可能的?!?/p>
在期待“漣漪效應(yīng)”能給人工智能帶來(lái)更多優(yōu)化的同時(shí),胡郁還呼吁中國(guó)的人工智能研究應(yīng)該從兩個(gè)方面發(fā)力:研究院所、高校應(yīng)該更加著重于理論鉆研,而產(chǎn)業(yè)界不僅要應(yīng)用人工智能技術(shù),還應(yīng)該去做技術(shù)方面的大規(guī)模的融合創(chuàng)新。
這樣的呼吁源自他對(duì)中外人工智能的差異對(duì)比:中國(guó)的產(chǎn)業(yè)界、媒體界對(duì)人工智能的了解更多的是應(yīng)用特性和娛樂(lè)特性,而美國(guó)則深入鉆研人工智能的理論研究,這些研究成果大多難以產(chǎn)業(yè)化,但卻是最原始的理論基礎(chǔ)上的創(chuàng)新。
為什么中外人工智能領(lǐng)域的差異這么明顯?胡郁分析,國(guó)內(nèi)人工智能學(xué)術(shù)界因?yàn)橐a(chǎn)業(yè)對(duì)接,所以做了許多技術(shù)應(yīng)用和創(chuàng)新;而產(chǎn)業(yè)界還沒(méi)有更加深入、原創(chuàng)的研究能力,所以很少有單位能做整體性的系統(tǒng)創(chuàng)新。
“我們的很多創(chuàng)新其實(shí)只是停留在應(yīng)用或者技術(shù)層面上,但沒(méi)在科學(xué)的層面上去發(fā)現(xiàn)和創(chuàng)新,如果我們只在這個(gè)層面的話,得不了圖靈獎(jiǎng)也得不了諾貝爾獎(jiǎng),也不可能創(chuàng)造信息論這些東西?!?/p>
在他看來(lái),在人工智能的研究上,學(xué)術(shù)界的理論深度還應(yīng)加強(qiáng),也應(yīng)該花更長(zhǎng)的時(shí)間去研究人工智能的本質(zhì)性基礎(chǔ)科學(xué)?!皩?shí)際上我們還太少了一點(diǎn),還應(yīng)該增強(qiáng)”。
?。ㄔd于《中國(guó)青年報(bào)》 2016-10-25 10版)
© 1996 - 中國(guó)科學(xué)院 版權(quán)所有 京ICP備05002857號(hào)-1
京公網(wǎng)安備110402500047號(hào) 網(wǎng)站標(biāo)識(shí)碼bm48000002
地址:北京市西城區(qū)三里河路52號(hào) 郵編:100864
電話: 86 10 68597114(總機(jī)) 86 10 68597289(總值班室)
© 1996 - 中國(guó)科學(xué)院 版權(quán)所有 京ICP備05002857號(hào)-1
京公網(wǎng)安備110402500047號(hào) 網(wǎng)站標(biāo)識(shí)碼bm48000002
地址:北京市西城區(qū)三里河路52號(hào) 郵編:100864
電話: 86 10 68597114(總機(jī)) 86 10 68597289(總值班室)
© 1996 - 中國(guó)科學(xué)院 版權(quán)所有
京ICP備05002857號(hào)-1
京公網(wǎng)安備110402500047號(hào)
網(wǎng)站標(biāo)識(shí)碼bm48000002
地址:北京市西城區(qū)三里河路52號(hào) 郵編:100864
電話:86 10 68597114(總機(jī))
86 10 68597289(總值班室)