如今的技術(shù)開(kāi)發(fā)成果已經(jīng)讓人印象深刻,計(jì)算機(jī)可以辨識(shí)圖片和視頻里的東西,可以將語(yǔ)音轉(zhuǎn)化成為文字,其效率已經(jīng)超過(guò)了人力范疇。Google也將GoogleTranslate辦事中添加了神經(jīng)網(wǎng)絡(luò),現(xiàn)在的機(jī)器學(xué)習(xí)在翻譯水平上已經(jīng)逐步迫近人工翻譯。現(xiàn)實(shí)中的一些應(yīng)用也讓人大開(kāi)眼界,好比計(jì)算機(jī)可以預(yù)測(cè)農(nóng)田作物產(chǎn)量,其準(zhǔn)確性比美國(guó)農(nóng)業(yè)部還高;機(jī)器能更加精準(zhǔn)的診斷癌癥,其準(zhǔn)確度也比從醫(yī)多年的老醫(yī)師還要高。
深度學(xué)習(xí)在當(dāng)下已經(jīng)成為熱詞,人工智能教育踐行者葉偉志認(rèn)為雖然深度學(xué)習(xí)的成果不停涌現(xiàn),但深度學(xué)習(xí)目前還存在著很多問(wèn)題,任重而道遠(yuǎn)。
一、現(xiàn)在的機(jī)器學(xué)習(xí)缺乏交互學(xué)習(xí)的能力
現(xiàn)在一個(gè)深度學(xué)習(xí)的模型,如果拿到一個(gè)新的數(shù)據(jù)集上訓(xùn)練一遍,它會(huì)把本來(lái)在老數(shù)據(jù)集上訓(xùn)練的東西全部忘掉。這里需要一種學(xué)習(xí)能力是自主學(xué)習(xí),我們需要這個(gè)機(jī)器能夠本身去尋找具有價(jià)值的一些數(shù)據(jù)和狀態(tài)。
第二種學(xué)習(xí)方式叫做交互式學(xué)習(xí),人類(lèi)在學(xué)習(xí)的時(shí)候,除了我們本身去不雅觀察這個(gè)世界,總結(jié)規(guī)律以外,很多的學(xué)習(xí)來(lái)源于和人的交互中得到。
還有一種重要的學(xué)習(xí)方式是創(chuàng)造性學(xué)習(xí),人的智力的核心是具備本身學(xué)習(xí)和自我創(chuàng)造的能力,現(xiàn)在的機(jī)器學(xué)習(xí),在這方面非常缺乏。
二、現(xiàn)在的機(jī)器缺乏常識(shí)
一個(gè)典型的例子是自動(dòng)駕駛,學(xué)過(guò)開(kāi)車(chē)的都知道,從開(kāi)始學(xué)到能夠熟練的開(kāi)車(chē),可能有幾百公里的駕駛路程就可以了,谷歌的無(wú)人車(chē)到目前為止已經(jīng)開(kāi)了幾百萬(wàn)公里,還是做不到無(wú)人完全自動(dòng)駕駛。其中最主要的一個(gè)原因,它不像人類(lèi)具備一些常識(shí)性的推理能力。
這導(dǎo)致的后果是它需要研究人員或工程師,在每一種可能遇到的路況都要做特定的處理,需要在它這幾百萬(wàn)公里的數(shù)據(jù)里面,盡量的覆蓋可能多的交通狀況和路況。即便如此,它還是不能夠保證能處理遇到的一些新路況。人類(lèi)學(xué)習(xí)開(kāi)車(chē),主要學(xué)的是控制標(biāo)的目的盤(pán)和踩油門(mén),針對(duì)前方路況是要開(kāi)過(guò)去還是減速,人類(lèi)通過(guò)常識(shí)就可以做到。
三、現(xiàn)在的機(jī)器學(xué)習(xí)很難從少量的標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)
好比ImageNet角逐,每一幅圖,機(jī)器平均有上千個(gè)樣原來(lái)學(xué)習(xí)。而對(duì)于人類(lèi),要學(xué)習(xí)識(shí)別一個(gè)新的物體,給他看一兩眼大概就能學(xué)會(huì)了。
怎么樣才能夠有效的利用少量的標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)呢?其中重要的一點(diǎn)就是我們需要有非常好的特征體現(xiàn),好的特征體現(xiàn)需要有大量的數(shù)據(jù)才能學(xué)到,而大量沒(méi)有標(biāo)注的數(shù)據(jù),則需要通過(guò)非監(jiān)督的方式才能有效的把里面的特征體現(xiàn)很好的學(xué)習(xí)出來(lái)。
怎么樣做到非監(jiān)督學(xué)習(xí)呢?就是通過(guò)對(duì)未來(lái)的預(yù)測(cè)進(jìn)行非監(jiān)督學(xué)習(xí)。能夠?qū)ξ磥?lái)做出預(yù)測(cè)是智力一個(gè)非常核心的部分。物理學(xué)是對(duì)一個(gè)簡(jiǎn)單系統(tǒng)比較精確的預(yù)測(cè),而深度學(xué)習(xí)或者人的智力是對(duì)一個(gè)復(fù)雜系統(tǒng)近似的預(yù)測(cè)。如果我們能夠?qū)ξ磥?lái)進(jìn)行一個(gè)比較好的預(yù)測(cè),那就說(shuō)明這個(gè)模型能夠抓住環(huán)境,以及變革的素質(zhì)規(guī)律,從而能夠提取出一些比較有用的信息,這樣能夠有效的把它用于少量的標(biāo)注數(shù)據(jù)的學(xué)習(xí)。
四、現(xiàn)在的很多成功應(yīng)用是基于標(biāo)注好的一些標(biāo)注數(shù)據(jù)來(lái)學(xué)習(xí)
對(duì)于人類(lèi)來(lái)說(shuō),如果要鑒別兩只鳥(niǎo),我們學(xué)習(xí)的過(guò)程就是,按照以前人類(lèi)的知識(shí),總結(jié)出兩只鳥(niǎo)尾巴長(zhǎng)短會(huì)的差別,以前的經(jīng)驗(yàn)還會(huì)總結(jié)出這兩種鳥(niǎo)的頭部花紋的差別。人類(lèi)在接受了語(yǔ)言的描述,,知識(shí)和經(jīng)驗(yàn)的累積,可以非常快的學(xué)習(xí)。現(xiàn)在機(jī)器還沒(méi)有措施把人通過(guò)語(yǔ)言來(lái)傳遞的這種知識(shí)和標(biāo)注數(shù)據(jù),有機(jī)的結(jié)合進(jìn)行學(xué)習(xí)。
葉偉志,壹企問(wèn)咨詢總經(jīng)理,廣東天使會(huì)合伙人,人工智能企業(yè)應(yīng)用專(zhuān)家,資深軟件開(kāi)發(fā)工程師。