【大數(shù)據(jù)文摘】北理工副校長(zhǎng),、中科院院士梅宏:真正的大數(shù)據(jù)應(yīng)用體現(xiàn)在數(shù)據(jù)挖掘的深度
發(fā)布日期:2016-09-27 供稿:大數(shù)據(jù)文摘 編輯:趙琳 審核:包麗穎 閱讀次數(shù):
原文標(biāo)題:院士梅宏:真正的大數(shù)據(jù)應(yīng)用體現(xiàn)在數(shù)據(jù)挖掘的深度
2016 CCF大數(shù)據(jù)與計(jì)算智能大賽于2016年9月24日在中國·北京梅地亞中心酒店開幕,。
北京理工大學(xué)副校長(zhǎng),,中國科學(xué)院院士梅宏在會(huì)上做了《大數(shù)據(jù)與數(shù)據(jù)驅(qū)動(dòng)的智慧》的演講,,探索了大數(shù)據(jù)帶來的挑戰(zhàn)和可能的應(yīng)用。梅宏認(rèn)為,,目前來講,,大數(shù)據(jù)還在炒作的階段,,真正的大數(shù)據(jù)應(yīng)用應(yīng)該體現(xiàn)在數(shù)據(jù)挖掘的深度。在演講的梅宏最后提出:當(dāng)自演化的軟件能夠讓機(jī)器自己改代碼的時(shí)候,,才是真正的類腦智能,。
大數(shù)據(jù)文摘為您帶來一手演講實(shí)錄,以下為梅宏院士演講全文:
*根據(jù)主辦方提供的速記整理,,在不改變?cè)獾那闆r下,部分有刪改
我今天的題目叫做大數(shù)據(jù)與數(shù)據(jù)驅(qū)動(dòng)的智慧,,首先我大概分成四個(gè)部分,,談?wù)勎覍?duì)大數(shù)據(jù)的認(rèn)識(shí),我想講四個(gè)部分,,第一個(gè)談?wù)剬?duì)大數(shù)據(jù)的認(rèn)識(shí),,第二個(gè)大數(shù)據(jù)給我們帶來什么挑戰(zhàn),第三個(gè)大數(shù)據(jù)應(yīng)用,,最后結(jié)合我們的主題講講數(shù)據(jù)和智能的關(guān)系,,主要談我的理解。
◆ ◆ ◆
認(rèn)識(shí)大數(shù)據(jù)
所謂大數(shù)據(jù),,它是我們信息化到一定階段之后,,必然出現(xiàn)的一個(gè)現(xiàn)象(自然現(xiàn)象),主要是由于信息技術(shù)不斷的成本化,,不斷的廉價(jià)化,,以及互聯(lián)網(wǎng)及其延伸出來的,帶來的信息技術(shù)無處不在的應(yīng)用所帶來的自然現(xiàn)象,。
基本上有幾個(gè)主要的驅(qū)動(dòng)力:
一個(gè)是摩爾定律所驅(qū)動(dòng)的指數(shù)增長(zhǎng)模式,;
第二個(gè)是我們技術(shù)低成本化驅(qū)動(dòng)的萬物的數(shù)字化;
第三個(gè)就是寬帶移動(dòng)泛在互聯(lián)驅(qū)動(dòng)的人機(jī)物廣聯(lián)連接,,以及最后大規(guī)模的匯聚,。
實(shí)際上大數(shù)據(jù)正在帶來我們新的一撥數(shù)據(jù)化的浪潮,信息化的第三撥浪潮3.0,。
如果我們回顧來看我們的過去的話,,我們大體上能夠看到兩個(gè)明顯的階段的劃分,一個(gè)是在從PC機(jī)開始進(jìn)入市場(chǎng)以來,,應(yīng)該說帶來了信息化的第一撥浪潮,,這個(gè)浪潮差不多到90年代中期,這個(gè)時(shí)候的主要特征是單機(jī)應(yīng)用為特征的數(shù)字化特征,,我們主要完成簡(jiǎn)單的工作上最核心業(yè)務(wù)的數(shù)字化的工作,,以PC機(jī)為主。
在過去的20年,,90年代中期到現(xiàn)在,,以聯(lián)網(wǎng)應(yīng)用為特征的網(wǎng)絡(luò)化出現(xiàn)數(shù)據(jù)大集中,,開始全國范圍內(nèi)的大聯(lián)網(wǎng)等等,各個(gè)企業(yè)甚至走向企業(yè)全球,,現(xiàn)在我們正在進(jìn)入新的階段,,這個(gè)以數(shù)據(jù)的深度挖掘和融合應(yīng)用為特征的智慧化,或者智慧化的現(xiàn)象,。
到底什么是大數(shù)據(jù),,這兩個(gè)定義從兩個(gè)角度來談:
一個(gè)從技術(shù)上來講,我們的技術(shù)供給能力不足所面臨的對(duì)象他稱之為大數(shù)據(jù),,第二是從數(shù)據(jù)特征講的數(shù)據(jù),,這是兩個(gè)數(shù)據(jù)的定義。
◆ ◆ ◆
應(yīng)對(duì)大數(shù)據(jù)
大數(shù)據(jù)帶來的是什么,,我覺得最重要的東西可能帶來的是思維模式的變化,,如果回顧來看看我們過去,基本上定義這不一定是大家都能夠接受,,但是能夠去查的話,,定義出現(xiàn)所謂的大數(shù)據(jù)是在上個(gè)世紀(jì)的時(shí)候,97年的時(shí)候,,SGI的首席科學(xué)家曾經(jīng)用了這個(gè)詞,,他講了數(shù)據(jù)提到大數(shù)據(jù),特別強(qiáng)調(diào)從技術(shù)的視角來看,,所謂的難獲取,,難預(yù)測(cè),難處理,,難組織四個(gè)難題,。而從商業(yè)視角與大數(shù)據(jù)時(shí)代這本書的發(fā)行,開始探討大數(shù)據(jù)在商業(yè)里面的應(yīng)用,,特別強(qiáng)調(diào)了幾個(gè)很重要的特征,,從隨機(jī)樣本到群體數(shù)據(jù)等這么一個(gè)變化。
這是我們經(jīng)常講的大數(shù)據(jù)的價(jià)值和意義,,大體上分成幾個(gè)方面,。
一個(gè)通過大數(shù)據(jù),我們能夠認(rèn)識(shí)復(fù)雜系統(tǒng)的新思維,,促進(jìn)經(jīng)濟(jì)轉(zhuǎn)型,,提升國家綜合能力保障國家安全,提升政府的治理能力以及服務(wù)民生服務(wù)社會(huì)的能力,。
這是我在幾個(gè)場(chǎng)合講的一個(gè)我對(duì)當(dāng)前數(shù)據(jù)狀況的一個(gè)認(rèn)識(shí),,以及個(gè)人的一些見解,時(shí)間關(guān)系我不會(huì)詳細(xì)的說,,我覺得目前來講,,大數(shù)據(jù)開始還在炒作的階段,,至少到我們中國炒作的熱潮還沒有過去,所以我們相對(duì)于國外的炒作,,國外開始進(jìn)入我們還滯后了3到5年,,真正的大數(shù)據(jù)應(yīng)用應(yīng)該體現(xiàn)在數(shù)據(jù)挖掘的深度。
原因有三點(diǎn):首先有我們對(duì)數(shù)據(jù)認(rèn)識(shí)不到位的原因,,還有在當(dāng)今的情況下一宣傳大家都很熱,,成為了獲取資源的途徑。不聊大數(shù)據(jù)就拿不到項(xiàng)目,,這也是一個(gè)很重要的原因,;
第二個(gè)是大數(shù)據(jù)投入過熱,資源浪費(fèi)比較明顯,,這方面的投入特別是數(shù)據(jù)中心的投入為典型;
第三個(gè)就是我們認(rèn)為大數(shù)據(jù)的理論和技術(shù)都還處于發(fā)展的早期,,所以我們定義已經(jīng)有了共識(shí),,但是對(duì)它的核心觀點(diǎn)和命題還是有很多爭(zhēng)議的,比如說大和小,,到底怎么來定義,,關(guān)聯(lián)和因果的辯證性,所有都講關(guān)聯(lián)不求因果的嗎,,所有的數(shù)字化的東西相對(duì)于客觀世界而言也僅僅是一個(gè)抽樣而已,,不管是它的時(shí)間密度,空間密度到底有多大,。第二是不是有通用的技術(shù)體系也不太敏感,,從我們做計(jì)算領(lǐng)域研究的人來講,總是希望能夠?yàn)閿?shù)據(jù)的處理方式提供一種手段,。數(shù)據(jù)科學(xué)的理論基礎(chǔ)還沒有,,比如說傳統(tǒng)的統(tǒng)計(jì)方法,他有一個(gè)數(shù)據(jù)統(tǒng)計(jì)的基礎(chǔ)在本,,我們是不是就用統(tǒng)計(jì),,用深度學(xué)習(xí),還有沒有其他更好的理論上的突破,,這個(gè)應(yīng)用了相對(duì)超前理論和技術(shù)的發(fā)展,,這樣使得很多數(shù)據(jù)分析的結(jié)論基本上缺少因果,缺少理論知識(shí),,都是用靠關(guān)聯(lián)關(guān)系建立起來的,。有時(shí)候這個(gè)使用還是需要適當(dāng)審慎的。最后一個(gè)大數(shù)據(jù)這個(gè)現(xiàn)象可能會(huì)長(zhǎng)期的存在,,對(duì)我們計(jì)算能力的挑戰(zhàn)也是永恒的,。
我順便舉兩個(gè)歷史上大人物說過的話,,這是過高的估計(jì)了當(dāng)時(shí)的計(jì)算。
一個(gè)是IBM當(dāng)時(shí)的首席認(rèn)為世界上是由幾臺(tái)計(jì)算機(jī)就夠了,,這個(gè)大家經(jīng)常當(dāng)成他的笑話來說,,比爾蓋茨也說640K的內(nèi)存就差不多了,我想數(shù)據(jù)的增長(zhǎng)會(huì)遠(yuǎn)遠(yuǎn)的超出我們處理能力的增長(zhǎng),,所以我們很多的數(shù)據(jù)是做不到的,。比如說2016年美國存儲(chǔ)軟件供應(yīng)商發(fā)布的,剛才我看有人給我發(fā)一個(gè)他們做的冷數(shù)據(jù)存儲(chǔ),,冷數(shù)據(jù)你還處理過,,但有的數(shù)據(jù)你碰都沒碰把它存儲(chǔ)起來,這個(gè)對(duì)我們的挑戰(zhàn)也是很大的,。我們把一個(gè)地球搞清楚,,把科學(xué)搞清楚,很多數(shù)據(jù)我估計(jì)真的到宇宙發(fā)生變化的時(shí)候也未必能夠完全處理清楚,。
第二個(gè)數(shù)據(jù)帶來的挑戰(zhàn),,我是把它分成兩大類,一類下面這類有大數(shù)據(jù)的管理,,主要指的計(jì)算機(jī)的技術(shù),,講計(jì)算機(jī)類的技術(shù),第二是大數(shù)據(jù)的分析方法,,怎么樣有理論方法去分析它,,講這兩個(gè)。大體上有這么幾個(gè)東西,。管理上一個(gè)是數(shù)據(jù)庫管理系統(tǒng),,面臨一系列的挑戰(zhàn),我們傳統(tǒng)的關(guān)系型關(guān)系庫追求數(shù)據(jù)的一致,,系統(tǒng)的高性能,。沒有預(yù)先定義的模式使得一致性難以支持,高性能也難以實(shí)現(xiàn),。數(shù)據(jù)庫傳統(tǒng)發(fā)展的理念也開始完全由一個(gè)通用的數(shù)據(jù)庫開始追求領(lǐng)域通用,,這是一部分。
這是數(shù)據(jù)的管理本身,,那么數(shù)據(jù)的處理,,怎么處理,由于單臺(tái)計(jì)算設(shè)備不管性能有多高,,它也不可能把數(shù)據(jù)處理完,,所以說并行處理就成為不二的選擇,因?yàn)閿?shù)據(jù)量太大了。要并行處理就面臨不同數(shù)據(jù)的需求,,比如說批處理,,流處理,圖處理,,當(dāng)然一系列的東西大家都在嘗試,,也可能不存在通用的數(shù)據(jù)處理方法,或者數(shù)據(jù)處理平臺(tái)能夠適應(yīng)所有類型的數(shù)據(jù),,是不是能夠做到,,現(xiàn)在目前來看也沒有。
一種可能的途徑,,比如說能不能通過軟件的定義的方式,,我們能夠把各種能力集中到一起,然后在上面透過不同的數(shù)據(jù)處理的需求,,定義出不同的平臺(tái),,也就是說我要實(shí)現(xiàn)這種平臺(tái)把它柔和到一起的這種可定制性,可剪裁性能不能做到,。還有云計(jì)算中心,,現(xiàn)在越來越多的大數(shù)據(jù)依托于云計(jì)算中心。
第二部分大數(shù)據(jù)的分析方法,,可能和數(shù)學(xué)分析方法更緊密的相關(guān),怎么能夠把我們理論方法體系建立起來,,在不同領(lǐng)域進(jìn)行應(yīng)用,。
我們大數(shù)據(jù)分析面臨著一對(duì)挑戰(zhàn):
一個(gè)是分析對(duì)象的改變,過去是預(yù)處理后數(shù)據(jù)我們現(xiàn)在是原始數(shù)據(jù),,以前是樣本數(shù)據(jù),,現(xiàn)在是全數(shù)據(jù),以前是單源單模態(tài)數(shù)據(jù),,現(xiàn)在是多源多模態(tài)數(shù)據(jù),。就是分析對(duì)象發(fā)生了變化;
第二是分析的需求發(fā)生變化,,我們需要更加準(zhǔn)確的高精度分析,,還有復(fù)雜關(guān)聯(lián)的深層特征,還有大規(guī)模的復(fù)雜關(guān)聯(lián),;
第三個(gè)變化分析模型能力的變化,,我們需要追求從表達(dá)力受限的低維數(shù)據(jù),到高信息量的高維數(shù)據(jù),,還有弱表達(dá)力的簡(jiǎn)單模型到強(qiáng)表達(dá)力的復(fù)雜模型,,目前來看,我們很多的大數(shù)據(jù)分析方法都主要是可視化的展現(xiàn),統(tǒng)計(jì)分析,,機(jī)器學(xué)習(xí)的技術(shù),;
再一個(gè)大數(shù)據(jù)可能在這種情況下,計(jì)算機(jī)領(lǐng)域也探討了很多,,現(xiàn)在的以通用性考慮為主的IT體系很難滿足大數(shù)據(jù)的需求,,有必要考慮對(duì)整個(gè)IT架構(gòu)進(jìn)行革命性的重構(gòu)。
◆ ◆ ◆
應(yīng)用大數(shù)據(jù)
第三應(yīng)用大數(shù)據(jù)有一些成功的案例我就不細(xì)說了,,我做了一個(gè)分類,,一類是互聯(lián)網(wǎng)類的,這主要是指公共平臺(tái)的,,物聯(lián)網(wǎng)類主要是有助的,,做的各種傳感器,組織業(yè)務(wù)是指每一個(gè)企業(yè)機(jī)構(gòu)他們自己內(nèi)部的以結(jié)構(gòu)化數(shù)據(jù)為核心的融合的各種各樣的組織業(yè)務(wù)的數(shù)據(jù),。還有一個(gè)科學(xué)實(shí)驗(yàn)的數(shù)據(jù),,大體分成這樣幾個(gè)。大家可以看到這幾類數(shù)據(jù)都有很多成功的案例,,在這我也不細(xì)講了,。
大數(shù)據(jù)應(yīng)用,大家基本上認(rèn)為有三個(gè)層次,。
一個(gè)首先第一個(gè)層次只是關(guān)注到底當(dāng)前發(fā)生了什么,,把發(fā)展的態(tài)勢(shì)曲線給你描述出來,呈現(xiàn)發(fā)展的歷程,;
第二是預(yù)測(cè),,能夠在當(dāng)前分析的基礎(chǔ)之上,預(yù)測(cè)它未來可能會(huì)發(fā)生什么,,呈現(xiàn)事物發(fā)展的這么一個(gè)趨勢(shì),。比如說流感的預(yù)測(cè),奧斯卡的預(yù)測(cè)大概都屬于這類,;
第三類就是所謂的指導(dǎo)性,,指導(dǎo)性的就當(dāng)前的態(tài)勢(shì),如果你做一個(gè)動(dòng)作,,會(huì)產(chǎn)生什么后果,,這就便于當(dāng)前的態(tài)勢(shì)要做出決策,不僅是預(yù)測(cè)未來怎么樣,,而是做一個(gè)動(dòng)作以后,,做一個(gè)決策以后,會(huì)不會(huì)影響未來的結(jié)果,。
所以從當(dāng)前來看我以為當(dāng)前的大數(shù)據(jù)應(yīng)用呈現(xiàn)這么幾個(gè)特點(diǎn):
一個(gè)從應(yīng)用層次上講,,應(yīng)該說描述性,預(yù)測(cè)性的應(yīng)用還是比較多的,真正的指導(dǎo)性的應(yīng)用偏少,;
第二從數(shù)據(jù)源的角度,,基于單一數(shù)據(jù)源的數(shù)據(jù)偏多,基于多態(tài)數(shù)據(jù)源偏少,,有什么數(shù)據(jù)整什么數(shù)據(jù),,包括今天發(fā)布了很多題目,數(shù)據(jù)擺在這你找去,,根據(jù)我的應(yīng)用需求,,我把各種數(shù)據(jù)柔到一塊這種應(yīng)用也偏少,有時(shí)候前幾年看了很多競(jìng)賽題目都不錯(cuò),,真正呈現(xiàn)大數(shù)據(jù)分析的非常讓你眼睛一亮的這種特征的東西還是偏少,,他沒有應(yīng)用需求。
怎么根據(jù)我的要求找這種數(shù)據(jù),,這種應(yīng)用偏少,,當(dāng)然對(duì)數(shù)據(jù)研究缺少數(shù)據(jù)源也是很重要的理論。從需求導(dǎo)向,,也是根據(jù)我到底有什么問題,,在問題里面我想解決什么問題,我提出解決方案,,這樣的應(yīng)用這種構(gòu)建模型的應(yīng)用也偏少,,因此從這個(gè)意義上講,我以為大數(shù)據(jù)應(yīng)用還僅僅在于初級(jí)階段,,這也就是我剛才我講的,,我們從現(xiàn)在開始,也許我們正在進(jìn)入信息化的第三撥浪潮,,這個(gè)階段會(huì)持續(xù)多少年,,我不知道,,但我樂觀的估計(jì),,大膽的揣測(cè)一下我相信應(yīng)該有十幾,二十年,,這也有一個(gè)依據(jù),,這個(gè)依據(jù)我在報(bào)告的時(shí)候也會(huì)講一個(gè)東西,經(jīng)濟(jì)學(xué)上有一個(gè)傳播理論,,每一個(gè)傳播大概是50年左右,,包括早期的蒸汽機(jī)引領(lǐng)了50年,汽車也引領(lǐng)了50年,,我們真正的信息領(lǐng)域引領(lǐng)這50年是從上個(gè)世紀(jì)50年代,,以微電子網(wǎng)絡(luò)才開始,所以信息技術(shù)已經(jīng)發(fā)展了幾十年了,真正在經(jīng)濟(jì)里面占據(jù)主要的驅(qū)動(dòng)力,,也就從90年代開始,,大家算算90年加50,我們可以到2014年所以在未來的20多年大體上還是IT的天下,。
◆ ◆ ◆
數(shù)據(jù)和智能
最后講講數(shù)據(jù)和智能,,我們談的最多的是數(shù)據(jù)驅(qū)動(dòng)的智能時(shí)代正在到來,我們來回顧一下人工智能,,人工智能這個(gè)詞早期有非常明確的定義,,他有它的做法,人工智能到現(xiàn)在為止也正在接受第三個(gè)高潮,,早期的人工智能都是硬編碼,,所謂的智能都是程序,就是高級(jí)程序設(shè)計(jì),,通過高級(jí)的編成方法,,后來長(zhǎng)期的發(fā)展還是走的基于規(guī)則的智能,實(shí)際上就是基于邏輯的,,構(gòu)建一個(gè)規(guī)則庫,,構(gòu)建一個(gè)事實(shí)庫,加上邏輯推理,,當(dāng)時(shí)人工智能里面也很長(zhǎng)時(shí)間受到批評(píng),,認(rèn)為人工智能沒有產(chǎn)生什么實(shí)際的效果,實(shí)際上有一批人工智能還是不錯(cuò)的,,就是專家系統(tǒng),,專家系統(tǒng)真正解決了很多當(dāng)時(shí)存在的問題。
我覺得現(xiàn)在當(dāng)前我們正在走的這撥人工智能,,它和過去的做法是不一樣的,,這是數(shù)據(jù)驅(qū)動(dòng)的智能,它是利用機(jī)器學(xué)習(xí),,統(tǒng)計(jì)分析的方法從數(shù)據(jù)中自己向上發(fā)現(xiàn)規(guī)律,,前期先構(gòu)建規(guī)則,規(guī)則驅(qū)動(dòng)它不太一樣,,走的這樣一個(gè)途徑,,今年最熱的就是阿爾法狗,在最難的棋內(nèi)戰(zhàn)勝了人類,,當(dāng)時(shí)網(wǎng)上炒的很多很多,,很多專家也沒出來說話,所以如果我說這個(gè)事情對(duì)于人類的威脅,,我牙根就不認(rèn)為它有什么威脅,,他永遠(yuǎn)是為做事的,,大家想想過去每次技術(shù)進(jìn)步,就把我們?nèi)祟惖膭趧?dòng)減少多少,,機(jī)械把我們的體力勞動(dòng)減少多少,,不過就是計(jì)算把我們的智力勞動(dòng),很多煩瑣的勞動(dòng)把它減少了,,他離人工智能還遠(yuǎn)的很,。
最后談到一些若干概念,當(dāng)前關(guān)于智能或者叫做人工智能,,有很多提法,,人工智能是最早的,一直在談,,我一直認(rèn)為人工智能是有它當(dāng)初嚴(yán)格的定義的,,過去人工智能做的東西,現(xiàn)在我們寫的人工智能技術(shù),,前沿技術(shù)我真的不認(rèn)為所謂人工智能前沿技術(shù)是什么,,有人曾經(jīng)用過機(jī)器智能,這個(gè)走的路徑應(yīng)該說是一種結(jié)合,,但更多的還是基于規(guī)則的多一點(diǎn),。
現(xiàn)在也有人稱之為數(shù)據(jù)智能,我們叫做計(jì)算智能,,李老師也談到了,,是有一個(gè)狹義的定義的,神經(jīng)網(wǎng)演化計(jì)算,,曾經(jīng)用過的詞,,我們?yōu)槭裁从眠@個(gè)東西呢,我個(gè)人還是覺得數(shù)據(jù)驅(qū)動(dòng)的智能,,最終呈現(xiàn)智能的方式,,還是算出來的。實(shí)際上本質(zhì)上是把人的智能的問題,,把它轉(zhuǎn)化成計(jì)算的問題,,這個(gè)計(jì)算的問題要么是邏輯推理算的,有一個(gè)規(guī)則去驅(qū)動(dòng)的,,要么是通過數(shù)據(jù)處理的方式從數(shù)據(jù)里面弄的實(shí)際上它本身還不算是智能,,所以我們?yōu)槭裁聪脒x擇智能,,我覺得這也挺好,,我覺得站在計(jì)算領(lǐng)域的角度總希望用這個(gè)角度來說話,我講大數(shù)據(jù)的時(shí)候我曾經(jīng)說過,,我說大數(shù)據(jù)能夠出現(xiàn)是因?yàn)橛?jì)算智能要解決它還得靠計(jì)算智能,,甚至你說你可能有一個(gè)模型的方法出來能夠用量級(jí)的計(jì)算,,但不管有多大的量級(jí),沒有計(jì)算機(jī),,你人靠手算是永遠(yuǎn)算不出來的,,所以還得靠工具克服,因此還是計(jì)算問題,,我們更傾向于把它叫做計(jì)算所產(chǎn)生的智能,,當(dāng)然是基于數(shù)據(jù)所產(chǎn)生的智能。
第二個(gè)問題是機(jī)器計(jì)算機(jī)真的能擁有人的智能嗎,?
在座的大部分都知道,,它不可能,現(xiàn)在又有一個(gè)說法,,類人智能和類腦智能,,我們現(xiàn)在國家在搞腦計(jì)劃,有內(nèi)腦計(jì)算,,我們現(xiàn)在的機(jī)器是沒有智能的,,它是把人看成一個(gè)黑客,互聯(lián)網(wǎng)上提一個(gè)問題都有,,這個(gè)智能是像人一樣,,感知相對(duì)容易,認(rèn)知且難且難,,所以我覺得內(nèi)腦智能應(yīng)該是什么,,我們真的把人的科學(xué)上的人腦的科學(xué)上的東西搞清楚了,然后模擬這個(gè)東西做一套東西,,我覺得這叫內(nèi)腦智能,,給你一個(gè)行為,好像他能解決問題,,只不過是靠計(jì)算機(jī)強(qiáng)大的計(jì)算能力,,把一個(gè)所謂的這種問題變成了一個(gè)數(shù)據(jù)處理的問題,計(jì)算的問題而已,。所以我覺得類人智能發(fā)展大體分成三個(gè)層次,,第一個(gè)是傳統(tǒng)的人工智能走的路,一個(gè)軟件加上一個(gè)知識(shí)庫,,在上面做推理,,這是一種。第二種如果說我們能夠形成一個(gè)自演化的知識(shí)庫,,要靠數(shù)據(jù)的方式解決,,我從數(shù)據(jù)里面能夠不能不斷的凝練一些東西出來,知識(shí)庫能夠自己去增長(zhǎng)能不能做到這一點(diǎn),,我想如果能夠做到這個(gè),,就能夠形成第二層次的智能,,這個(gè)東西要從我們數(shù)據(jù)匯集里面得到想要的結(jié)果。
我想第三個(gè)層次,,能不能自演化的軟件,,加上自演化的過程,大家知道我們現(xiàn)在所有的軟件,,一旦寫好以后,,編譯結(jié)束以后是改不了的,自演化的軟件能夠機(jī)器自己改代碼可能嗎,?現(xiàn)在肯定是不可能的,,但我們也嘗試,比如說用數(shù)據(jù)的方法來改它有大量的軟件片斷存在,,我能不能在某種特定的環(huán)境之下,,解決軟件的一些行為的改變,這是一個(gè)夢(mèng),,這個(gè)夢(mèng)是計(jì)算機(jī)科學(xué)家長(zhǎng)期的夢(mèng),,過去軟件智能化就是想解決這個(gè)問題,但實(shí)際上沒有做成,,那是走的規(guī)則方式未來這個(gè)如果能夠解決,,我覺得類腦智能就更像,機(jī)器能夠改代碼,,現(xiàn)在我們組織一個(gè)團(tuán)隊(duì)想嘗試這個(gè)事情,。
機(jī)器自己能夠改代碼,我想在我有生之年看不到了,,從我本意來講也不希望這個(gè)情況出現(xiàn),。如果真的這個(gè)情況出現(xiàn)了,世界就大亂了,,好,,謝謝。
啟動(dòng)儀式上,,各行業(yè)大咖發(fā)布了來自各創(chuàng)新企業(yè)與科研機(jī)構(gòu)的11道高質(zhì)量大數(shù)據(jù)與人工智能創(chuàng)新賽題,,涉及智能電網(wǎng)、搜索廣告,、O2O營(yíng)銷,、輿情分析、監(jiān)控識(shí)別,、計(jì)算廣告,、無人駕駛、市場(chǎng)預(yù)測(cè),、LBS營(yíng)銷,、氣候預(yù)測(cè)等多個(gè)熱門方向,將為圖像處理,、自然語言處理,、用戶畫像、推薦系統(tǒng)等領(lǐng)域提供大量來自真實(shí)場(chǎng)景的問題與數(shù)據(jù),。
感謝大會(huì)主辦方提供速記,,部分有刪改
大數(shù)據(jù)文摘記者|魏子敏
分享到: