想讓人工智能更“聰明”大數據還得深加工
2019.12.10
驅動人工智能技術蓬勃發展的是各行各業積累的大數據。可以說,正是在大數據的“喂養”下,人工智能技術才真正茁壯成長。
據科技日報報道,在香山科學會議第667次學術討論會上,與會專家指出,大數據的“紅利”效應正在逐漸減弱,人工智能技術的單點突破難以持續支撐行業發展,亟須在數據科學和計算智能方麵突破一些關鍵核心技術。
人們常常用海量性、多樣性、高速以及價值密度低來描述大數據的特點。但真實的大數據往往更加複雜,比如具有不完全性、不確定性、動態性、關聯性等特點。反觀經典的人工智能算法,它們對數據的假設往往過於簡單。比如,假設數據是靜態的,產生於獨立同分布的采樣過程;訓練數據是可靠的、數據所承載的信息是完全的等。
“shujudezhenshifuzaxinghesuanfadejiandanjiashezhijiancunzaizhejudahonggou,zheshidejingdianzhinengsuanfazaihenduofuzarenwushangbiaoxianqianjia,jidaijinyibudeyanjiuhetansuo。”會議執行主席之一、中國科學院院士梅宏強調,大數據是人工智能獲得成功的物質基礎,但目前主流的人工智能算法並未充分考慮大數據本身的複雜性。
從計算和通信領域看,大數據與人工智能技術在大規模工程化應用方麵取得了長足進步。然而,大數據處理的技術進步主要體現在:以軟硬件垂直優化和體係重構的極端化方式來適應數據規模、傳輸帶寬和處理速度的提升,研究人員對大數據固有的非確定性和複雜性尚沒有深刻認識;與此同時,人工智能技術也麵臨魯棒性、可解釋性和複雜係統認知瓶頸等挑戰。
梅宏進一步指出,當前數據智能存在低效、不通用以及不透明三大問題。“現在的數據智能就像工業革命前的‘蒸汽機原型’一樣,低效而昂貴;它隻能針對不同應用定製不同模型,難以建立通用模型。”梅宏說,更重要的是,當前並沒有對數據智能形成深刻認識,隻是知其然,而不知其所以然。
人機融合或可彌補數據自動推理弱點
zaizhongguokexueyuanzidonghuayanjiusuoyanjiuyuantaojianhuakanlai,suirandangqianrengongzhinengzaishujuzidongtuilizhongyiranmianlinhenduojishunandian,danshirenjironghedetuilifangshikeyiyouxiaodimibuzhexieruodian。renjironghetuilizhezhongyuyanjiuyizhongyourenhejiqixianghuxiezuoxiadexindetuilimoshi,baohan“機器懂人”和“人懂機器”兩方麵的含義。
對人的推理思維的理解是“機器懂人”的關鍵。其核心問題是如何構建能夠反映人推理過程的思維形式化計算方法。該方法將人的推理思維形式化描述、概率推理、構建知識圖譜,以及與現實場景的信息進行有機融合,從而可以將人的推理過程有效的輸入到機器中,並與機器的推理網絡進行結合。
此外,解決“人懂機器”問wen題ti將jiang有you助zhu於yu人ren對dui機ji器qi智zhi能neng輔fu助zhu增zeng強qiang。機ji器qi推tui理li過guo程cheng的de可ke解jie釋shi性xing,對dui於yu構gou建jian人ren機ji融rong合he的de推tui理li過guo程cheng尤you為wei關guan鍵jian。過guo程cheng可ke解jie釋shi的de機ji器qi推tui理li方fang法fa提ti供gong了le解jie決jue問wen題ti的de新xin方fang法fa,適shi當dang的de擴kuo展zhan流liu程cheng,並bing最zui大da限xian度du地di減jian少shao人ren為wei錯cuo誤wu的de機ji會hui,可ke以yi幫bang助zhu人ren類lei和he機ji器qi協xie同tong做zuo出chu更geng為wei準zhun確que和he迅xun速su的de推tui理li與yu判pan斷duan。
微軟亞洲研究院副院長劉鐵岩結合他們的實際工作舉例道:“我們在深度強化學習的基礎上,利用‘完美教練’技術來處理信息的不完全和不確定性,從而很好地解決了麻將這一複雜的博弈問題。我們的算法在2019年3月登陸知名的競技麻將平台,經過5000局的鏖戰,成功晉級十段,其穩定段位顯著超越人類頂級選手,成為首個超人麻將AI。”這是在處理數據不完全性和不確定性方麵做出的有益嚐試。
劉(liu)鐵(tie)岩(yan)指(zhi)出(chu),大(da)數(shu)據(ju)特(te)性(xing)在(zai)不(bu)斷(duan)演(yan)化(hua),且(qie)愈(yu)發(fa)複(fu)雜(za)。新(xin)型(xing)智(zhi)能(neng)算(suan)法(fa)需(xu)要(yao)針(zhen)對(dui)數(shu)據(ju)特(te)點(dian)有(you)的(de)放(fang)矢(shi)地(di)解(jie)決(jue)問(wen)題(ti),這(zhe)樣(yang)才(cai)能(neng)填(tian)補(bu)數(shu)據(ju)與(yu)算(suan)法(fa)間(jian)的(de)鴻(hong)溝(gou),使(shi)人(ren)工(gong)智(zhi)能(neng)綻(zhan)放(fang)更(geng)多(duo)的(de)價(jia)值(zhi)。(記者陸成寬)
讀完本報道讓我們了解到,人工智能的發展還存在很多尚未解決的問題,需要大數據的發展和支持,還有更深的領域值得我們去探索。北京分形科技也在人工智能領域積極的探索,並在人工智能公園、人工智能博物館等方麵積累了豐富的經驗,更多相關信息,歡迎您谘詢北京分形科技!
據科技日報報道,在香山科學會議第667次學術討論會上,與會專家指出,大數據的“紅利”效應正在逐漸減弱,人工智能技術的單點突破難以持續支撐行業發展,亟須在數據科學和計算智能方麵突破一些關鍵核心技術。
人們常常用海量性、多樣性、高速以及價值密度低來描述大數據的特點。但真實的大數據往往更加複雜,比如具有不完全性、不確定性、動態性、關聯性等特點。反觀經典的人工智能算法,它們對數據的假設往往過於簡單。比如,假設數據是靜態的,產生於獨立同分布的采樣過程;訓練數據是可靠的、數據所承載的信息是完全的等。
“shujudezhenshifuzaxinghesuanfadejiandanjiashezhijiancunzaizhejudahonggou,zheshidejingdianzhinengsuanfazaihenduofuzarenwushangbiaoxianqianjia,jidaijinyibudeyanjiuhetansuo。”會議執行主席之一、中國科學院院士梅宏強調,大數據是人工智能獲得成功的物質基礎,但目前主流的人工智能算法並未充分考慮大數據本身的複雜性。
從計算和通信領域看,大數據與人工智能技術在大規模工程化應用方麵取得了長足進步。然而,大數據處理的技術進步主要體現在:以軟硬件垂直優化和體係重構的極端化方式來適應數據規模、傳輸帶寬和處理速度的提升,研究人員對大數據固有的非確定性和複雜性尚沒有深刻認識;與此同時,人工智能技術也麵臨魯棒性、可解釋性和複雜係統認知瓶頸等挑戰。
梅宏進一步指出,當前數據智能存在低效、不通用以及不透明三大問題。“現在的數據智能就像工業革命前的‘蒸汽機原型’一樣,低效而昂貴;它隻能針對不同應用定製不同模型,難以建立通用模型。”梅宏說,更重要的是,當前並沒有對數據智能形成深刻認識,隻是知其然,而不知其所以然。
人機融合或可彌補數據自動推理弱點
zaizhongguokexueyuanzidonghuayanjiusuoyanjiuyuantaojianhuakanlai,suirandangqianrengongzhinengzaishujuzidongtuilizhongyiranmianlinhenduojishunandian,danshirenjironghedetuilifangshikeyiyouxiaodimibuzhexieruodian。renjironghetuilizhezhongyuyanjiuyizhongyourenhejiqixianghuxiezuoxiadexindetuilimoshi,baohan“機器懂人”和“人懂機器”兩方麵的含義。
對人的推理思維的理解是“機器懂人”的關鍵。其核心問題是如何構建能夠反映人推理過程的思維形式化計算方法。該方法將人的推理思維形式化描述、概率推理、構建知識圖譜,以及與現實場景的信息進行有機融合,從而可以將人的推理過程有效的輸入到機器中,並與機器的推理網絡進行結合。
此外,解決“人懂機器”問wen題ti將jiang有you助zhu於yu人ren對dui機ji器qi智zhi能neng輔fu助zhu增zeng強qiang。機ji器qi推tui理li過guo程cheng的de可ke解jie釋shi性xing,對dui於yu構gou建jian人ren機ji融rong合he的de推tui理li過guo程cheng尤you為wei關guan鍵jian。過guo程cheng可ke解jie釋shi的de機ji器qi推tui理li方fang法fa提ti供gong了le解jie決jue問wen題ti的de新xin方fang法fa,適shi當dang的de擴kuo展zhan流liu程cheng,並bing最zui大da限xian度du地di減jian少shao人ren為wei錯cuo誤wu的de機ji會hui,可ke以yi幫bang助zhu人ren類lei和he機ji器qi協xie同tong做zuo出chu更geng為wei準zhun確que和he迅xun速su的de推tui理li與yu判pan斷duan。
微軟亞洲研究院副院長劉鐵岩結合他們的實際工作舉例道:“我們在深度強化學習的基礎上,利用‘完美教練’技術來處理信息的不完全和不確定性,從而很好地解決了麻將這一複雜的博弈問題。我們的算法在2019年3月登陸知名的競技麻將平台,經過5000局的鏖戰,成功晉級十段,其穩定段位顯著超越人類頂級選手,成為首個超人麻將AI。”這是在處理數據不完全性和不確定性方麵做出的有益嚐試。
劉(liu)鐵(tie)岩(yan)指(zhi)出(chu),大(da)數(shu)據(ju)特(te)性(xing)在(zai)不(bu)斷(duan)演(yan)化(hua),且(qie)愈(yu)發(fa)複(fu)雜(za)。新(xin)型(xing)智(zhi)能(neng)算(suan)法(fa)需(xu)要(yao)針(zhen)對(dui)數(shu)據(ju)特(te)點(dian)有(you)的(de)放(fang)矢(shi)地(di)解(jie)決(jue)問(wen)題(ti),這(zhe)樣(yang)才(cai)能(neng)填(tian)補(bu)數(shu)據(ju)與(yu)算(suan)法(fa)間(jian)的(de)鴻(hong)溝(gou),使(shi)人(ren)工(gong)智(zhi)能(neng)綻(zhan)放(fang)更(geng)多(duo)的(de)價(jia)值(zhi)。(記者陸成寬)
讀完本報道讓我們了解到,人工智能的發展還存在很多尚未解決的問題,需要大數據的發展和支持,還有更深的領域值得我們去探索。北京分形科技也在人工智能領域積極的探索,並在人工智能公園、人工智能博物館等方麵積累了豐富的經驗,更多相關信息,歡迎您谘詢北京分形科技!












