国产成人激情在线_人人干日日干_365porn_在线一区视频_国产高清在线观看_91插插插影院

靠這個(gè)“譜”讓機(jī)器會思考

時(shí)間:2018-01-22 13:55:24 來源: 科技日報(bào)


如果說波士頓動力的翻跟頭是在幫機(jī)器人鍛煉筋骨,那么知識圖譜的“繪制”則是在試圖“創(chuàng)造”一個(gè)能運(yùn)轉(zhuǎn)的機(jī)器人大腦。

“目前,還不能做到讓機(jī)器理解人的語言。”中國科學(xué)院軟件所研究員、中國中文信息學(xué)會副理事長孫樂說。無論是能逗你一樂的Siri,還是會做詩的小冰,亦或是會“懸絲診脈”的沃森,它們并不真正明白自己在做什么、為什么這么做。

讓機(jī)器學(xué)會思考,要靠“譜”。這個(gè)“譜”被稱為知識圖譜,意在將人類世界中產(chǎn)生的知識,構(gòu)建在機(jī)器世界中,進(jìn)而形成能夠支撐類腦推理的知識庫。

為了在國內(nèi)構(gòu)建一個(gè)關(guān)于知識圖譜的全新產(chǎn)學(xué)合作模式,知識圖譜研討會日前召開,來自高校院所的研究人員與產(chǎn)業(yè)團(tuán)隊(duì)共商打造全球化的知識圖譜體系,建立世界領(lǐng)先的人工智能基礎(chǔ)設(shè)施的開拓性工作。

技術(shù)原理:把文本轉(zhuǎn)化成知識

“對于‘姚明是上海人’這樣一個(gè)句子,存儲在機(jī)器里只是一串字符。而這串字符在人腦中卻是‘活’起來的。”孫樂舉例說。比如說到“姚明”,人會想到他是前美職籃球員、“小巨人”、中鋒等,而“上海”會讓人想到東方明珠、繁華都市等含義。但對于機(jī)器來說,僅僅說“姚明是上海人”,它不能和人類一樣明白其背后的含義。機(jī)器理解文本,首先就需要了解背景知識。

那如何將文本轉(zhuǎn)化成知識呢?

“借助信息抽取技術(shù),人們可以從文本中抽取知識,這也正是知識圖譜構(gòu)建的核心技術(shù)。”孫樂說,目前比較流行的是使用“三元組”的存儲方式。三元組由兩個(gè)點(diǎn)、一條邊構(gòu)成,點(diǎn)代表實(shí)體或者概念,邊代表實(shí)體與概念之間的各種語義關(guān)系。一個(gè)點(diǎn)可以延伸出多個(gè)邊,構(gòu)成很多關(guān)系。例如姚明這個(gè)點(diǎn),可以和上海構(gòu)成出生地的關(guān)系,可以和美職籃構(gòu)成效力關(guān)系,還可以和2.26米構(gòu)成身高關(guān)系。

“如果這些關(guān)系足夠完善,機(jī)器就具備了理解語言的基礎(chǔ)。”孫樂說。那么如何讓機(jī)器擁有這樣的“理解力”呢?

“上世紀(jì)六十年代,人工智能先驅(qū)麻省理工學(xué)院的馬文·明斯基在一個(gè)問答系統(tǒng)項(xiàng)目SIR中,使用了實(shí)體間語義關(guān)系來表示問句和答案的語義,劍橋語言研究部門的瑪格麗特·瑪斯特曼在1961年使用Semantic Network來建模世界知識,這些都可被看作是知識圖譜的前身。”孫樂說。

隨后的Wordnet、中國的知網(wǎng)(Hownet)也進(jìn)行了人工構(gòu)建知識庫的工作。

“這里包括主觀知識,比如社交網(wǎng)站上人們對某個(gè)產(chǎn)品的態(tài)度是喜歡還是不喜歡;場景知識,比如在某個(gè)特定場景中應(yīng)該怎么做;語言知識,例如各種語言語法;常識知識,例如水、貓、狗,教人認(rèn)的時(shí)候可以直接指著教,卻很難讓計(jì)算機(jī)明白。”孫樂解釋,從這些初步的分類中就能感受到知識的海量,更別說那些高層次的科學(xué)知識了。

構(gòu)建方式:從手工勞動到自動抽取

“2010年之后,維基百科開始嘗試‘眾包’的方式,每個(gè)人都能夠貢獻(xiàn)知識。”孫樂說,這讓知識圖譜的積累速度大大增加,后續(xù)百度百科、互動百科等也采取了類似的知識搜集方式,發(fā)動公眾使得“積沙”這個(gè)環(huán)節(jié)的時(shí)間大大縮短、效率大大增加,無數(shù)的知識從四面八方趕來,迅速集聚,只待“成塔”。

面對如此大量的數(shù)據(jù),或者說“文本”,知識圖譜的構(gòu)建工作自然不能再手工勞動,“讓機(jī)器自動抽取結(jié)構(gòu)化的知識,自動生成‘三元組’。”孫樂說,學(xué)術(shù)界和產(chǎn)業(yè)界開發(fā)出了不同的構(gòu)架、體系,能夠自動或半自動地從文本中生成機(jī)器可識別的知識。

孫樂的演示課件中,有一張生動的圖畫,一大摞文件紙吃進(jìn)去,電腦馬上轉(zhuǎn)化為“知識”,但事實(shí)遠(yuǎn)沒有那么簡單。自動抽取結(jié)構(gòu)化數(shù)據(jù)在不同行業(yè)還沒有統(tǒng)一的方案。在“百度知識圖譜”的介紹中這樣寫道:對提交至知識圖譜的數(shù)據(jù)轉(zhuǎn)換為遵循Schema的實(shí)體對象,并進(jìn)行統(tǒng)一的數(shù)據(jù)清洗、對齊、融合、關(guān)聯(lián)等知識計(jì)算,完成圖譜的構(gòu)建。“但是大家發(fā)現(xiàn),基于維基百科,結(jié)構(gòu)化半結(jié)構(gòu)化數(shù)據(jù)挖掘出來的知識圖譜還是不夠,因此目前所有的工作都集中在研究如何從海量文本中抽取知識。”孫樂說,例如谷歌的Knowledge Vault,以及美國國家標(biāo)準(zhǔn)與技術(shù)研究院主辦的TAC-KBP評測,也都在推進(jìn)從文本中抽取知識的技術(shù)。

在權(quán)威的“知識庫自動構(gòu)建國際評測”中,從文本中抽取知識被分解為實(shí)體發(fā)現(xiàn)、關(guān)系抽取、事件抽取、情感抽取等4部分。在美國NIST組織的TAC-KBP中文評測中,中科院軟件所—搜狗聯(lián)合團(tuán)隊(duì)獲得綜合性能指標(biāo)第3名,事件抽取單項(xiàng)指標(biāo)第1名的好成績。

“我國在這一領(lǐng)域可以和國際水平比肩。”孫樂介紹,中科院軟件所提出了基于Co-Bootstrapping的實(shí)體獲取算法,基于多源知識監(jiān)督的關(guān)系抽取算法等,大幅度降低了文本知識抽取工具構(gòu)建模型的成本,并提升了性能。

終極目標(biāo):將人類知識全部結(jié)構(gòu)化

《圣經(jīng)·舊約》記載,人類聯(lián)合起來興建希望能通往天堂的高塔——“巴別塔”,而今,創(chuàng)造AI的人類正在建造這樣一座“巴別塔”,幫助人工智能企及人類智能。

自動的做法讓知識量開始形成規(guī)模,達(dá)到了能夠支持實(shí)際應(yīng)用的量級。“但是這種轉(zhuǎn)化,還遠(yuǎn)遠(yuǎn)未達(dá)到人類的知識水平。”孫樂說,何況人類的知識一直在增加、更新,一直在動態(tài)變化,理解也應(yīng)該與時(shí)俱進(jìn)地體現(xiàn)在機(jī)器“腦”中。

“因此知識圖譜不會是一個(gè)靜止的狀態(tài),而是要形成一個(gè)循環(huán),這也是美國卡耐基梅隆大學(xué)等地方提出來的Never Ending Learning(學(xué)無止境)的概念。”孫樂說。

資料顯示,目前谷歌知識圖譜中記載了超過35億事實(shí);Freebase中記載了4000多萬實(shí)體,上萬個(gè)屬性關(guān)系,24億多個(gè)事實(shí);百度百科記錄詞條數(shù)1000萬個(gè),百度搜索中應(yīng)用了聯(lián)想搜索功能。

“在醫(yī)學(xué)領(lǐng)域、人物關(guān)系等特定領(lǐng)域,也有專門的知識圖譜。”孫樂介紹,Kinships描述人物之間的親屬關(guān)系,104個(gè)實(shí)體,26種關(guān)系,10800個(gè)事實(shí);UMLS在醫(yī)學(xué)領(lǐng)域描述了醫(yī)學(xué)概念之間的聯(lián)系,135個(gè)實(shí)體,49種關(guān)系,6800個(gè)事實(shí)。

“這是一幅充滿美好前景的宏偉藍(lán)圖。”孫樂說,知識圖譜的最終目標(biāo)是將人類的知識全部形式化、結(jié)構(gòu)化,并用于構(gòu)建基于知識的自然語言理解系統(tǒng)。

盡管令業(yè)內(nèi)滿意的“真正理解語言的系統(tǒng)”還遠(yuǎn)未出現(xiàn),目前的“巴別塔”還只是在基礎(chǔ)層面,但相關(guān)的應(yīng)用已經(jīng)顯示出廣闊的前景。例如,在百度百科輸入“冷凍電鏡”,右豎條的關(guān)聯(lián)將出現(xiàn)“施一公”,輸入“撒幣”,將直接在搜索項(xiàng)中出現(xiàn)“王思聰”等相關(guān)項(xiàng)。其中蘊(yùn)含著機(jī)器對人類意圖的理解。

“知識圖譜的應(yīng)用涉及到眾多行業(yè),尤其是知識密集型行業(yè),目前關(guān)注度比較高的領(lǐng)域:醫(yī)療、金融、法律、電商、智能家電等。”孫樂介紹,基于信息、知識和智能形成的閉環(huán),從信息中獲取知識,基于知識開發(fā)智能應(yīng)用,智能應(yīng)用產(chǎn)生新的信息,從新的信息中再獲取新的知識,不斷迭代,就可以不斷產(chǎn)生更加豐富的知識圖譜,更加智能的應(yīng)用。

關(guān)鍵詞: 機(jī)器

網(wǎng)站簡介 網(wǎng)站團(tuán)隊(duì) 本網(wǎng)動態(tài) 友情鏈接 版權(quán)聲明 我要投稿

Copyright? 2014-2020 中原網(wǎng)視臺(www.b4dc4.cn) All rights reserved.

主站蜘蛛池模板: 狠狠综合久久av一区二区 | 亚洲一区二区三区精品视频 | 青青青青久久久久国产的 | 欧美国产日韩1区俺去了 | 亚洲精品久久久久网站 | 日韩欧美一级 | 黑巨茎大战俄罗斯美女 | 偷拍与自拍 | 一区二区三区在线 | 欧洲 | 麻豆精品久久久久久中文字幕无码 | 亚洲一区无码中文字幕乱码 | 欧美日韩国产高清一区二区三区 | 国产真实伦视频在线视频 | a级影视| 国产av一区二区三区日韩 | 四虎影视在线影院在线观看观看 | 九九精品视频在线免费观看 | 亚洲精品午夜无码电影网 | 女人一级特纯黄大片色 | 国产福利视频深夜福利 | 毛片免费全部免费播放 | 国产精品久久久久久久y | 成人综合久久精品色婷婷 | 乱妇乱女熟妇熟女网站 | 欧美毛片激情免费视频 | 无码专区一ⅴa亚洲v天堂 | 亚洲第一男人天堂 | 国产一级理论免费版 | 亚洲 欧美 日韩 综合 | 午夜视频在线观看免费高清 | 男ji大巴进入女人的视频 | 亚洲久久视频 | 国产成人欧美视频在线 | 深夜福利小视频在线观看 | 国产激情网 | 一级黄电影 | 先锋影音资源男人 | 天堂在线国产 | 久9视频这里只有精品 | 久久只有这里有精品 | 狼友av永久网站免费观看孕交 |