色噜噜人体337p人体 I 超碰97观看 I 91久久香蕉国产日韩欧美9色 I 色婷婷我要去我去也 I 日本午夜a I 国产av高清怡春院 I 桃色精品 I 91香蕉国产 I 另类小说第一页 I 日操夜夜操 I 久久性色 I 日韩欧在线 I 国产深夜在线观看 I 免费的av I 18在线观看视频 I 他也色在线视频 I 亚洲熟女中文字幕男人总站 I 亚洲国产综合精品中文第一 I 人妻丰满熟av无码区hd I 新黄色网址 I 国产精品真实灌醉女在线播放 I 欧美巨大荫蒂茸毛毛人妖 I 国产一区欧美 I 欧洲亚洲1卡二卡三卡2021 I 国产亚洲欧美在线观看三区 I 97精品无人区乱码在线观看 I 欧美妇人 I 96精品在线视频 I 国产人免费视频在线观看 I 91麻豆国产福利在线观看

基于知網(wǎng)義原信息量的詞語相似度的計(jì)算方法

時(shí)間:2021-08-21 14:01:10 詞語 我要投稿

基于知網(wǎng)義原信息量的詞語相似度的計(jì)算方法

  基于知網(wǎng)義原信息量的詞語相似度的計(jì)算方法

  摘要:國內(nèi)利用知網(wǎng)計(jì)算中文詞語相似度通常采用基于義原距離的方法,這些方法依賴于公式設(shè)計(jì)和參數(shù)選取。根據(jù)信息論中計(jì)算兩個(gè)事物相似度的思想,利用知網(wǎng)的分類體系來計(jì)算詞語所包含的義原信息量,將義原及其角色關(guān)系的信息量作為詞語相似度計(jì)算的基本單位,通過計(jì)算兩個(gè)詞語的共有義原及其角色關(guān)系的信息量和所有義原及其角色關(guān)系的信息量的比值來綜合計(jì)算詞語的相似度。實(shí)驗(yàn)結(jié)果證明,該方法合理可行。

基于知網(wǎng)義原信息量的詞語相似度的計(jì)算方法

  關(guān)鍵詞:義原信息量;角色關(guān)系;詞語相似度;信息處理

  中圖分類號:TP391

  作者簡介作者簡介:李國佳(1986-),男,山西大同人,碩士,華北水利水電大學(xué)軟件學(xué)院助教,研究方向?yàn)樽匀徽Z言處理;楊喜亮(1981-),男,河南鄭州人,碩士,華北水利水電大學(xué)現(xiàn)代教育技術(shù)中心助教,研究方向?yàn)橹悄苄畔⑻幚怼?/p>

  0 引言

  本文從整體性角度出發(fā),給出一種基于義原信息量計(jì)算中文詞語相似度的方法;谥W(wǎng)的分類體系(Taxonomy),將義原及其角色關(guān)系整體作為詞語相似度計(jì)算的基本單位,保留了描述詞語概念的各個(gè)義原間的關(guān)系,并依據(jù)信息論中計(jì)算兩個(gè)事物相似度的思想[4],用兩個(gè)詞語共有義原及其角色關(guān)系的信息量和所有義原及其角色關(guān)系的信息量來綜合計(jì)算詞語的相似度。

  1 知網(wǎng)義原信息量

  1.1 義原信息量

  其中,P(A)表示義原A在某個(gè)語料庫樣本空間中出現(xiàn)的概率。計(jì)算語料庫樣本空間中某個(gè)義原出現(xiàn)的概率很困難。知網(wǎng)作為一個(gè)以各類概念及關(guān)系為描述對象的知識系統(tǒng),其分類體系本身可以看作是各個(gè)義原出現(xiàn)的一個(gè)樣本空間,那么僅依賴知網(wǎng)分類體系本身而不需其它語料庫,作為計(jì)算義原出現(xiàn)概率的樣本空間也是合理的。本文給出一種根據(jù)知網(wǎng)的分類體系來計(jì)算義原信息量的方法。

  由義原組成的知網(wǎng)分類體系是一棵概念分類樹,在每類義原樹狀層次結(jié)構(gòu)(以下簡稱為義原樹)中,根結(jié)點(diǎn)義原是分類類別,是最大的分類,其它義原都是根結(jié)點(diǎn)義原的子孫?梢哉J(rèn)為,分支結(jié)點(diǎn)義原包含越多的子孫結(jié)點(diǎn),其信息量越小。葉子結(jié)點(diǎn)是最小的分類,所有葉子結(jié)點(diǎn)的信息量是相同的。

  在知網(wǎng)的知識詞典中,每個(gè)詞語由DEF來描述其概念。將DEF分為兩部分:主類義原和特性描述部分。

  定義1:義原及其角色關(guān)系。

  在詞語概念DEF的特性描述部分中,將義原及動(dòng)態(tài)角色與特征(Event Role and Features)[9]的層次結(jié)構(gòu)的組合稱為義原及其角色關(guān)系。

  定義2:主類義原。

  在詞語概念DEF中,把描述詞語概念最左邊的第一個(gè)義原稱為主類義原,也稱為第0層義原及其角色關(guān)系。

  例如詞語“病菌”的一個(gè)概念:DEF={bacteria|微生物:domain={medical|醫(yī)},modifier={able|能:scope={ResultIn|導(dǎo)致:result={disease|疾病}}}}。在“病菌”的`DEF中,將“bacteria|微生物”稱為主類義原,其它部分是特性描述部分。在特性描述部分中,將“domain={medical|醫(yī)}”、“modifier={able|能 }”稱為DEF的第一層義原及其角色關(guān)系,其中包含兩個(gè)本層義原“medical|醫(yī)”和“medical|醫(yī)”;把“scope={ResultIn|導(dǎo)致}”稱為第二層義原及其角色關(guān)系,包含一個(gè)本層義原“ResultIn|導(dǎo)致”,將“result={disease|疾病}”稱為第三層的義原及其角色關(guān)系,包含一個(gè)本層義原“disease|疾病”,依次類推。

  其中,I(pj)表示r所包含的第j個(gè)義原pj的信息量。

  例如在詞語“病菌”的DEF中,每層的義原及其角色關(guān)系中包含的本層義原信息量均為3.346,根據(jù)式(4)可得“病菌”的義原及其角色關(guān)系的總信息量為7.946。

  1.3 共有義原及其角色關(guān)系的信息量

  2 實(shí)驗(yàn)結(jié)果及分析

  綜合來看,本文方法的結(jié)果整體表現(xiàn)更加合理,能夠反映出詞語間語義的相似性和差異,與人的判斷結(jié)果比較一致,計(jì)算也簡單。

  3 結(jié)語

  基于知網(wǎng)義原信息量計(jì)算中文詞語相似度的方法根據(jù)信息論中計(jì)算兩個(gè)事物相似度的思想,利用知網(wǎng)的分類體系來計(jì)算義原信息量,并根據(jù)知網(wǎng)這一關(guān)系系統(tǒng)的特性,從保留義原間關(guān)系的角度出發(fā),將義原及其角色關(guān)系作為計(jì)算概念相似度的基本單位,更能全面反映詞語語義的相似性和差異。基于知網(wǎng)通過義原及其角色關(guān)系的信息量來綜合計(jì)算詞語的相似度,計(jì)算量較少,計(jì)算結(jié)果合理可行。在詞語相似度計(jì)算基礎(chǔ)上,進(jìn)一步研究句子間相似度計(jì)算方法,則有待下一步研究。

  參考文獻(xiàn):

  [2] 劉群,李素建.基于《知網(wǎng)》的詞匯語義相似度的計(jì)算[C]. 臺北:第三屆漢語詞匯語義學(xué)研討會(huì),2002,7(2):5976.

  [3] 董振東,董強(qiáng),郝長伶.《知網(wǎng)》的理論發(fā)現(xiàn)[J].中文信息學(xué)報(bào),2007,21(4):39.

  [6] 夏天.漢語詞語語義相似度計(jì)算研究[J].計(jì)算機(jī)工程,2007, 33(6):191194.

  [8] 王小林,王義.改進(jìn)的基于知網(wǎng)的詞語相似度算法[J].計(jì)算機(jī)應(yīng)用,2011,31(11):7590.

主站蜘蛛池模板: 亚洲国产综合精品中文第一 | 久久视频在线播放 | 国产又粗又猛又爽视频上高潮69 | 人妻少妇无码专视频在线 | 国产香蕉97碰碰碰视频在线观看 | 99国产精品免费 | 欧美日韩在大午夜爽爽影院 | 亚洲综合资源 | 97国产色呦呦呦夜嗨嗨 | 中文字幕一区在线观看 | 麻豆精品一区二区三区在线 | 午夜男女爽爽影院免费视频下载 | 在线能看的av| 妺妺窝人体色www在线小说 | 首页 亚洲 欧美 制服 丝腿 | 又硬又爽又长又粗又大毛片 | 免费看的av片 | 亚洲国产不卡视频 | 亚洲精品天堂成人片av在线播放 | 久久久久一级 | 国产三级欧美 | 91chinese一区二区三区 | 成人a视频片观看免费 | 日韩免费码中文在线观看 | 丰满岳乱妇久久久 | 亚洲九九| 天天澡天天添天天摸97影院 | 日本精品毛片一区视频播 | 黄色一级国产 | 亚洲欧美成aⅴ人在线观看 日韩中文字幕视频在线 | 真人真事免费毛片 | 海角社区在线视频播放观看 | 色六月丁香 | 极品人妻少妇一区二区三区 | 富婆饥渴难耐69xxxx | 国产精品高潮呻吟av久久小说 | 人妻体体内射精一区二区 | 精品国产精品三级精品av网址 | 91超碰九色 | 日韩在线不卡av | 香蕉免费在线视频 | 精品日产一卡2卡三卡4卡在线 | 亚洲va欧美va| 国产精品无码专区在线观看不卡 | 无人区码一码二码三码区别新月 | 欧美自拍视频在线 | 女人扒下裤让男人桶到爽 | 亚洲 欧美 日产 综合 在线 | 日韩视频免费大全中文字幕 | 国产清纯白嫩初高中在线观看性色 | 女人被狂爆到高潮免费视频 | 在线中文新版最新版在线 | 久久69精品| 亚洲第一成人网站 | av免费看网站 | youj| 亚洲天堂男人av | 爱爱视频观看 | 欧美日韩午夜 | 免费黄色网页 | 亚洲精品乱码久久久久久蜜桃不爽 | 日亚韩在线无码一区二区三区 | 97色伦综合在线欧美视频 | 综合久久综合久久88色鬼 | 亚洲无人区一卡2卡三卡 | 亚洲精品久久午夜麻豆 | 久久国产综合精品swag蓝导航 | 在线观看瑟瑟 | 成人精品在线观看视频 | 国产精品爽黄69天堂a | 四虎精品免费永久免费视频 | 日韩在线区 | 中文字幕在线不卡精品视频99 | av天堂中av世界中文在线播放 | 国内揄拍国内精品少妇 | 麻豆国产成人av在线播放欲色 | 国产一级淫片s片sss毛片s级 | 免费人成在线观看网站播放 | 欧美3p两根一起进高清免费视频 | 国产欧美日韩中文久久 | 日本一卡2卡3卡四卡精品网站 | 亚洲综合在线色 | 中文字幕一区二区三区免费 | 国产精品久久久久久久久久新婚 | 一夲道av无码无卡免费 | 国产极品jizzhd欧美 | 永久免费精品精品永久-夜色 | 99久久婷婷国产综合精品电影 | 男女无遮挡免费视频 | 天天做天天爱天天操 | 中文字幕在线不卡视频 | 色月婷婷 | www.快色.com | 中文无码伦av中文字幕 | 久久久久久久久伊人 | 欧美精品综合 | 一级黄色性生活视频 | 国产嫩草视频在线观看 | 丰满人妻av无码一区二区三区 |