|
摘要
在语义相似度计算中,以往的研究侧重于从正向计算语义的相似性,即通过概念间的路径长度、包含的信息量以及特征等计算概念之间的相关性,从而得到更高的相似性计算结果,而这些结果往往与人类判断的结果偏差较大.然而,在语义相似度的计算过程越来越趋近于模拟人类思考过程的趋势下,考虑语义之间的相异性就变得十分重要.鉴于此,本研究从反向考虑提出了一种将语义之间的相异性加入到语义相似度计算的方法.该方法通过WordNet语料库特有的层次结构深度挖掘概念之间的反义关系,然后用4种不同的策略分别将反义关系代表的相异性以反义因子的形式与已有的方法相结合,通过复现已有方法并将其与反义因子结合进行实验得到最终的语义相似度结果.针对提出的基于相异性的语义相似度计算模型,进一步对模型的参数和相关系数进行了分析和讨论.实验结果表明提出的模型相较于其他方法与人类判断结果具有更高的相关系数,并且该模型可以很好地提升已有的基于路径距离的语义相似度计算方法的准确性.
|
|
关键词:
|
出版日期: 2022-04-15
发布日期: 2022-07-15
整期出版日期: 2022-04-15
|
作者简介: 关慧(1976-),女,辽宁沈阳人,副教授,博士,主要从事软件演化、软件安全性以及语义处理等的研究. |
No Suggested Reading articles found! |
|
|
Viewed |
|
|
|
Full text
|
|
|
|
|
Abstract
|
|
|
|
|
Cited |
|
|
|
|
|
Shared |
|
|
|
|
|
Discussed |
|
|
|
|