您当前的位置: 核心期刊论文发表咨询网电子论文》一种面向短文本分类的施事受事关系抽取方法

一种面向短文本分类的施事受事关系抽取方法

来源:核心期刊论文发表咨询网 所属分类:电子论文 点击:次 时间:2013-03-19 10:05

0 引言

短文本分类就是对长度短的文本(通常文本长度小于160个字符)进行自动分类,它是手机短信息过滤等现实任务的基础。短文本具有文本长度短,描述概念信号弱的特点,因此,短文本分类是一项具有挑战性的任务。

短文本分类的一种可行途径是利用一些额外的信息来辅助分类,以弥补短文本天生的固有缺陷。王细微等[1]提出一种基于关联规则挖掘算法的短文本分类方法,王盛等[2]利用上下位关系辅助短文本分类也取得了一定的效果。因此,发现并提取新的有助于短文本分类的语义关系是值得研究的课题。

利用词语间的施事、受事关系扩充短文本,也是一种有效的文本扩展方式。

例如:“我对上周网购的mp3很满意。”假设该文本特征向量为(上周,满意),文本中“mp3”“网购”,虽然作为句子的重要成分,并具有较强的类别描述能力,但因为出现率低而不在特征空间中,但事件“网购”通常必然存在施事者“消费者”和受事者“商品”,“消费者”和“商品”较容易存在于特征空间列表中,将其扩展后的特征向量为(消费者,上周,商品,满意),相比未扩展前,扩展后的特征向量类别描述力有较大的提高。1、 面向短文本抽取施事受事关系的方法及应用

定义:施事关系,即某个事件的实施者和该事件之间的关系,例如:消费者和购买、医生和医治;受事关系,即某个事件的承受者与该事件的关系,例如:商品和购买、病人和医治等。施事、受事关系反映的是一种实体类与事件类的语义联系[3]。

要自动获取短文本中施事、受事关系词对并将其应用于文本分类,必须解决以下3个问题:(1)如何确定文本中的词语之间具有施事、受事关系;(2)如何获得一个有助于短文本分类的施事、受事关系词对集合;(3)施事、受事关系如何有效应用于短文本分类。

针对以上问题,本文提出一种利用《知网》抽取短文本中的施事、受事关系抽取模型(如图1),具体步骤为:(1) 选择一个合适的窗口来抽取真实文本中的动词、名词并形成动名词对集合。(2) 利用《知网》过滤掉知网中未定义的词对,提取词对在知网中的概念,从而实现了从自由文本数据到结构化数据的转化,形成备选概念对集合。(3) 利用《知网》提供的信息和本文提出的方法,确定备选概念对集合中的概念对是否具有施事、受事关系并计算施事、受事关系强度值。(4) 根据实际的需要,过滤掉关系强度不符合要求的词对形成最终的施事、受事关系词对集合。&nbs

转载请注明来自:http://www.lunwencheng.com/lunwen/dzi/235.html

各行业核心期刊快速入口

医学类核心期刊汇总
口腔核心期刊
卫生核心期刊
药学核心期刊
眼科核心期刊
儿科核心期刊
医学核心期刊
兽医核心期刊
外科核心期刊
护理核心期刊
临床核心期刊
教育类核心期刊汇总
小学教育核心期刊
中学教育核心期刊
高等教育核心期刊
职业教育核心期刊
成人教育核心期刊
人文教育核心期刊
科学教育核心期刊
教育核心期刊
教学核心期刊
教育管理核心期刊
学科类核心期刊汇总
语文核心期刊
数学核心期刊
外语核心期刊
化学核心期刊
物理核心期刊
历史核心期刊
政治核心期刊
体育核心期刊
艺术核心期刊
法律核心期刊
经济类核心期刊汇总
市场经济核心期刊
经济核心期刊
金融核心期刊
财经核心期刊
审计核心期刊
旅游核心期刊
统计核心期刊
会计核心期刊
农业类核心期刊汇总
畜牧核心期刊
农业核心期刊
林业核心期刊
工业类核心期刊汇总
机械核心期刊
冶金核心期刊
电力核心期刊
铁路核心期刊
电气核心期刊
工业核心期刊
石油核心期刊
环境类核心期刊汇总
电力核心期刊
水利核心期刊
能源核心期刊
地质核心期刊
化工核心期刊
环境核心期刊
气象核心期刊
地理核心期刊
建筑类核心期刊汇总
测绘核心期刊
测量核心期刊
建筑核心期刊
交通类核心期刊汇总
铁路核心期刊
公路核心期刊
交通核心期刊
运输核心期刊
汽车核心期刊
轨道核心期刊
科技类核心期刊汇总
电子核心期刊
科技核心期刊
计算机核心期刊
其他类核心期刊汇总
管理核心期刊
档案核心期刊
心理核心期刊
政法核心期刊
文学核心期刊