绑定机构
扫描成功 请在APP上操作
打开万方数据APP,点击右上角"扫一扫",扫描二维码即可将您登录的个人账号与机构账号绑定,绑定后您可在APP上享有机构权限,如需更换机构账号,可到个人中心解绑。
欢迎的朋友
检索详情页
首页 > 成果首页 > 受限域汉语问答系统普适性理论与方法研究
添加标签
×
已添加(0/5):

推荐标签:

受限域汉语问答系统普适性理论与方法研究
成果信息
立项支持
  • 公布年份:
    2015
  • 中图分类:
    H193
  • 关键词:
  • 成果简介:
    基于国家基金和云南省基金重点项目,针对受限域汉语问答系统不同领域普适性问题,研究从非结构领域文本中自动获取知识单元及知识关系,解决不同领域问答对领域知识的需求问题;研究特定领域问句分类模型的领域迁移方法,解决问句分类在新领域的适应性问题;研究基于学习排序的答案提取方法,构建适应于不同领域的答案提取模型;从而保证在问答过程的知识构建、问句分析及答案提取方面实现领域的自动适应。项目在领域实体及实体关系抽取、问句分类模型的领域迁移及答案学习排序等方面取得了多项创新性成果,主要科学发现及其价值如下:1.领域知识自动构建方面,综合考虑上下文词、词性、句法等信息,提出了融合长距离依赖特征的Markov逻辑网中文命名实体识别方法,提出了基于最大熵的领域实体关系的抽取方法,自动获取领域的实体及实体关系,为实现从非结构化领域文本中获取与组织领域知识提供理论与技术保障;2.问句分类模型领域迁移方面,提出了半监督协同学习的中文问句分类方法,构建不同分类器协同标记无标记样本,协同学习提高问句分类的准确率,从而达到无标记样本的有效利用;提出了基于特征映射的问句分类迁移学习方法,借助特征相似性,将源领域问句实例映射到目标领域类别中,构建目标领域问句分类模型,为实现问句分类模型的领域移植提供理论与技术的支撑;3.答案提取学习排序方面,提出了基于多特征融合的领域实体类答案学习排序方法,融合问句与候选文档相似度及查询词分布密度等特征,构建领域事实类实体答案排序模型提取答案;提出了融合语篇结构特征的非事实类答案学习排序方法,依据篇章结构及修辞结构关系提取篇章结构特征,构建非事实类答案提取模型提取答案;为不同领域问答系统提供通用的答案提取学习排序理论与方法;4.研制了旅游实体识别、实体关系识别、答案检索等系统,有很好的应用价值,获国家发明专利1项,登记软件著作权13项。 项目共发表论文62篇,其中被SCI收录3篇、EI收录41篇,论文被《Pattern Recognition Letter》等国内外高水平期刊引用,得到了同行的关注和认可,被SCI他引6次、CSCD他引10次、CCD他引69次、Google Scholar他引97次,累计他引183次;参加2010年国际最高水平文本检索TREC竞赛,在Entity List Completion Task获第1名,在Related Entity Finding Task获第3名;参加2013年CIPS_SIGHAN实体消歧评测获第3名;参加2014中文倾向性分析评测获第3名。 项目取得的成果为构建普适于不同领域的问答系统奠定了理论与技术基础,成果评定委员会认为,成果原创性强,总体上达到国际先进,国内领先水平。
相关论文(与本文研究主题相同或者相近的论文)
我的标签
您可以为文献添加知识标签,方便您在书案中进行分类、查找、关联
请输入添加的标签
公   告

北京万方数据股份有限公司在天猫、京东开具唯一官方授权的直营店铺:

1、天猫--万方数据教育专营店

2、京东--万方数据官方旗舰店

敬请广大用户关注、支持!查看详情

手机版

万方数据知识服务平台 扫码关注微信公众号

万方选题

学术圈
实名学术社交
订阅
收藏
快速查看收藏过的文献
客服
服务
回到
顶部