绑定机构
扫描成功 请在APP上操作
打开万方数据APP,点击右上角"扫一扫",扫描二维码即可将您登录的个人账号与机构账号绑定,绑定后您可在APP上享有机构权限,如需更换机构账号,可到个人中心解绑。
欢迎的朋友
检索详情页
首页 > 成果首页 > 利用Web资源的自动分词及语料库自动构筑方法的研究
添加标签
×
已添加(0/5):

推荐标签:

利用Web资源的自动分词及语料库自动构筑方法的研究
成果信息
立项支持
  • 公布年份:
    2012
  • 中图分类:
    H164
  • 关键词:
  • 成果简介:
    提出了针对开放文本的汉语分词和电子词典构筑的辅助方法。采用多策略融合利用规则、归纳学习、歧义探测、概率模型等多种技术,使各种方法相互取长补短以达到适合开放文本分词处理的目的。首先通过规则进行处理,使文本在需要分割的明显标志位进行切分;然后通过归纳学习及深度归纳学习进行未知词的预测,并根据预测时的条件不同将预测到的未知词候补,按照其作为词的概率大小划分为不同的等级注册到词典,通过重复的、再归的预测过程,可以得到具有作为词的很高可能性的词候补;最后通过歧义探测处理对分词过程中出现的分词歧义进行检索、查找。当歧义出现时,采用Tri-gram模型计算概率进行消歧处理。整个分词过程是一个只需少量人工参与的有监督的学习过程,可用于电子化词典的构筑,大幅降低人工劳动,提高词典构筑的效率和精准程度。
相关论文(与本文研究主题相同或者相近的论文)
我的标签
您可以为文献添加知识标签,方便您在书案中进行分类、查找、关联
请输入添加的标签
公   告

北京万方数据股份有限公司在天猫、京东开具唯一官方授权的直营店铺:

1、天猫--万方数据教育专营店

2、京东--万方数据官方旗舰店

敬请广大用户关注、支持!查看详情

手机版

万方数据知识服务平台 扫码关注微信公众号

万方选题

学术圈
实名学术社交
订阅
收藏
快速查看收藏过的文献
客服
服务
回到
顶部