绑定机构
扫描成功 请在APP上操作
打开万方数据APP,点击右上角"扫一扫",扫描二维码即可将您登录的个人账号与机构账号绑定,绑定后您可在APP上享有机构权限,如需更换机构账号,可到个人中心解绑。
欢迎的朋友
检索详情页
首页 > 成果首页 > 哈萨克语词法和短语处理技术研究及应用开发
添加标签
×
已添加(0/5):

推荐标签:

哈萨克语词法和短语处理技术研究及应用开发
立项支持
  • 公布年份:
    2015
  • 中图分类:
    H236
  • 关键词:
  • 成果简介:
    该研究是国家自然科学基金的“现代哈萨克语短语识别及其语块库构建技术研究”和“现代哈萨克语词级文本语料库构建技术研究”及国家教育部的“基于语料库的哈萨克语词语标注规范研究”项目支持的应用技术研究项目。哈萨克语属于阿尔泰语系突厥语族的克普恰克语,而且是跨境语言。世界上的哈萨克族使用同一种口语,但使用不同的书写文字,如:在中国的哈萨克族借用了阿拉伯语和部分波斯语字母的哈萨克文,哈萨克斯坦的哈萨克族使用斯拉夫字母的哈萨克文,其它国家的哈文用拉丁字母,相互之间文字无法直接交流。自然语言信息处理分为词法分析、句法分析、语义分析3个层次,该项目组经过多年的研究,完成了哈萨克语词法分析研究的全部内容,已进入了句法分析研究阶段,哈萨克语不论是词法还是句法层次都有自己独特的语法特点,完全不同于英语、汉语等。“哈萨克语词法和短语处理技术研究及应用开发”项目根据哈萨克语的独特语言特点,使用基于规则和统计的信息处理技术,结合语言和概率图模型方法,研究内容为研究哈萨克语文本语料库构建技术,构建了哈萨克语文本语料库;研究哈萨克语词构形附加成分的切分和还原技术,实现了词干提取;研究哈萨克语的词性标注技术,实现了基本词和兼类词的词级标注;研究哈萨克语短语自动识别的关键技术,实现了基本短语的识别研究;研究了哈萨克语浅层句法分析算法,构建了哈萨克语短语库;研究基于语料库的哈文词信息分析与统计技术,发布了哈萨克语语言生活绿皮书;哈萨克文老文字和斯拉夫文间智能转换技术。项目创新性为,在语料库方面:首次研究了哈语文本语料库构建技术,制定了语料库标注规范,构建文本资源库,发布了基于语料库的语言统计信息,提供了哈萨克语信息处理的平台。在词法方面:首次研究了哈萨克语词性标注技术,确定了词性标记集,且首次提出了哈语构形附加成分的切分和还原技术,研制了词性标注、词干提取等软件,实现了词法分析。在短语方面:首次研究了哈萨克语短语自动识别技术,实现了基本短语的识别与语块提取,奠定了句法分析的基础。该项目开展了哈语的词法和短语分析技术研究,构建了资源库,实现了词法和短语信息处理的技术研究,制定了规范内容,培养了若干国内外人才,新疆大学已有18名硕士研究生直接以该项目为硕士学位论文内容答辩毕业,发表了学术论文35篇和哈语语言生活绿皮书2篇,研制了系统软件,其中计算机软件登记著作权5部,开展了国际合作研究,建立了哈萨克语信息处理的完整平台。该项目对哈语知识获取、句法分析、汉哈等机器翻译、大规模语料库加工等自然语言处理的诸多领域提供可靠的数据,推动信息领域应用产品的开发和升级。为哈文进一步句法分析等研究打下坚实基础,为哈语信息处理提供处理能力和平台,促进哈族文化发展,同时研制的规范和应用软件应用于哈语的信息处理各个领域。该项目经自治区科技厅科研鉴定通过,评价项目整体水平到达国际先进水平。
相关论文(与本文研究主题相同或者相近的论文)
我的标签
您可以为文献添加知识标签,方便您在书案中进行分类、查找、关联
请输入添加的标签
公   告

北京万方数据股份有限公司在天猫、京东开具唯一官方授权的直营店铺:

1、天猫--万方数据教育专营店

2、京东--万方数据官方旗舰店

敬请广大用户关注、支持!查看详情

手机版

万方数据知识服务平台 扫码关注微信公众号

万方选题

学术圈
实名学术社交
订阅
收藏
快速查看收藏过的文献
客服
服务
回到
顶部