绑定机构
扫描成功 请在APP上操作
打开万方数据APP,点击右上角"扫一扫",扫描二维码即可将您登录的个人账号与机构账号绑定,绑定后您可在APP上享有机构权限,如需更换机构账号,可到个人中心解绑。
欢迎的朋友
万方知识发现服务平台
获取范围
  • 1 / 15
  (已选择0条) 清除
找到 300 条结果
[成果] 1800120359 北京
H03 应用技术 社会人文科学研究与试验发展 公布年份:2017
成果简介:基于稀疏表示的半监督学习新方法及应用研究方面展开深入系统的研究工作。首先,项目组考虑到稀疏表示的突出优点,利用基于L1范数的拉普拉斯正则化方法来解决图构建和去噪这两个关键问题。其次,项目组将约束传递分解为基于稀疏表示的半监督学习子问题来有效地利用约束信息。最后,项目组还将这些新方法应用于图像分类与标注、图像语义分析与表示等较难的图像理解问题。(1)半监督学习算法:在半监督学习的应用研究中,课题组发现噪声对算法性能的影响非常大。鉴于稀疏学习在去噪上具有突出的优点,我们重点研究如何利用稀疏学习来解决实际应用中的噪声问题。一方面,面向带噪声大规模数据,我们提出了一种基于稀疏学习的半监督学习新算法。另一方面,在人体运动分析中,我们提出了一种基于稀疏学习的视觉特征提取算法,以有效去除人体运动数据中的噪声。(2)半监督学习应用:课题组首先将半监督学习算法应用于社交图片分析。社交网络上的图片( 如Flickr) 附带了用户提供的Tags,但这些文本标注信息含有大量的噪声,直接用于图像理解难以取到满意效果。已经有大量工作关注社会图片的Tags去噪,但是较少关注如何利用Tags来优化图片的视觉表示。在本项目中,我们重点研究如下关键问题:如何实现视觉文本表示的协同优化。具体地,为了解决这一关键问题,我们提出基于稀疏学习、矩阵分解以及线性变换的快速协同优化算法,并应用于社会图像分类,在标准数据集测试中取得非常好的效果。
[成果] 1600180253 河南
H109.4 应用技术 自然科学研究与试验发展 公布年份:2015
成果简介:汉语虚词的研究对语言文本的理解和处理具有重要的作用根据已有的虚词研究成果,着力构建面向机器的现代汉语虚词用法词典、虚词用法规则库,以及虚词用法标注语料库,在为现代汉语虚词用法的机器识别打下一定的数据基础。构建“三位一体”的现代汉语虚词用法知识库:构建虚词用法词典对现代汉语的虚词用法及其义项关系进了全面的分析和总结,构建了包含副词、介词、连词、助词、语气词、方位词六种词类的现代汉语虚词用法词典,词典中从标识类、句法功能描述类、范畴类和用法描述类等四大类属性对各类虚词的用法进行了描述。构建虚词用法规则库根据虚词用法词典中所描述的用法特征,抽取其中可操作的判断条件特征,以有序的BNF形式进行虚词用法的规则描述,构建了虚词用法规则库,为基于规则的现代汉语虚词用法自动识别提供形式化的依据。虚词用法标注语料库虚词用法语料库是对约有876万余词《人民日报》语料的分词与词性基本标注语料库,采用基于规则的虚词自动标注的基础上,进行人工校对。形成了现代汉语虚词用法标注语料库。虚词用法自动标注系统:基于规则的虚词用法自动标注系统利用虚词用法规则库,在对规则进行解析的基础上,实现了对语料中各类虚词用法的自动识别,标注系统准确率分别为:副词84.36%,介词71.71%,连词83.68%,助词40.71%,语气词78.85%,方位词88.14%。基于统计的虚词用法自动标注系统针对规则识别的不足,利用经过人工校对的虚词用法语料库作为训练语料,对一些多用法的常用虚词,采用支持向量机、最大熵以及条件随机场等统计模型,以及采用规则与统计相结合的方法,对虚词用法标注的结果准确率有明显提高。虚词用法知识库的相关应用:现代汉语虚词用法知识库所取得的成果已广泛应用于自然语言处理各个领域,如句法分析、机器翻译、情感计算、语义选择、对外汉语教学、英汉对比语言知识库构建、汉语词汇语义知识库构建等,并取得了较好的阶段性成果。
[成果] 1600300086 新疆
H236 应用技术 社会人文科学研究与试验发展 公布年份:2015
成果简介:该研究是国家自然科学基金的“现代哈萨克语短语识别及其语块库构建技术研究”和“现代哈萨克语词级文本语料库构建技术研究”及国家教育部的“基于语料库的哈萨克语词语标注规范研究”项目支持的应用技术研究项目。哈萨克语属于阿尔泰语系突厥语族的克普恰克语,而且是跨境语言。世界上的哈萨克族使用同一种口语,但使用不同的书写文字,如:在中国的哈萨克族借用了阿拉伯语和部分波斯语字母的哈萨克文,哈萨克斯坦的哈萨克族使用斯拉夫字母的哈萨克文,其它国家的哈文用拉丁字母,相互之间文字无法直接交流。自然语言信息处理分为词法分析、句法分析、语义分析3个层次,该项目组经过多年的研究,完成了哈萨克语词法分析研究的全部内容,已进入了句法分析研究阶段,哈萨克语不论是词法还是句法层次都有自己独特的语法特点,完全不同于英语、汉语等。“哈萨克语词法和短语处理技术研究及应用开发”项目根据哈萨克语的独特语言特点,使用基于规则和统计的信息处理技术,结合语言和概率图模型方法,研究内容为研究哈萨克语文本语料库构建技术,构建了哈萨克语文本语料库;研究哈萨克语词构形附加成分的切分和还原技术,实现了词干提取;研究哈萨克语的词性标注技术,实现了基本词和兼类词的词级标注;研究哈萨克语短语自动识别的关键技术,实现了基本短语的识别研究;研究了哈萨克语浅层句法分析算法,构建了哈萨克语短语库;研究基于语料库的哈文词信息分析与统计技术,发布了哈萨克语语言生活绿皮书;哈萨克文老文字和斯拉夫文间智能转换技术。项目创新性为,在语料库方面:首次研究了哈语文本语料库构建技术,制定了语料库标注规范,构建文本资源库,发布了基于语料库的语言统计信息,提供了哈萨克语信息处理的平台。在词法方面:首次研究了哈萨克语词性标注技术,确定了词性标记集,且首次提出了哈语构形附加成分的切分和还原技术,研制了词性标注、词干提取等软件,实现了词法分析。在短语方面:首次研究了哈萨克语短语自动识别技术,实现了基本短语的识别与语块提取,奠定了句法分析的基础。该项目开展了哈语的词法和短语分析技术研究,构建了资源库,实现了词法和短语信息处理的技术研究,制定了规范内容,培养了若干国内外人才,新疆大学已有18名硕士研究生直接以该项目为硕士学位论文内容答辩毕业,发表了学术论文35篇和哈语语言生活绿皮书2篇,研制了系统软件,其中计算机软件登记著作权5部,开展了国际合作研究,建立了哈萨克语信息处理的完整平台。该项目对哈语知识获取、句法分析、汉哈等机器翻译、大规模语料库加工等自然语言处理的诸多领域提供可靠的数据,推动信息领域应用产品的开发和升级。为哈文进一步句法分析等研究打下坚实基础,为哈语信息处理提供处理能力和平台,促进哈族文化发展,同时研制的规范和应用软件应用于哈语的信息处理各个领域。该项目经自治区科技厅科研鉴定通过,评价项目整体水平到达国际先进水平。
[成果] 1600140262 云南
H19 应用技术 社会人文科学研究与试验发展 公布年份:2015
成果简介:基于国家基金和云南省基金重点项目,针对受限域汉语问答系统不同领域普适性问题,研究从非结构领域文本中自动获取知识单元及知识关系,解决不同领域问答对领域知识的需求问题;研究特定领域问句分类模型的领域迁移方法,解决问句分类在新领域的适应性问题;研究基于学习排序的答案提取方法,构建适应于不同领域的答案提取模型;从而保证在问答过程的知识构建、问句分析及答案提取方面实现领域的自动适应。项目在领域实体及实体关系抽取、问句分类模型的领域迁移及答案学习排序等方面取得了多项创新性成果,主要科学发现及其价值如下:1.领域知识自动构建方面,综合考虑上下文词、词性、句法等信息,提出了融合长距离依赖特征的Markov逻辑网中文命名实体识别方法,提出了基于最大熵的领域实体关系的抽取方法,自动获取领域的实体及实体关系,为实现从非结构化领域文本中获取与组织领域知识提供理论与技术保障;2.问句分类模型领域迁移方面,提出了半监督协同学习的中文问句分类方法,构建不同分类器协同标记无标记样本,协同学习提高问句分类的准确率,从而达到无标记样本的有效利用;提出了基于特征映射的问句分类迁移学习方法,借助特征相似性,将源领域问句实例映射到目标领域类别中,构建目标领域问句分类模型,为实现问句分类模型的领域移植提供理论与技术的支撑;3.答案提取学习排序方面,提出了基于多特征融合的领域实体类答案学习排序方法,融合问句与候选文档相似度及查询词分布密度等特征,构建领域事实类实体答案排序模型提取答案;提出了融合语篇结构特征的非事实类答案学习排序方法,依据篇章结构及修辞结构关系提取篇章结构特征,构建非事实类答案提取模型提取答案;为不同领域问答系统提供通用的答案提取学习排序理论与方法;4.研制了旅游实体识别、实体关系识别、答案检索等系统,有很好的应用价值,获国家发明专利1项,登记软件著作权13项。 项目共发表论文62篇,其中被SCI收录3篇、EI收录41篇,论文被《Pattern Recognition Letter》等国内外高水平期刊引用,得到了同行的关注和认可,被SCI他引6次、CSCD他引10次、CCD他引69次、Google Scholar他引97次,累计他引183次;参加2010年国际最高水平文本检索TREC竞赛,在Entity List Completion Task获第1名,在Related Entity Finding Task获第3名;参加2013年CIPS_SIGHAN实体消歧评测获第3名;参加2014中文倾向性分析评测获第3名。 项目取得的成果为构建普适于不同领域的问答系统奠定了理论与技术基础,成果评定委员会认为,成果原创性强,总体上达到国际先进,国内领先水平。
[成果] 1500161081 黑龙江
H159 应用技术 社会人文科学研究与试验发展 公布年份:2014
成果简介:该项目基于认知语言学中的意象图式理论,首先深入研究了意象图式理论,充分论证此理论可运用于翻译研究的可行性,然后对幽默及其翻译的理论进行梳理充分说明幽默翻译的难度和可译性,最终找到意象图式理论和幽默翻译的一个切入点并运用于幽默翻译研究.认知语言学的研究对象是语言的普遍原则与人的认知规律之间的关系.意象图式是其中很重要的理论分支.人们感知外部世界并与之互动的的过程中不仅获得对事物认知的能力,而且获得了认识事物之间关系的能力.人们头脑中形成一些固定、抽象的意象,用以认识客观事物以及他们之间的关系,经过对这些关系反复组织,使得诸多具备相似性质的活动抽象成了同一个框架,便形成了意象图式,赋予了人们的经验以完整的结构.认知语言学以某特定语言为研究对象,但其真正的目的是探索语言之间的共性以及人类认知与语言之间的共性.正是因为这种语言间的共性使得不同语言之间的交流是可能的,相同或相似文化背景下的人们头脑中逐渐形成的经验会更类似.在跨语言和跨文化交际中,文学作品是一个很重要的方面.文学作品的翻译是一门艺术,同样是思想的结晶.翻译的最终目的是创造一个氛围来展现原文的韵味.翻译其实就是意象的解读和再现.翻译依赖于原文的意义及其美学氛围,译者可以通过对各单独意象的把握实现对译文的呈现.译文的整体依赖于各部分的和谐整合,读者得到的是大于单独意象总和的新意象.该研究主要以钱钟书小说《围城》中的幽默表达方式以及JeanneKelly、NathanK.Mao的英译本以及美剧《老友记》中的字幕幽默翻译为研究对象,对其中的大量幽默实例及其翻译从意象图式理论的角度进行解读,通过对意象传递、意象转换和意象再造三个方面的分析,试图探讨意象图式理论在意象翻译过程中的解释功能,并探讨了对译者今后翻译工作的启示.
[成果] 1500130454 黑龙江
[G, H31] 应用技术 [高等教育, 社会人文科学研究与试验发展] 公布年份:2014
成果简介:最近发展区理论(the Zone of Proximal Development)通常被缩写为ZPD。这一理论是由俄国心理学家列·维果茨基(Lev Vygotsky)提出的。维果茨基的研究表明:教育对儿童的发展能起到主导和促进作用,但需要确定儿童发展的两种水平:一种是已经达到的发展水平;另一种是儿童可能达到的发展水平,这两种水平之间的距离,就是“最近发展区”。维果茨基的最近发展区理论强调了学生的主体地位以及老师或能力较强的同伴在学生建构知识体系中的重要作用,强调了教育的作用在于激发学生尚未形成的学习潜质而不仅仅是关注学生已经拥有的能力。他的理论对很多国家的教育理念产生了重要的影响,同样最近发展区理论对中国大学英语教学模式改革也有着重要的启示作用。最近发展区理论促进了教师角色的转变、促进了教学模式的改革并且启发了动态评估的观点。在英语课堂中教与学不仅仅是给予和接受知识,而且还应该包含师生、生生之间的互动与交流。在课堂上学生不仅需要接受知识的能力还需要寻找问题的能力。老师一定要在学生的最近发展区内布置任务。也许某一个学生单独完成任务有困难,但是在其他能力较强的学生帮助下,下一次这个学生就可以单独完成这个任务。与学生的现有发展水平相比,老师还要更注重学生的潜在发展水平。老师需要掌握每个学生的特点帮助他们通过最近发展区从而到达下一个发展区。在这个过程中不仅需要老师的帮助,还需要学生之间相互帮助。学生的潜在发展水平比实际发展水平更重要。所以对最近发展区理论的研究有助于促进教师转变教育观念,对于大学英语教学改革的发展,大学生英语水平的进步和整体素质的提升都有现实意义。
[成果] 1500130455 黑龙江
H31 应用技术 社会人文科学研究与试验发展 公布年份:2014
成果简介:该项目从理论和实际两个方面开展工作:一是对功能翻译理论的深入研究;二是对所收集到的当地的外宣传播资料的分析整理。在理论方面,对于能够知道外宣传播翻译的功能翻译理论进行了深入研究,梳理了该理论的发展历程,代表人物和核心理论,尤其强调了对外宣传播翻译有重大指导意义的目的论及其相关三个翻译原则;在材料分析方面,多方收集了外宣资料的英译,涉及了齐齐哈尔市一些重点企事业单位以及一些旅游景点。通过对这些材料的分析,指出了齐齐哈尔市在外宣材料英译方面存在的问题、相应的解决措施以及人才的培养。
[成果] 1500480321 青海
[TP3, H08] 应用技术 社会人文科学研究与试验发展 公布年份:2014
成果简介:句子级对齐的双语平行语料库也是跨语言信息检索,翻译词典编撰、双语术语自动提取以及多语言对比研究等的重要基础资源。但是,在句子级对齐的汉藏双语平行语料获取方面还存在着严重的不足,基本处于人工对齐状态。人工对齐的优点是对齐精确度很高,但其缺点也明显,速度慢。双语文本充足的情况下,一人一天(8小时)只能对齐500对句子。一般情况下,机器翻译需要100万对句子的平行语料库,这样规模的平行语料库,由人工对齐,一人2000天才能完成,这个速度确实太慢,跟不上现代科技的快速发展。因此,研制出一种汉藏句子自动系统。该系统通过基于长度和锚点信息相结合的算法使汉藏句子的对齐正确率和召回率分别达到90.87%和87.79%。其结果在汉藏平行语料库的建设过程中得到了应用。成果达到国内先进水平。
[成果] 1500480322 青海
[TP3, H08] 应用技术 社会人文科学研究与试验发展 公布年份:2014
成果简介:该课题通过Windows屏幕藏语等文本捕获技术、Unicode藏语分词技术和藏汉等多语种翻译词典查询方法,对当下藏文网站、网页、软件产品的涌现,为藏汉网络用户更好的理解网络文本和电子资源,探索了藏汉屏幕自动取词和翻译的关键技术和新方法。项目构建了9万词条的藏汉双语语法信息词典,设计实现了完整的藏汉英屏幕取词数据库,研发了基于判别式屏幕取词藏文分词动态库,设计并实现了藏汉屏幕自动取词和翻译系统。整理了10万句藏文分词语料。成果达到国内先进水平。
[成果] 1500480323 青海
H08 应用技术 社会人文科学研究与试验发展 公布年份:2014
成果简介:语料库是除自然资源以外的重要资源,随着统计方法在自然语言处理及机器翻译中的广泛应用,语料库建设已成为各种自然语言处理方法实现的基础。近年来,各国都开始致力于语料库的建设,并利用这些语料库进行广泛而深入的研究。“基于统计机器翻译系统的藏语语料深加工规范研究”项目研究了藏语语料库深加工规范,制定了“藏语语料库用字库编码规范”、“藏语文本字符间分隔规范”、“藏语语料属性描述”和“藏语语料库切分标注规范”等4项藏语语料库建设及深加工规范,开发了“藏语语料规范化工具”和“藏汉词对齐可视化编辑工具”,技术上处于国内先进水平,为藏语自然语言处理、藏语语料库建设和汉藏/藏汉机器翻译技术研究奠定了基础。成果达到国内先进水平。
[成果] 1500480324 青海
[TP3, H214] 应用技术 公共软件服务 公布年份:2014
成果简介:为适应当前和未来藏文信息处理的需要,各种不同藏文编码的大规模藏语语料库共享和整理,通过多种藏文编码自动识别与转换软件的实现,为藏文资源共享、藏文排序、检索、本地化、软件开发、信息安全等方面有着前所未有的应用价值。该项目成果的软件用户界面友好,操作简单、易用,转换速度快、转换结果准确。成果达到国内先进水平。
[成果] 1500160002 北京
H08 应用技术 工程和技术研究与试验发展 公布年份:2014
成果简介:科技文献自动翻译具有重要的研究意义和实用价值。该项目以统计机器翻译技术为基础,研究了适合科技文献翻译的机器翻译关键技术和方法。主要研究内容包括三个方面:句子骨干翻译模板的自动获取;传统语言学知识和统计机器翻译模型的融合策略;以及统计机器翻译系统的领域自适应方法。课题组提出了长距离调序模板的自动获取方法;基于依存句法树的翻译模板获取方法;翻译词典、翻译模板以及句法知识在统计机器翻译系统中的融合策略;以及基于上下文模型和Bagging的领域自适应方法等多种解决方案,有效提高了科技文献的自动翻译质量。这些研究工作发表在计算语言学领域的顶级会议ACL、EMNLP、COLING上,产生了一定的影响。课题组基于这些技术开发了一个面向专利文献翻译的机器翻译系统,该系统已经大规模用于实际工作中,实现了300余万篇中国专利文献全文的翻译,用户评价的自动翻译正确率可以达到70%-85%。
[成果] 1500160018 北京
H08 应用技术 工程和技术研究与试验发展 公布年份:2014
成果简介:机器翻译的规则方法和统计方法各自发展出了成熟的理论和技术,近年来这两种技术日益融合,越来越多的统计机器翻译模型中融入了大量的语言学知识。该课题组由中国科学院计算技术研究所刘群研究员领导,中国科学院自动化研究所和哈尔滨工业大学共同参与,在国家自然科学基金项目“融合语言知识与统计模型的机器翻译方法研究(编号:60736014)”的资助下,在这一领域开展了深入的研究,取得如下成果:1.提出了基于树到串规则的统计翻译模型,通过引入源语言端的句法结构,解决统计机器翻译中短语规则的泛化已经长距离调序等问题;2.提出了基于森林的机器翻译方法,通过压缩的句法森林模拟指数规模的句法分析树,很大程度上避免句法分析错误导致的翻译错误;3.提出了句法分析与解码一体化方法,利用双语语料库源语言端的句法树训练句法分析器取代小规模树库训练的句法分析器,确保了句法分析与翻译解码空间的一致性;4.提出了基于依存到串规则的统计翻译模型,解决了基于依存树杈的翻译模型存在的译文碎片组合难以建模的困难;5.提出了基于上下文的规则选择方法,通过一个最大熵模型引入规则所处的实际上下文,改变规则选择的概率分布,提供规则选择的准确率;6.提出了词法分析和句法分析的标注规范迁移方法,可以利用不同标注规范的语料库共同改进词法分析和句法分析的性能;7.提出了利用双语语料库进行短语结构树和依存树的句法结构映射方法,可以利用另一种语言的句法分析器改进单语句法分析的效果,可否单语句法树库缺乏导致的数据稀疏问题;8.提出了区分句型模板的统计翻译模型,通过一个分类器判断输入语句的类型,并对源语言语句实施与调序,可以有效改善口语翻译的效果;9.提出了基于对齐矩阵的翻译规则抽取方法,避免了单一词语对齐错误导致的规则抽取错误问题;10.提出了多种层次的系统融合方法,可以利用多种不同的模型和方法改进机器翻译系统的性能。上述研究成果较好地解决了机器翻译中语言知识与统计模型的结合问题,发挥了二者的优势,使得机器翻译的水平较基于短语的统计机器翻译方法有了大幅度提高,出版论著2本,共发表重要学术论文100余篇,其中在该领域顶级刊物和会议发表论文20余篇,在国际机器翻译评测中成绩突出,并多次应邀在国际会议上做特邀报告。基于上述研究成果开发的机器翻译系统已经成功转让给许多国内外著名企业和政府机构,并已通过互联网提供公开的机器翻译服务。
[成果] 1500160366 天津
H19 应用技术 社会人文科学研究与试验发展 公布年份:2014
成果简介:研究采用一种相对自然的实时测量技术-眼动分析技术,以小学生和外国留学生为研究对象,探讨了不同词切分标识方式对汉语初学者词汇识别和眼跳定位的影响.具体包括(1)词切分在阅读过程中作用的基本问题,如切分空间和切分方式的作用、低水平的词切分线索与高水平的语言因素(如词频和可预测性)的交互作用对阅读绩效的影响以及朗读与默读条件下的词间空格效应;(2)词切分对中国小学生、阅读障碍儿童阅读绩效和眼跳定位的影响;(3)词切分对(韩、泰、日和美国)留学生以及双语者第二语言学习的影响;(4)词切分训练对中国儿童和外国留学生汉语新词学习的影响.此外,在该项目资助下,课题组对阅读过程中的知觉广度和副中央凹-中央凹效应进行了探讨.关于词切分研究的总结果表明,词切分在一定程度上能够促进中国小学生和留学生在汉语阅读过程中的词汇识别、新词学习和眼跳定位,并且这种促进作用不受留学生母语文字特性的影响.研究成果对于探索汉语初学者词切分的规律,促进小学生和外国留学生的汉语阅读水平,改革汉语读物的呈现方式具有重要意义.
[成果] 1400520150 江苏
H03 应用技术 工程和技术研究与试验发展 公布年份:2013
成果简介:该课题在研究汉语配价结构和话题结构的基础上,提出了新颖的汉语句法语义分析方法和计算模型,实现了一个高性能的汉语句法分析和语义计算平台,性能达到国际领先水平,为将来的进一步研究打下了扎实的基础。三年来,课题总体进展顺利,所有研究计划已按要求完成,达到预期目标。特别是:1)在句法分析和语义分析的联合建模方面,揭示了动词性谓词和名词性谓词的相互作用,提出了一个自底向上的联合学习模型,结合配价结构信息,将语义角色标注嵌入句法分析过程,优化句法分析。在ChinesePropBank语料库上,语义角色标注性能提高约2%。2)在汉语话题结构理论的研究方面,将中心理论从语法层面拓展到语义层面,成功应用于实体指代消解。在NISTACE语料库上的实验表明,实体指代消解的性能平均提高了约7%。3)在句法结构化信息的有效使用方面,提出了支持上下文相关和模糊匹配的树核函数,探索了包含丰富结构化信息的句法树自动获取,与其他树核函数相比,在ChinesePropBank和NISTACE语料库上,语义角色标注和实体间语义关系抽取等语义计算性能分别提高约6%和9%。同时,探索了基于森林的语义角色标注,并将基于森林的方法推广到统计机器翻译,与使用单棵句法树相比,性能有了进一步的提升。三年来,发表SCI索引源期刊论文5篇、EI索引源期刊论文4篇、国际顶级会议AAAI/IJCAI/CIKM/ACL/EMNLP/COLING论文36篇;获得专利1件;获得2010年教育部科技进步二等奖1项(项目主持人排名第二)。
[成果] 1400520163 北京
H03 应用技术 工程和技术研究与试验发展 公布年份:2013
成果简介:认知科学的研究表明,人类在语言习得过程中,视觉通道的信息具有重要的辅助作用,许多语言信息源于视觉感知,即所谓语言的视觉接地。该项目研究在视觉信息的基础上建立语言的意义,取得了如下成果:提出了一个基于图像信息的词汇语义习得模型ViMac。该模型建立了基于静态图像信息的词汇意义习得和表示方法,该方法主要关注名词、形容词和方位词。模型的核心部分包括基于Hellinger距离的语义关联度计算、基于混合度量的词聚类、基于多维Hellinger距离的视觉特征选择以及空间方向关系的形式化描述与模糊判定,由此来实现视觉特征和语言词汇的对应。进而,为了能对新图像特征值进行语言描述,提出了一种基于核心成分的视觉语义表征,基于这种表征方法提出了面向新图像特征值描述的复合词生成算法,该算法可生成训练数据中未出现到的复合词以描述训练集中未出现的新图像特征值。在此基础上,实现了一个为静态图像自动生成自然语言描述的系统。提出了一个基于视频信息的动词词汇语义习得模型ViMac-V。针对动词的特点,项目采用框架+论元的语言学结构来构建基于视频特征的动词语义,利用框架来组织视频情景中运动的各种认知属性,而论元则被框架支配来实现对具体运动属性的描述。项目首先基于视觉特征与词共现信息、词性信息以及最小编辑距离进行论元的词类划分,并利用二元语法模型进行动词框架的提取。进而,通过构建自组织神经网络组来实现动词语义与视频信息的关联。其中,基于学习矢量量化的框架激活机制将视频所凸显的反映运动信息的各属性结构与动词框架相关联;而对论元则通过SOM网络将其在视觉空间中范畴化。范畴化后的SOM网络连接了高维视频特征分布和论元词汇,再通过框架支配各个带词汇化标签的SOM子网络,组成不同的动词视觉语义。在该基础上,实现了一个为视频自动生成自然语言描述的系统。完成的ViMac和ViMac-V模型已经部署在机器人平台上。同时,也在模型车上实现了一个基于自然语言指令的车辆行驶控制演示系统,模型车能依据自然语言指令行驶。除了基于认知的语言接地的上述工作,基于语言意义习得的发展性,即语言意义是从儿童时起按某种特定顺序逐步习得的,视觉信息在语言发展中可以为儿童语言习得提供先验知识,该项目同时研究了基于儿童语言习得机理的语言习得计算模型,提出了一种阶段性儿童语言习得模型。
[成果] 1400520471 北京
H03 应用技术 工程和技术研究与试验发展 公布年份:2013
成果简介:项目组按照项目既定的计划研究了无线网络环境下视频定制和适配中存在的若干科学问题和关键技术。课题组重点研究了底层特征提取与描述、视频内容分析与语义表示、个性化学习与建模、视频编码与适配、个性化定制与检索等几个方面的理论与方法,克服了一些难点问题,取得了一些研究成果。特别是针对特征具有的空间约束、多模态共生、结构稀疏等特点,创新性提出了有效的底层特征表示和建模的理论方法;利用图理论来刻画数据之间的上下文复杂关联,形成了一套基于图的语义标注、迁移学习、视频事件检测等视频语义理解的框架;结合用户的个性化和社会化特点,研制了个性化视频定制系统及其关键功能模块,基本达到了项目预定的各项技术指标。
[成果] 1300050299 黑龙江
H16 应用技术 工程和技术研究与试验发展 公布年份:2012
成果简介:提出了针对开放文本的汉语分词和电子词典构筑的辅助方法。采用多策略融合利用规则、归纳学习、歧义探测、概率模型等多种技术,使各种方法相互取长补短以达到适合开放文本分词处理的目的。首先通过规则进行处理,使文本在需要分割的明显标志位进行切分;然后通过归纳学习及深度归纳学习进行未知词的预测,并根据预测时的条件不同将预测到的未知词候补,按照其作为词的概率大小划分为不同的等级注册到词典,通过重复的、再归的预测过程,可以得到具有作为词的很高可能性的词候补;最后通过歧义探测处理对分词过程中出现的分词歧义进行检索、查找。当歧义出现时,采用Tri-gram模型计算概率进行消歧处理。整个分词过程是一个只需少量人工参与的有监督的学习过程,可用于电子化词典的构筑,大幅降低人工劳动,提高词典构筑的效率和精准程度。
[成果] 1200321144 黑龙江
[G42, H08] 应用技术 高等教育 公布年份:2011
成果简介:1、课题研究的来源与背景:随着认知学习理论的发展,人们对学习者在学习中的作用的看法有了改变。人们越来越认识到学习者被看作积极的信息加工者,解释者和综合者。因此,外语(第二语言)学习策略的研究逐步成为应用语言学的研究热点。外语(第二语言)学习策略作为学习过程中的一个重要环节,其选择和使用将直接作用于语言学习效果。因此,对制约外语学习策略因素的研究,不仅可以使教授者了解学习者的策略取向,对其进行必要的指导,使外语教学做到有的放矢,从而提高教学质量。认知方式作为心理学上的术语是指人们对信息和经验进行加工时所表现出来的个别差异,是个人在感知,记忆和思维过程中经常采取的态度和方式。60年代以来,随着语言教学研究重心从教师转移到学生身上,语言教育工作者和研究者的研究重心,也从教学方法和过程的研究向学生语言学习过程和语言学习本身特点上转移,因而学习者个体差异,日益引起第二语言习得研究者的高度重视。2、研究的目的与意义外语(第二语言)习得,也是一种认知行为。从认知角度对语言输入所采取的认知策略,不仅是学习策略的核心成分,也是有效运用学习策略的基础。因此,基于认知角度的外语学习策略研究不仅对第二语言习得过程有一个更为全面的认识和理解,对促进中国的外语教学也具有现实的指导意义。学习策略的研究一方面,可以大面积地改进学生的学习,提高学习效果和质量,减轻学习负担;另一方面,可以促进学习潜能偏低或智力发育迟滞的学生的学习,减少他们学习的困难。促进教师的教学。教师通过了解学生的学习策略,可以调整自己的教学策略和教学方法,从而提高教学效果。3、理论依据:学习策略的定义Rubin(1978)把学习策略概括为“学习者为了使自己获取、存贮、重新获得以及使用语言信息而采取的任何操作、步骤或惯例行为”。Oxford(1990)则认为,学习策略是学习者在学习中所采取的具体行为或行动,从而使语言学习变得快捷容易、更加有趣、更加便于自学、更加容易适应新的环境。文秋芳(1996)把策略界定为:为有效学习所采取的措施。该定义强调了两点:使用策略的目的在于提高学习效率;策略的实质是学习者的行动而不是想法,这种行动既可以是外部的活动,也可以是内部的活动。英语学习策略的内涵国外学者对“语言学习策略”有以下几种定义:(1)语言学习者采用方法的一般趋势和总体特点,用于描述可视行为的具体形式;(2)学习语言时的做法和想法,旨在影响学习者的编码过程;(3)学生采取的技巧、方法或者刻意的行动,其目的是为了提高学习效率和易于回忆语言的形式及内容;(4)学习者用以辅助其信息吸收、储存及使用之步骤与操作;(5)学习者为促进其对第二语言的了解、理解和使用所采用的、通常是有意识的和特定的动作、行为、步骤或技巧。认知理论的含义认知是指感觉输入直到转换、简约、加工、存储、提取和使用的全部过程(Neisser,1967)。认知论关注的焦点是学习者如何掌握语言的形式和功能特征以及语言学习所涉及的心理过程。从认知规律的角度来讲,外语学习(二语习得)是一个从输入开始、由注意到记忆再到重构并输出的动态过程。Gass(1988)由此提出了一个从认知的角度研究二语习得的理论框架:第二语言输出、被注意的输入、被理解的输入、摄入、融合和第二语言的输出。学习策略和认知策略的关系美国心理学家Burner在其人工概念研究过程中,首次提出了“认知策略”。心理学家NewellShaw和Simon随之利用计算机有效地模仿了问题解决策略,从而行成“学习策略”概念,引起心理学家、尤其是教育心理学家的极大兴趣。学习策略是指语言学习者有意识或无意识地采用某种认知或思维方式来获得语言知识,提高语言技能用来指导和调整自己的学习过程,以适应不同学习阶段的需要。从中课题组可以得出,认知策略和学习策略是因果关系,认知策略的改进会促进学习策略改进。4、创见与创新:该课题采用多视角的方法探索了如何使学生成为独立、自主、有效的学习者,而该课题关于智力、年龄、认知风格及个性等对学习策略的影响的研究会帮助课题组更好的理解语言学习和不同学习者的特点,减少和避免教师在教学中的盲目性和随意性,提高学生在校学习期间的学习效果,更重要的是让学生获得独立、自主学习的能力。该课题的研究不仅为新的、切实可行的英语学习策略研究提供一些理论依据,同时也为英语学习策略研究提供一个更加广泛的视角。5、社会经济效益,存在的问题:提高教学效率,学生成为独立、自主、有效的学习者。存在的问题:1)条件所限,没能广泛应用于其他院校。2)有些研究成果没有以论文形式发表出来。6历年获奖情况主持人曾获得:2008年黑龙江高校人文社会科学研究优秀成果一等奖(参与课题)2008年黑龙江高校人文社会科学研究优秀成果二等奖(参与课题)2005年黑龙江省优秀高等教育科学一等奖(论文)2010年黑龙江省精品课程(主持人)等。
[成果] 1200321508 河南
H04 应用技术 社会人文科学研究与试验发展 公布年份:2011
成果简介:该项目的本体研究意义和社会意义是通过定量分析为汉语研究提供基本数据并作为语言类型研究的基础,同时,对已有的相关结论进行验证,对习以为常的说法进行实证,从而使课题组更加客观地认识汉语形态特征。汉语言文字和中国少数民族语言文字,有自己独有的特点,也较有可能形成高新科技的自主知识产权。加强语言文字的本体研究和基于信息处理的应用研究,对于迅速提高中国语言文字的规范化、标准化水平,提升中文在虚拟世界中的影响力有着重要作用。该项目的研究成果不仅具有社会价值,而且具有一定的经济价值。该项目的研究依赖于现代汉语语料库的支持。在以往技术条件不具备的时候,语言学家只能根据“口耳之学”进行内省式的探索研究,这往往是不够客观准确的。现在有了语料库技术的支持,课题组通过对大量语料库数据的统计、分析,可以更方便地从中发现具有普遍意义的客观规律。这种现代化的语言研究方法和手段,为课题组节省了大量的时间和精力,极大地提高了课题组的工作效率,并提升了语言研究的科学性,扩展了语言研究的深度和广度。该课题的研究成果还为进一步研究感叹句的其他相关问题提供了相关数据和结论。后人可在该基础之上,展开对感叹句的深入研究。同时这些数据和结论还可应用于汉语本体的教学和对外汉语教学领域,为第二语言的句类教学提供了相关语言知识,极大地提高了第二语言教学的效率。推广应用的范围:一为汉语本体研究提供相关数据和结论,可应用于汉语本体的教学和研究领域;二应用于对外汉语教学领域,为第二语言教学提供相关语言知识,提高教学效率;三应用于其他语言文字应用领域,例如中文信息处理、新闻广播、对比语言研究、普通话的推广等,为语言文字社会应用的规范化、标准化做出贡献。
  (已选择0条) 清除
公   告

北京万方数据股份有限公司在天猫、京东开具唯一官方授权的直营店铺:

1、天猫--万方数据教育专营店

2、京东--万方数据官方旗舰店

敬请广大用户关注、支持!查看详情

手机版

万方数据知识服务平台 扫码关注微信公众号

学术圈
实名学术社交
订阅
收藏
快速查看收藏过的文献
客服
服务
回到
顶部