绑定机构
扫描成功 请在APP上操作
打开万方数据APP,点击右上角"扫一扫",扫描二维码即可将您登录的个人账号与机构账号绑定,绑定后您可在APP上享有机构权限,如需更换机构账号,可到个人中心解绑。
欢迎的朋友
万方知识发现服务平台
获取范围
  • 1 / 100
  (已选择0条) 清除 结果分析
找到 380928 条结果
[博士论文] 张婧
计算机应用技术 大连理工大学 2018(学位年度)
摘要:中文分词任务是机器翻译、自动问答、信息检索等自然语言处理任务的基础工作,其研究具有重要的理论意义和应用价值。面向社交媒体语料的自然语言处理任务受到广泛关注,但由于社交媒体语料的特殊性及其分词训练语料极为匮乏等问题,导致现有分词器在该领域的分词结果不理想。本文围绕如何提高面向微博等社交媒体领域的中文分词器的性能这一课题展开深入研究,主要研究内容包括:
  针对微博领域缺乏分词训练语料且含有大量新词的问题,提出一种新的无监督微博新词识别方法。由于现有新词识别统计量对词频依赖性较大,因此,本文将新词识别任务分为高频新词识别和低频新词识别两个子任务。对于高频新词识别任务,提出点互信息和字向量相结合的新词识别方法;对于低频新词识别任务,提出基于Modified AccessorVariety和词串独立性的新词识别方法。结果表明,本文所提方法优于当前领先的OverlapVariety新词识别方法。
  针对微博语料中存在大量相似样例的问题,提出基于λ-主动学习的中文微博分词方法。该方法的初始分词器采用CRFs模型,利用无监督方法从大规模未标注语料中获得点互信息和停用字可能性作为CRFs模型的学习特征;根据微博语料中存在大量局部相同而整体不同的样例的特点,在主动学习挑选样例时引入参数λ对字边界的多样性进行衡量,有效控制选取的类似样例的数量。实验表明,所提方法优于目前领先的基于词边界标注的主动学习方法。
  为了在扩充训练语料过程中避免人工标注工作,提出基于BLSTM神经网络模型和CRFs模型协同训练的半监督中文微博分词方法。该方法在协同训练过程中,根据个体分词器对未标注微博语料的预测结果获得标注样例中的异簇,并提出规则和D-S证据理论相结合的标签自动修正算法对异簇标签进行修正,从而生成伪训练语料。结果表明,本文所提的协同训练方法可以在不需要任何人工标注的情况下,利用自动获得的伪训练语料显著提高个体分词器的性能,达到该领域的领先水平。
  综上,本文针对微博等社交媒体语料的特点提出无监督新词识别方法、基于半监督的主动学习方法的中文微博分词方法和基于半监督的协同训练的中文微博分词方法。结果表明,本文研究工作能够自动获得高质量的微博分词训练语料,有效提高面向微博语料的中文分词器的性能,为面向社交媒体语料的文本处理与信息抽取打下基础,也为训练资源稀缺的研究任务提供了扩充训练语料的新思路。
[博士论文] 黄鑫
计算机应用技术 大连理工大学 2018(学位年度)
摘要:从海量生物数据中挖掘出反映疾病发生发展变化的重要信息,尤其是恶性肿瘤发生的关键特征,是生物信息学及其应用研究的一个热点问题。在生命机体中,分子间彼此相互关联、相互作用,共同完成各项复杂的生理功能。因此,疾病状态中发生扰动的不仅是一个分子,而是多个分子间的关联关系。关注疾病发生发展中分子间关联性的改变,获得有效地反映生命机体病变的重要特征,有助于提高疾病的临床诊断效果。本文从探究分子间的相互关系入手,研究基于特征间关联关系的数据分析新算法,将所研制的新方法应用在疾病组学数据中,从网络或组合标志物层面发现有助于疾病诊断的关键信息。本文工作主要包括:
  (1)提出了一种新的特征对评价算法,不同于仅考察特征间水平比较关系的特征对评价算法,本算法同时分析特征间的水平和垂直比较关系在疾病发生发展过程中的变化,挖掘特征间具有判别能力的关联信息,并依据所选出特征对的比较关系构建相应的分类模型。在分析基因组学数据和代谢组学数据的实验中,该算法所构建的分类器表现出更好的分类性能和更强的鲁棒性,实验结果表明该算法从不同角度分析特征间的关联关系,可以发现更多的判别信息,促进临床诊断和疾病标志物的研究。
  (2)提出了基于组合特征的分类模型构建算法,该算法通过探究特征间的水平比较关系,筛选具有判别能力的特征对,迭代地构造有效的组合特征,所生成的组合特征参与分类模型的构建。组合特征不局限于只考察两个特征间的关联性,而是根据迭代分析的结果确定,并且基于原始单特征和组合特征建立有效的分类模型。该算法在分析基因组学数据和代谢组学数据时,可以有效地区分数据集中不同类别的样本,实验结果说明挖掘特征间具有判别能力的关联关系、迭代地构建新的组合特征,有助于促进疾病的分型研究。
  (3)提出了基于有效范围的非重叠率的代谢网络构建和动态网络分析新方法。该方法通过探究病变过程中通路反应的紊乱程度构建动态代谢网络,描绘复杂疾病发生发展过程中代谢轨迹的动态变化。根据该网络构建方式特点,提出了拓扑结构分析和动态浓度分析方法,以确定疾病恶化的关键时间节点、筛选具有预警作用的网络信息和重要代谢比值特征。将所研制的方法应用在大鼠肝癌队列数据中,确定了重要代谢比值特征LPC18∶1/FFA20∶5,该比值标志物不仅可以有效地区分动物模型中的肝癌样本,其表达值升高也可以预警肝癌的早期发生。
  (4)提出了提取差异性网络子图的新方法,通过分析比值特征的相关性网络,发现节点间关联关系在不同生理、病理状态下的差异,提取反映机体病变的差异性子网;基于差异性子网的拓扑结构分析,确定与所研究问题相关的重要比值特征。该方法既可以分析静态数据以寻找疾病的判别信息,也可以分析时间序列数据以发现疾病的预警信号。将所研制的方法应用在静态的基因组学数据和动态的代谢组学数据上,实验结果表明提取比值特征的相关性差异子网可以为分析复杂的疾病组学数据提供新思路。
  为探究特征间关联性在疾病发生、发展中的变化,发现可以反映机体病变的重要的关联关系,促进临床疾病的诊断研究和标志物筛选,本文以疾病组学数据为主要研究对象,以临床标志物筛选为研究目标,研制从网络和组合标志物层面分析复杂组学数据的新方法;并将开发的新方法用于疾病的分型和潜在生物标志物的研究,以获得有效地反映生物体病变的关键特征。本文所开发的数据处理方法可为疾病特征提取和标志物筛选提供有效的新工具。
[博士论文] 白杨
管理科学与工程 大连理工大学 2018(学位年度)
摘要:Web2.0技术与社会化媒体的迅速发展为人们获取信息、发表意见、交互活动提供了开放的、便捷的平台。海量复杂的信息产生在这种社交网络上,其背后隐藏着潜在好友、意见领袖、热点事件等有用的信息,而获得这些有用信息的关键是寻找具有相似性特征的用户群体——社群。实施有效的社群挖掘不仅影响着人们的生产和生活,也对促进社会的和谐发展具有十分重要的意义。
  社交网络的信息主要来源于用户生成和交互的文本内容,因此,社群挖掘不再是单一网络结构的发现,而是更需要着眼于对这些文本信息语义的理解和内容上的挖掘。本文借鉴社会标签系统的信息组织模式,以用户关系为研究对象,开展面向标签主题识别的社群挖掘的研究工作:
  1)提出一种基于标签主题的用户重要性区分方法。用户的兴趣可能是多方面的,而传统方法对用户的“多兴趣”并未加以区分,致使用户重要性区分并未在用户的同一兴趣类别中进行,导致了用户相似性度量的“兴趣偏差”问题。针对这一问题,本文在大众分类模式网络中,首先采用标签聚类方法来识别兴趣主题,并归类用户;然后在兴趣主题相同的用户社群中,结合社会网络分析和PageRank方法构建用户重要度指标;最后将该指标引入用户相似度模型,在delicious数据集上进行有效性的验证,并在好友推荐中得以应用。
  2)构建结合时间因素的用户兴趣更新模型。建立社交网络的用户兴趣模型对于提供高质量的网络个性化服务具有重要意义,而识别用户兴趣的变化则是建模中的难点。针对并未以大众分类模式搭建的社交网络的标签并不丰富的特点,以LDA(Latent Dirichlet Allocation)主题模型中的“词语”作为标签,将标签语义特征和时间特征相结合构建用户兴趣更新模型。按照微博信息量的不同将用户划分为两大类:针对微博信息丰富的老用户,引入时间权重函数构建用户LDA兴趣更新模型;而针对微博信息较少的“冷启动”用户,采用空间向量相似性度量方法构建用户的兴趣模型,并通过学习模型对用户的兴趣变化进行识别,实现对用户兴趣模型的更新。在微博数据集上对所提出的方法进行了应用,并获得了网络的主题、网络主题的核心用户以及用户的兴趣。
  3)提出一种综合考虑用户社会关系和用户生成内容社群划分的方法。本部分包括两个阶段的工作:用户综合相似度的确定和基于信息粒度的社群划分。第一阶段从用户社会关系和用户生成内容两个视角,采用链接预测方法优化社会关系模型,采用“细粒度”用户标签和“粗粒度”内容标签构建用户“标签-主题”关系模型,将这两个模型加权汇总并设定可适应性的调节参数,建立融合社会关系和用户内容的用户综合相似度模型。第二阶段针对K-Means聚类算法的不足以及数据的高维性和稀疏性的缺陷,将信息粒度原理应用于用户聚类分析中,给出用户等价关系的隶属度和广义的等价关系,在此基础上提出一种基于信息粒度的社群划分算法。实验结果表明,由于有效融合了用户的社会关系这一重要信息和引入信息粒度方法,提出的模型与未加权的用户标签主题模型、K-Means相比,获得了更好的I指标和Dunn指标评价结果。
  4)提出社群的知识增长测度及用户选择方法。将社会标签系统应用于知识服务研究中,借鉴前文社群挖掘关键技术和研究成果,建立一种混合标签本体模式下的语义知识库,分析生成的知识社群组成及特征。将个体与组织之间的知识转移进行量化表示,对知识社群内的知识存量和知识增长进行测度。从内容感知的角度,结合相似度计算模型,设计知识转移过程的用户选择算法,优化知识转移,进而推动知识在群体内的良性高效流动。
[硕士论文] 叶杨笙
工业设计工程 浙江大学 2018(学位年度)
摘要:随着国民经济的发展,工人工资的逐步提高,解决工业、制造业的人力成本已经成为诸多企业迫在眉睫的问题。去除落后产能,优化产业结构,产业转型是提高中国经济增长质量必须经历的过程。
  机器换人是大势所趋,庞大的国内市场,使近几年来移动机器人行业蓬勃发展。移动机器人相对于仿人机器人来说,技术上更易实现,成本优势明显,已经渗透到3C电子、汽车、新能源、物流仓库、机械加工等多个行业。AGV(Automated Guided Vehicle)是移动机器人的一个分支,作为基础的搬运工具已经逐渐得到了市场的认可,成为工业自动化领域必不可少的一个环节,销量逐年增长。
  本文主要论述了对通用移动机器人调度系统的研究与设计过程。首先介绍了移动机器人相关背景及技术现状以及移动机器人调度系统的技术现状。然后分析了通过调度系统进行多机器人协作所面临的难题。针对这些难题,在地图通用性、参数通用性和环境易变性这三个方面提出了解决方案,通过这些解决方案,可以消除移动机器人个体差异对调度系统所造成的困难。其次本研究对调度系统的整体架构进行了设计并基于开源的OpenTCS(交通控制系统)框架实现了相应的功能。最后使用该系统在实际的工业及制造业场景中进行测试,并进行改进优化,提高了系统的鲁棒性。
  该设计研究成果已经在多个实际工业场景中投入使用,其中部分场景包含多种类型的移动机器人,体现了调度系统的通用性。当然,系统仍有许多不足支出,本文最后也提出了相应的改进和展望。
[硕士论文] 郭雅静
地质工程 浙江大学 2018(学位年度)
摘要:传统楼盘表多以二维表格的形式存在,虽能够准确表达属性信息,但是在房屋平面轮廓及空间拓扑关系方面表达存在不足。现有研究在楼盘表三维建模及可视化方面做了一定的探索,但仍存在楼盘表实体化管理思想相对弱化、楼房内部分级体现不够明确、户间空间拓扑关系讨论尚不够充分等局限。基于此本文从构建楼盘表模型出发,分析了户间空间拓扑关系,并结合模型进行了网络环境下楼盘表三维可视化方法研究。本文主要研究内容有以下几个方面:
  (1)提出一种多层级图属一体化楼盘表三维表达模型,实现对楼盘表的幢-层-户多层级表达和图属信息统一化管理,结合实际意义梳理楼盘表户实体之间的空间拓扑关系。相应地对模型构建流程和户间空间拓扑关系计算及相邻关系索引创建思路进行阐述。
  (2)结合本文模型提出一种基于Cesium平台的楼盘表三维可视化方法,核心思想是基于高度差构建三维视觉效果;并在不同空间拓扑关系场景下,与楼盘表二维可视化表达效果进行对比分析。
  (3)面向用户体验对本文方法的可视化性能进行优化,在视觉效果方面结合几何特征优化边线渲染、结合业务相关属性语义优化填充色彩方案;在响应时间方面从楼盘表模型组织方法层面进行优化,结合对比实验,分别研究了单模型下静态与实时结合的LOD混合组织方法和多模型下基于道路水系分域进行模型聚合的思路。
  (4)设计B/S架构下面向业务的楼盘表三维可视化实现系统,通过楼盘表数据访问服务完成三维展示模块功能;结合模型多层级表达和图属一致的特点设计业务接入模块功能。对将本文提出的楼盘表三维表达模型及可视化方法与业务系统进行集成予以实践。
  经过实践,本文提出的楼盘表三维表达模型及其网络环境下的三维可视化方法完成了楼盘表从二维图表数据到三维可视化效果的快速构建;对楼盘表模型三维可视化在业务系统场景下的应用具有一定的实际意义。
[博士论文] 钟芳明
软件工程 大连理工大学 2018(学位年度)
摘要:随着社交网络的快速发展,爆炸性增长的文本、图像、音视频等多模态数据如潮水一般涌入互联网中,给人们在海量的多模态数据中进行跨模态检索造成了巨大的困难。所谓模态是指一种数据类型或者表现形式,如文本模态和图像模态。而多模态数据通常指描述一个共同语义,但是以不同数据类型表示的数据。因此,跨模态检索是一种针对多模态数据之间交叉检索的特殊方式。由于不同模态数据之间的异构差异性和语义鸿沟,给跨模态检索造成了一定的困难。此外,数据的高维度、数据量大、存储开销大等问题进一步给高效和准确的跨模态检索实现提出了挑战。
  哈希方法将不同模态数据映射到一个由精简的哈希编码构成的汉明空间,能够有效解决跨模态检索。然而,汉明空间中的相似度保持、哈希编码的较大量化损失、跨模态数据的线性不可分和检索中存在不可见类为哈希方法设计提出了严峻挑战。本文针对上述四个问题,专注于围绕图像和文本的跨模态检索哈希方法研究。主要贡献如下:
  (1)针对已有算法从模态数据原始空间定义模态内局部结构信息造成汉明空间中的相似度保持不够准确问题,提出一种模态内和模态间相似度保持哈希算法。从目标低维空间的角度研究模态内相似度保持,将相似度矩阵的计算定义在目标空间,并且提出一种有监督距离收缩策略优化相似度矩阵,以加强模态内局部结构一致性。同时还考虑模态间的相似度保持,并将哈希函数学习结合到相似度保持中,以提高其对于海量样本外数据的适应性。实验表明该算法能够有效提升汉明空间中相似度保持的准确性,同时学习到适应性更强的哈希函数。在Pascal VOC数据集上当哈希编码长度为32bits时两个跨模态检索任务的平均精确率均值相比于最好的对比算法,分别提高了12%和11%。
  (2)针对现有方法采用松弛策略丢弃离散受限造成哈希编码较大量化损失问题,提出一种非线性离散跨模态哈希算法。首先基于联合矩阵分解学习跨模态数据公共语义,采用离散优化方法直接学习哈希编码,减小量化损失。同时提出将哈希函数学习转化成一个基于非线性核的二值分类问题,学习一组二值分类器作为哈希函数,建立原始数据和哈希编码之间的直接连接。实验验证该算法能够通过所学习的哈希函数直接生成哈希编码,减小量化损失,提高哈希编码的质量,在MIR Flickr数据集上当哈希编码长度为8bits时两个跨模态检索任务的平均精确率均值相比于最好的对比算法,分别提高了22%和18%。
  (3)针对现有基于线性哈希函数的算法难以解决跨模态数据的线性不可分问题,提出一种深度离散跨模态哈希算法。设计了一种跨模态深度神经网络框架,结合顶层模态间相似度保持、多层模态内相似度保持、标签一致性保持和哈希编码信息冗余最小化等,定义新的目标函数,以离散优化的方式,学习两个深度神经网络作为非线性跨模态哈希函数。实验验证该算法能够有效抓取跨模态数据内的非线性关系,解决跨模态数据的线性不可分问题。在NUS-WIDE数据集上,当哈希编码长度为8bits时两个跨模态检索任务的平均精确率均值相较于最好的对比算法分别取得了21%和14%的提升。
  (4)针对现有哈希方法难以解决跨模态检索过程中存在不可见类的问题,本文提出一种跨模态属性哈希算法。基于不可见类和可见类数据间的属性共享迁移,在跨模态哈希函数学习过程中,将数据特征、哈希编码、类属性和类标签之间的关系建模成一个双多层网络。实现哈希函数将所学知识从可见类迁移到不可见类上。实验表明,该算法通过学习具有知识迁移能力的哈希函数,能够实现不可见类数据的跨模态检索。
[博士论文] 邝利丹
信号与信息处理 大连理工大学 2018(学位年度)
摘要:功能磁共振成像(fMRI)是一种重要的医学影像技术,以其毫米级高空间分辨率及非侵入等优势,广泛应用于脑科学研究。多被试fMRI数据的组分析能够获得多被试间的共有信息或差异信息,为脑功能研究或脑疾病诊断提供群体性特征。盲源分离方法属于数据驱动方法,只需已知观测信号就能估计出源信号及其混合参数,适于分析脑认知程度有限的fMRI数据。独立成分分析(ICA)、独立向量分析(IVA)和张量分解在组分析上是三种性能互补的盲源分离方法,分别提供被试间平均、差异或共享的脑空间激活图和时间过程信息。然而,fMRI数据本质上是复数数据,被试间存在着较大的空时成分差异,而且模型阶数对复数fMRI数据组分析的影响未知,这些问题导致现有方法性能受限。为此,本文的创新性研究工作如下:
  (1)针对复数fMRI数据存在的不同独立源成分向量分布差异大、噪声严重和非圆性等问题,提出了一种基于多维广义高斯分布的复数自适应定点IVA算法。首先,构建了一个基于多维广义高斯分布的非线性函数,通过极大似然估计实时更新其形状参数,从而自适应地匹配各源成分向量的分布。然后,在主导子空间更新该非线性函数,实现消噪。最后,在解混矩阵更新中嵌入了混合数据的伪协方差阵,进而引入了复数fMRI数据的非圆性。仿真和实际数据的实验结果表明,该算法显著优于现有方法,特别是在信噪比较低和空时差异变化较大的情况下,获取了更优的空时信息。复数IVA较之幅值IVA提取了更多感兴趣体素(任务相关成分和默认网络成分都增加约三倍之多)。针对现有后处理相位消噪的相位范围固定的问题,基于先验空间成分和相关最大化原则,提出了一种相位范围自适应选取方法,该方法适于任务态数据和静息态数据的后处理消噪,也验证了固定相位范围±π/4的正确性。
  (2)针对现有张量分解方法不能同时解决被试间空时差异性的问题,提出了两种新算法。其一,以时间移不变CPD引入时间成分的差异性,以ICA引入空间差异性约束,提出了一种时间移不变典范因子分解(CPD)和ICA相结合的算法。该方法先对多被试幅值fMRI数据进行ICA,获取联合混合矩阵;再对该矩阵进行时间移不变秩一估计,获得共享时间成分和各被试特有的时延和强度信息,并由此重构联合混合矩阵,进而采用最小二乘法获得共享空间成分。其二,提出了一种空间源相位稀疏约束的复数时间移不变CPD算法。将实数域时间移不变CPD算法拓展到复数域,引入复数时间成分的差异性;利用复数空间成分所特有的小相位特性,采用一种l0范数平滑函数对大相位体素进行稀疏化,引入空间差异性约束。仿真和实际数据的实验结果表明,这两种算法在空时差异性较大和噪声较大的情况下,均显著优于现有算法。复数张量分解方法较之幅值方法多获得了约两倍的任务相关体素。
  (3)研究了复数fMRI数据组分析中模型阶数的影响及其成因。首先,提出了一种从多次ICA结果中选取best run的改进方法,利用了多成分性能平均和显著性检验综合策略。实际数据的实验结果表明,该方法在所有模型阶数下均优于现有方法。其次,采用所提出的best run选取方法,研究了复数fMRI数据组分析中模型阶数的影响,发现了从低阶到高阶一直存在的复数完整成分,与现有幅值成分在高阶发生分裂的结论迥异。接着,探究了复数完整成分的形成原因,检测了相位数据的模型阶数影响,分析了相位数据的特征值分布,证实了相位数据对幅值数据的补全作用。最后,以默认网络为例,探索了高阶复数完整成分的作用。与高阶幅值成分相比,高阶复数完整成分在健康对照组和精神分裂症患者区分上体现出更为显著的差异,具有作为生物标识的潜力。
[博士论文] 唐宁
应用心理学 浙江大学 2018(学位年度)
摘要:人类智能具有快速学习和灵活迁移的特点,在应对复杂多变的外部环境时较人工智能系统表现出不可比拟的优势。智能系统运算加工的效率取决于其内部的表征(Marr,1982;Neisser,1967),良好的表征形式正是人类智能拥有该优势的重要原因。现有的视知觉研究大多围绕着“特征”和“客体”等心理表征形式展开(Treisman&Gelade,1980;Kahneman,Treisman&Gibbs,1992)。然而,生活中的现实场景远比“特征”和“客体”复杂得多。视觉系统能够识别场景中的多个对象,理解其中的复杂关系,并提取出视觉场景的语义(Zhu&Mumford,2007)。人类的认知系统如何高效地表征复杂多变的视觉场景是当前认知心理学领域的重要理论问题。由于带有视觉语法的层级结构可通过递归的方式构建出多层次关系,以表示整个场景,且不同的场景信息都可以表达为这一形式,笔者据此认为,场景信息是以视觉语法层级树的形式加以表征的。本论文拟围绕上述假设开展系统研究。
  本研究针对场景区域分割信息,采用心理物理法与计算建模技术,以层级结构的节点深度效应为指标就场景信息的层级结构表征进行了系统考察。整个研究由两部分组成。研究一主要探讨视觉系统能否对场景中具有复杂空间关系的多个区域构建层级结构表征。该部分研究中,以分割法则为场景区域关系语法规则的层级树,通过层层迭代的方式生成场景分割图,比较层级树中不同深度节点变化条件下的记忆绩效,以检验层级表征存在与否。研究二选取水平和垂直切割规则下的场景区域分割信息,尝试性地就其层级表征的计算过程进行认知建模,并通过比较人和模型在场景分割相关认知任务中的绩效对该模型加以检验。本研究获得以下主要结论:
  (1)在场景区域分割信息的加工中,层级结构中不同深度节点的属性变化产生了不同的行为绩效,且该绩效差异不能由颜色变化面积等方面的差异所解释。上述结果表明场景信息加工中存在层级表征。
  (2)在不同结构类型和不同切割规则的场景区域信息加工中,不同节点深度条件的绩效差异均存在。上述结果表明场景信息的层级表征具有普遍性,不仅具有跨层级结构类型的一致性,且具有跨语法规则的一致性。
  (3)构建了基于贝叶斯推断方法的认知模型。该模型针对场景分割任务输出的结果与人的绩效一致。可以认为,该计算模型良好地仿真了层级表征的构建及其在场景信息相关认知任务中的计算过程。
  本研究首次针对视觉场景,为发展描述实际执行过程的心理学理论提供了有益的尝试,也为将心理学研究应用于人工智能算法设计提供了示范性的案例。
[博士论文] 孙冲
信号与信息处理 大连理工大学 2018(学位年度)
摘要:近些年来,随着“城市大脑”概念的提出,作为其重要技术支持的视觉跟踪受到了越来越多的关注。标准的视觉跟踪算法侧重于在单个监控视角下对一个或一些目标进行持续的定位,并提供其位置及尺度信息。在民用领域,视觉跟踪技术可以有效地帮助城市管理者在大量的城市监控数据中实现对目标状态及轨迹的快速检索,极大地解放了人们的工作负担。在军事领域,视觉跟踪技术是无人机导航、导弹制导等尖端国防科技的重要组成部分。本文主要针对开放场景中的视觉跟踪问题进行研究,并重点探索结构化外观模型在目标出现较大形变及遮挡时的应用。本文主要贡献如下:
  提出了基于隐变量时空结构化建模的视觉跟踪算法。本文通过贝叶斯理论推导,将视觉跟踪任务建模成目标位置及遮挡状态估计的交替迭代优化问题。首先,在已知遮挡状态先验的情况下,将当前帧目标每个子区域状态及历史已跟踪视频帧目标状态定义为隐变量,并基于该隐变量引入时空树拓扑结构以同时考虑待跟踪目标的时间及空间结构化信息。通过基于隐变量的时空树拓扑结构,算法引入光流估计信息,进而可以提供更准确的目标运动估计。其次,在已知目标位置先验的条件下,本文同时考虑正负样本信息及时间一致性信息以建立判别遮挡模型。该模型可以有效地对目标遮挡状态进行检测,并减少外观形变、光照变化等因素对遮挡检测的影响。
  提出基于互补空间感知回归函数的视觉跟踪算法。本文探索深度特征的空间信息,并提出两个互补的具有空间感知模块的神经网络来提升模型的表达能力。首先,提出了带有加权交叉相似核函数的岭回归算法。相较于传统岭回归算法,本文的模型可以联合学习到岭回归系数及目标每一个子区域的可靠性,并考虑目标不同区域间的相似性关系,具有较强的处理非刚性形变的能力。本文分析了所提出的岭回归算法与神经网络的关系,并给出了其神经网络的等价形式。所提出的模型可以通过梯度下降算法端到端地训练得到,为未来将其融合到基于神经网络的特征学习框架中打下基础。其次,本文提出了具有空间约束核函数的卷积神经网络。通过令卷积核上的某些位置恒为0,本文算法使得每一个卷积输出只关注到目标的一个局部区域,进而增加了卷积神经网络的表达能力。最后,本文将两个网络(岭回归网络及卷积神经网络)的响应结合到一起作为最终的响应图,并根据该响应图确定目标位置。
  提出基于联合判别及可靠性学习相关滤波的视觉跟踪算法。本文探索相关滤波器中的结构化外观建模问题,将相关滤波器系数改写成了基滤波器及可靠性权重矩阵的哈达玛积,并利用基滤波器及可靠性权重矩阵分别学习分类器的判别及可靠性信息。首先,通过引入局部响应一致性约束项,本文使得所学习到的基滤波器可以均匀地强调整个目标区域,防止滤波器权重被分配到一个比较小的局部区域上,避免所学习到的滤波器系数分布被特征图支配。其次,本文通过交替迭代算法联合优化可靠性权重矩阵与基滤波器系数,使得算法可以自适应地根据跟踪过程中每个区域的表现分配可靠性权重。本文给出了所提出最优化问题的交替迭代解,并推导出傅里叶域的加速计算策略。
[博士论文] 王亚飞
微电子学与固体电子学 大连理工大学 2018(学位年度)
摘要:视线追踪,也被称为注视估计或者眼动跟踪,是利用电学、光学等各种检测手段获取被试的当前注视方向或注视点的技术。传统的视线追踪技术主要将转动机械、电极、镜片或者线圈等装置直接附着在被试的眼球表面,侵入性强,仅能应用于受控的环境中。而基于光学视频的视线追踪技术则利用眼球的光学特性,通过外部相机记录眼动信息,对人的干扰性小,应用范围更为广泛。基于光学视频的视线追踪技术经过近些年的快速发展,在光照均匀的室内环境下已经可以达到较高的精度。然而,在日常复杂光环境下,弱光、侧光、高亮、遮挡等现象,以及头部姿态的大幅度旋转等因素,严重干扰了视线方向的跟踪。
  本文针对复杂光环境下的视线追踪技术难点,依据人眼的注视特性,通过深入研究标注人眼图像的重要光视觉特征,提出了一系列人眼视线估计方法,解决了视线追踪关键技术中涉及到的人眼图像特征不鲁棒、训练数据集不充足、视线估计方法适配性不灵活、复杂环境中视线校准、大幅度头部运动下头部姿态补偿等问题。在此基础上,提出了真实驾驶环境下的驾驶员注视区域估计和自动校准方法,并验证了这一典型复杂光环境下视线估计方法的有效性。本文的主要研究内容和结果如下:
  (1)研究了基于人眼图像深度特征的视线估计方法,解决了复杂光环境下图像特征表观的鲁棒性问题。该方法结合了深度特征的特征提取方法和聚类再分类随机森林的特征回归方法,建立了具有稀疏激活特性的特征空间,并利用该特征空间学习预测注视方向。随机森林通过预先的聚类及分类策略来降低结点内的误差,对采样之后的数据使用完全分裂的方式建立视线回归模型。实验结果表明该视线估计方法在不同的光照条件下具有一定的鲁棒性和抗遮挡能力。
  (2)研究了结合卷积神经网络和生成对抗网络的真实化人眼图像生成方法,用于改善海量合成人眼图像的光照真实性,解决了复杂光环境下完备训练数据集不足的问题。该方法首先利用卷积神经网络初步增加具有高层语义信息的真实背景信息,然后利用生成对抗网络继续迭代学习,提高图像的真实性。实验结果表明利用真实化的人眼图像样本集训练基于人眼图像表观的视线估计模型,取得了更低的视线估计误差。
  (3)提出了一种基于近邻搜索的视线估计方法,可以更有效地适配于不同人眼图像数据集,解决了海量数据下视线估计模型的适配性问题。该方法结合头部姿态特征、瞳孔中心特征和人眼图像表观特征,构建了一个级联的三空间近邻搜索框架,以选择与待估计人眼数据更相关的近邻数据。实验结果表明基于近邻搜索的视线估计方法在不同光环境的人眼图像数据集上取得了理想效果。
  (4)提出了一种新颖的驾驶员注视区域自动校准方法,用于解决真实复杂光环境下驾驶员视线校准问题。根据车辆环境和驾驶员注视行为的特点,采用面部特征的三维空间信息估计头部姿态,使用辅助采样的粒子滤波方法在给定的状态空间上对驾驶员头部姿态进行追踪和学习,实现了驾驶员视线自动校准。实验结果表明该方法在头部姿态上估计误差低于2度,基本达到与手动校准相当的水平,可以满足与注意力相关的驾驶行为研究的需要。
  (5)研究了结合注视方向估计和头部姿态追踪的驾驶员注视区域估计方法,解决了真实复杂光环境下驾驶员视线追踪问题,并验证了基于人眼图像表观的视线估计方法的效果。利用场景深度信息进行背景分割,快速提取人脸区域三维点云模板,迭代计算人脸刚体区域的三维点云模板与预先采集的不同注视区域的三维点云模板之间的配准关系,得到头部姿态的偏移旋转矩阵分量信息,并对头部状态进行追踪学习以给出头部姿态估计值。实验结果表明该方法的视线估计误差小于8度,可以实现稳定的驾驶员注视区域估计。
[博士论文] 郭立
计算机应用技术 大连理工大学 2018(学位年度)
摘要:随着互联网医疗相关政策的实施,医疗资源作为海量网络信息中的一部分呈现出了“爆炸式”的增长趋势,各类医疗资源分析服务极大方便了患者就医,但随着信息量的极大增加,患者在海量信息中往往难以快速地找到自己所需要的有用信息,这也是“信息爆炸”和“信息过载”的互联网医疗中所体现出来的弊端。
  针对上述传统医疗领域的困难,本文从疾病分级、用药建议,以及医生推荐等问题出发,利用大数据挖掘的方法,提出了基于数据驱动的病程评估、用药风险预警、医生推荐等方法,主要研究工作如下:
  (1)基于动态时间匹配的RNN模型,研究慢性病病程分级预测方法。首先通过RNN模型对序列的相似性进行编码,并动态匹配数据中的时间模式,进而将来自两个序列的事件之间的相互关系看作二维域,通过门控循环单元(GRU)克服梯度消失问题,最终计算两个序列之间的相似性并动态匹配患者数据中的时间模式,即疾病的分级模式。
  (2)基于多任务回归模型,研究药品不良反应预测方法。首先把每一个具体的不良反应(DDIs)类型预测看作是一个任务,在对所有的任务采取适当的正则化的基础上尽量减小损失函数。为了解决优化问题,进一步给出了一种有效的近似梯度法,同时检测多个潜在的药物相互作用的类型。
  (3)基于文本挖掘和多标签预测模型,研究医疗医生推荐方法。首先对医生进行标签标注,使用了医学新词发现及医学命名实体识别等方法,进一步提出基于聚类抽样和频率抽样的方法对医生标签进行预测,从而将标签在所有医生范围内进行传递,最后,给出针对特定疾病的意思医生KOL排序推荐方法。
  通过研究智能医疗大数据分析的三个重要问题,对提高中国医疗信息服务水平,更好的满足患者对医疗信息的使用需求有很大的促进作用,为进一步合理配置医疗资源提供理论与实践支持。
[博士论文] 郭明
控制理论与控制工程 大连理工大学 2018(学位年度)
摘要:基于体感网的运动监测技术可以为用户提供有效的健康保护以及治疗手段,可以监测老年人日常运动,还可量化运动水平并为用户提供及时的生理信号反馈等。基于体感网的运动动作识别是最近几年新兴的一个研究领域,它主要利用传感器采集人体的生理信号,借助模式识别方法识别出不同的动作。
  本文基于多个惯性传感器节点采集的运动动作数据,针对运动动作识别过程中存在的一些问题展开了研究,主要研究内容如下,
  (1)提出了一种新的特征选择算法—改进的线性判别分析(MLDA)算法。传统的LDA特征选择算法在求解最优投影矩阵时存在误差扰动,本文提出的MLDA特征选择算法利用合同变换,解决了由于求解类内散布矩阵逆的特征值而产生的误差扰动,实验结果表明该算法可以有效的提高人体运动动作的识别精度。
  (2)提出了基于稀疏表示分类算法(SRC)和KSVD字典学习算法的KSVD-SRC分类器设计方法。如何提高运动动作的识别精度一直都值得深入研究。针对SRC算法中完备字典构造存在的缺陷,KSVD-SRC算法利用了KSVD对原始完备字典进行更新,有利于获得更稀疏的系数向量,实验结果表明本文提出的方法优于传统的分类算法。
  (3)提出了一种多分类器多传感器分层融合算法。利用单一的分类器识别多个复杂的运动动作不一定能够获得理想的结果,针对上述问题,本文设计了一个分层融合模型,该模型包括分类器融合层和传感器融合层。每层的决策权重主要由熵值法获得。该融合模型可以有效的提高识别系统的识别精度以及鲁棒性。
  (4)提出了一个基于多惯性传感器的运动动作数据流的分割与识别框架。传感器采集的数据都是以数据流形式存在,若实现运动动作的监测,需要对数据流进行处理。针对这一问题,本文首先利用奇异值分解对数据流进行预分割处理。然后利用提出的MSHsim相似度量函数实现数据的精细分割,最后利用隐马尔科夫模型对分割后的数据进行识别。该框架具有较低的计算复杂度,并且该框架考虑了传感器数据的特征,可以有效的提高数据分割与识别的精度。
[硕士论文] 李罚
地理学;地图学与地理信息系统 南京师范大学 2018(学位年度)
摘要:地下水作为环境的基本要素之一,是一种十分宝贵的资源,对地下水的研究关系到水资源的正确评价以及合理利用。地下水数值模型是刻画、表征和再现地下水系统的一种有效工具和常用手段,能够模拟地下水系统特征,以及解决在复杂水文地质条件和地下水开发利用条件下的地下水资源评价问题。在进行地下水模型模拟时,通常将研究区域含水层离散为网格单元,网格剖分往往只顾及研究区域的空间几何特征,对属性数据考虑不足;其次,在进行地下水模型模拟时,模拟的外界条件是变化的,而模型模拟过程空间离散网格一成不变,初始建立的网格不能很好的反映属性数据的变化特征。因此,模型模拟的计算精度将会受到影响。
  针对地下水模型模拟过程中存在的上述问题,本文开展了基于几何和属性特征约束的网格剖分算法研究,并进行不同空间离散网格条件下的地下水模型模拟实验,以验证本文网格剖分算法在地下水模型中的优越性。针对模型模拟外部条件的改变,本文综合考虑水文地质模型的几何空间特征和内部属性数据的动态变化过程,进行了基于特征约束集合变化下的地下水模型模拟研究。本文的主要研究内容与成果如下:
  (1)基于几何和属性特征约束的三角网生成算法研究
  在地下水模型模拟计算时,网格剖分往往只考虑模型模拟空间的几何形态,对属性数据空间分布特征的考虑有所欠缺。因此,本文在网格剖分时引入属性特征约束条件,通过模型模拟的属性特征约束构建网格剖分时的尺寸控制场,开展基于几何和属性特征约束的三角网剖分算法研究。
  (2)基于几何和属性特征约束的地下水模型模拟案例分析
  在基于几何和属性特征约束的网格剖分算法和地下水模型数据文件配置方案的基础上,本文开展了顾及不同约束条件下的地下水模型模拟实验。探究了顾及不同特征约束网格对地下水模型模拟精度的影响,验证了基于几何和属性特征约束下的三角网生成算法在地下水模型模拟的优越性。
  (3)基于约束集合动态变化的地下水模型模拟研究
  在地下水模型模拟过程中,模拟外界条件往往会发生改变,初始的空间离散网格往往难以满足模拟计算精度的要求。因此,本文针对模型模拟外部条件的改变,充分考虑约束的变化,进行了几何和属性约束集合变化下的地下水模型模拟实验并验证了基于几何和属性约束变化的地下水模型模拟的可行性。
[博士论文] 刘一宁
计算机应用技术 大连理工大学 2018(学位年度)
摘要:随着移动互联时代的到来,人们的消费习惯和信息获取途径正在发生翻天覆地的变化。推荐系统作为筛选个性化信息的有效手段,正越来越受到电子商务和信息门户网站的关注。然而,伴随着信息多样化程度和推荐任务规模的快速增长,推荐系统的发展面临诸多亟待解决的关键科学问题和技术挑战。本论文主要关注现有推荐系统对于信息的利用不够充分、缺少多任务知识积累和使用方法等问题,在总结现有研究成果的基础上,围绕评分与评论的时间动态、视觉图像和评论主题关联关系及推荐任务中的知识积累与使用这三个方面对提高推荐系统信息利用能力和推荐精度的问题开展研究工作。具体的研究内容和创新点总结如下。
  在评分与评论的时间动态研究方面,本论文主要聚焦于挖掘评论内容包含的项目时间特征,并提出了动态主题评分预测模型,该模型能够同时挖掘评论与评分的时间动态,提高评分预测精度。同时,研究评论中的时间动态还能够使人们了解项目评分的变化原因,从而追踪和解释用户的兴趣转移过程。该模型在训练中能自动将评论文本中的词语分为短期词汇和固有词汇,并将短期词汇与项目的短期特征关联,固有词汇与项目长期不变的固有特征关联。采用这种方法,该模型能够在一个学习过程中同时完成对用户及项目特征的学习和评论文本主题的挖掘。在28个收集自Amazon网站的真实数据集上的实验结果表明,该模型在评分预测精度上优于已有的主要评分预测模型。并且,该模型能够自动识别每个时期项目评论中有代表性的词汇,以及在所有时间内代表项目固有特征的词汇。识别这些词汇对于服务提供商理解用户对项目的兴趣变化过程具有重要意义。
  在视觉图像和评论主题关联关系的研究方面,本论文重点研究在视觉图像信息和评论文本中挖掘项目的潮流趋势特征的方法,提出了视觉感知动态评分模型。该模型借助对评论文本的挖掘,能够帮助推荐系统了解用户受到项目的哪些外在特征吸引,并能获知项目的哪些特征对其评分的贡献较大。本论文在评分预测模型中加入项目的视觉信息处理方法,同时提供了自动划分评论词语类别的主题模型用于识别评论中的视觉与非视觉词汇。
  在评分预测任务的知识积累与使用方面,本论文主要研究了基于终身学习机制构建推荐系统的方法。首先,本论文提出了能够挖掘评分数据的终身学习评分预测模型。该模型采用终身学习机制,专为多任务场景设计,能够在处理评分预测任务的过程中不断积累知识,并将知识用于对新任务的学习,提高模型在新任务中的预测精度。本文构建的历史知识库能够提取和储存任务处理过程中得到的知识,并在新任务中利用特殊设计的评分预测模型将知识融入训练过程。其次,本论文还提出了基于终身学习的主题与评分联合模型。该模型聚焦于评论文本的相关知识积累,并将积累的文本知识用于后续任务的训练,提高模型对新任务中评论文本的学习效率和评分预测精度。
[博士论文] 宋丹
计算机科学与技术 浙江大学 2018(学位年度)
摘要:由于游戏、动画等应用的需求,三维人体重建一直是计算机图形学的重要研究课题。近几十年来,研究员们围绕这一课题提出了多种方法,取得了丰硕的成果。由于三维人体模型在游戏、动画中具有较高的应用价值,所以可以容忍这些方法在采集设备、方式和重建效率上付出较高的代价。然而对于虚拟试衣的个人用户来说,这些方法在方便性及快捷性方面存在很多不足:(1)采集设备诸如扫描仪、Kinect,并不是普通用户的常用设备;(2)采集方式要求用户穿紧身衣或穿着很少,给用户带来了不便与尴尬;及(3)迭代优化人体模型使之贴合输入数据的方法非常耗时。
  本文围绕提升方便性及快捷性两个方面,攻克了一些难点。经过三个阶段性的研究,最终我们仅使用一部安卓手机或平板,拍摄用户正面及侧面两张照片,然后在数秒内便可以获得用户的三维人体。为了便于用户进一步编辑三维人体身材,我们提出了一个参数化的语义身材模型,并基于该模型重建及编辑三维人体身材。具体来说,本文的研究成果总结如下:
  我们提出了一种针对着装图像的快速衣服尺码估计方法。着装图像即图像中的人穿着日常衣服,以着装图像作为输入,一方面远离了普通用户很难接触到的扫描仪或深度感知设备,另一方面避免了用户由于穿着较少而产生的不便与尴尬。已有方法很难有效且高效地估计衣服遮挡下的身材尺寸。为了有效地去除衣服的影响,我们构建了一个含3套常见衣服、共6042×3个三维未着装及着装人体对的数据库,该数据库对人体身材估计及布料仿真领域的研究具有重要意义。为了高效地估计身材尺寸,我们设计了一组人体标志点,作为连接着装图像与身材尺寸的桥梁。基于构建的着装人体数据库,我们提出一种数据驱动的快速衣服尺码推荐方法。首先,我们回归图像中的人体标志点,其次根据标志点学习身材尺寸。最后,根据身材尺寸,自动地查询服装尺码表,便可推荐衣服尺码。实验结果表明我们的方法能够有效且高效地去除衣服的影响,进而估计衣服遮挡下的身材尺寸。
  我们提出了一种针对着装图像的三维人体重建方法。在网上购衣时,为了帮助用户决策及提升交易成功率,我们不仅需要准确的衣服尺码推荐,还需要生动可靠的穿衣视觉效果,这就要求重建出与用户身材一致的三维人体模型。针对着装图像引入的难点,我们采用上段所述的利用着装人体数据库和人体标志点的解决办法。与之不同的是,为了重建三维人体,我们先回归三维人体标志点,然后以三维标志点作为约束,优化求解参数化人体模型的参数。为了更有效地刻画标志点与着装人体剪影的关系,我们提出一个基于标志点的特征描述,改善了标志点回归结果。我们还做了丰富的对比实验来验证实现方面的关键配置,以进一步改进结果。在保证重建准确度的前提下,我们的方法大大提高了人体重建效率。三维标志点回归及三维人体重建过程共耗时不到4秒,而目前最快的针对着装图像的三维人体重建方法需要1分钟。
  我们提出了一种面向普通用户的便捷三维人体重建方法。先前两个阶段的工作均在PC机上运行,且需要额外的抠图工具(如Photoshop)从日常照片分割出着装人体作为输入,给用户带来了一定的不便。于是,我们基于移动设备开发了一个对用户友好的三维人体重建方法。由于移动设备相比PC机来说资源有限且计算能力较弱,所以需要更高效的人体重建方法。我们基于构建的着装人体数据库学习从着装人体剪影直接回归人体参数,而不是以点为约束迭代优化求解人体参数,该过程在一个普通的安卓手机上耗时约1.26秒。为了直接使用手机拍摄的照片,我们在移动端开发了一个对用户友好的交互抠图工具,用来从日常照片提取着装人体剪影。此外,我们还设计了避免相机标定的策略,进一步改善了方法的方便性。
  我们提出了一种参数化的语义身材模型,并基于该模型根据身材尺寸重建及编辑三维人体身材。已有参数化人体模型的参数对人体身材的控制不具备语义性,这里有语义的控制指如“腿变长”等直观的变形控制。我们根据身材尺寸将模板人体划分为若干部分,并基于数据库分析每个人体部分在对应尺寸变化方向上的顶点位置偏移,以学习语义基。为了更完整地表达人体空间,除了语义基外,我们还学习了非语义基。我们仅使用语义基表示训练库人体,然后计算其与Ground Truth人体之间的差异,通过分析这种差异学到的基为非语义基。语义基实现了模型参数对身材的直观控制,增强模型对局部变形的表达能力,而非语义基保证人体各部分之间的连贯性。我们还学习了身材尺寸与人体参数之间的映射关系,以根据尺寸重建或编辑三维人体身材。为了给用户提供便利,我们允许任意个数的尺寸信息作为输入,并采用一个基于相关性的方法根据已知尺寸预测未知尺寸。实验结果表明我们的方法减小了尺寸估计误差,展示了语义身材模型在人体重建及编辑方面的性能。
[博士论文] 张梦妮
计算机科学与技术 浙江大学 2018(学位年度)
摘要:在信息时代下,互联网促进了人类社会的发展,给人们的生活带来了极大改善。网站作为互联网内容的重要组成部分,已经成为人们获取信息、交互信息、利用信息的重要途径。然而大部分网站在最初设计时只关注信息通道交互顺畅人群的用户体验,忽视了信息通道受阻人群的特殊需求,使得残疾人、老年人、儿童等特殊人群在访问网站时困难重重。因此利用网站无障碍评估发现存在障碍的网页,并获取网站的无障碍水平成为信息无障碍领域重要研究课题。现阶段网站无障碍评估还不能实现完全自动化检测,大量检测内容需要人工参与。这种情况下,巨大的人工开销和漫长的检测过程使得无障碍评估无法大规模运用在各类网站上。为了解决这个问题,网页抽样方法被广泛引入,通过选取少量具有代表性的网页进行无障碍检测,使得检测内容得到大量压缩,极大降低人力开销,加快检测过程。但是,网站无障碍评估的特殊性使得已有的大部分抽样算法不能直接运用在网站无障碍评估中,且目前广泛使用在网站无障碍评估中的抽样方法仍存在一些尚未解决的难点和重点问题:1)抽样方法没有针对无障碍度量指标进行优化;2)抽样方法易受网站包含的网页数量、样本数量、无障碍度量指标等因素影响;3)在多网站同时无障碍评估时,已有样本数量分配方法会造成人工资源分配不合理,总抽样误差偏大等问题。
  本文主要针对网站无障碍评估中已有抽样方法尚未解决的难点和重点问题,提出了基于度量指标WAQM的抽样算法、基于主动学习的网站无障碍抽样和评估算法、基于多网站协同的网页抽样和评估算法,具体地:
  (1)针对现有网站无障碍评估中,抽样方法没有对无障碍度量指标进行优化,本文提出了一种基于WAQM(Web Accessibility Quantitative Metric)无障碍度量的抽样方法OPS-WAQM。该方法通过构建基于WAQM的误差模型,优化每层抽样数量,使样本的无障碍水平更接近网站真实的无障碍水平。针对快速网站无障碍评估的需求,本文还将OPS-WAQM方法进一步进行在线扩展。
  (2)针对抽样方法易受网站包含的网页数量、样本数量、无障碍度量指标等众多因素影响,本文提出了基于主动学习的网站无障碍抽样与评估方法。该方法首先通过主动学习选取具有代表性的样本网页,然后利用这些样本网页学习预测模型,最后通过预测模型得到所有网页的无障碍评估结果。
  (3)针对多网站无障碍评估任务中,已有抽样数目分配方法会造成人工资源分配不合理,总抽样误差偏大等问题,本文提出了一种基于多网站协同的网页抽样和评估方法。该方法根据网站本身的特性,为每个网站确定合适的样本数量和样本集合,合理分配人工资源,降低总抽样误差。
[硕士论文] 胡骏
工业设计工程 浙江大学 2018(学位年度)
摘要:近年来人们的生活水平逐渐提升的同时,自身的健康意识也被唤醒,从高科技的大型医用医疗仪器到普通的家用医疗设备都迎来了大幅度的需求增长。医疗设备的需求扩大直接导致了医疗产品的迅猛增长,越来越多的医护人员可以直接操控医疗设备进行诊断医治。界面作为人机关系的桥梁就变得越来越重要,而国内医疗设备的人机界面体验设计刚刚处于起步阶段,设计重心多在产品造型设计上,对人机交互界面设计的重视程度普遍不高,造成界面操作易用性差、误操作高、使用效率低等问题。本课题试着从认知心理学角度来解决医疗界面设计存在的问题。
  首先,本文阐述了认知心理学的发展状况,同时对界面设计和用户体验进行了相关研究。随后,基于对认知心理学核心的信息加工理论的调研,分析了信息加工论认知的四大构成系统,解析了认知心理与界面体验之间的关系,并提出了基于认知心理学的界面体验设计方法。进一步,通过对市场的调研与用户的研究之后,在认知体验模型框架下完成了界面设计实践。最后,用设计实现的原型进行了设计测试,取得了不错的满意度,为医疗设备界面设计提供了发展的新方向。
  本文研究的目的在于研究认知心理在界面体验设计上的体现,以医疗设备界面设计实践为实例来验证研究的可行性,试图找到界面体验设计的新方法。
[硕士论文] 黄永斌
控制科学与工程 浙江大学 2018(学位年度)
摘要:本论文主要研究昆虫扑翼飞行的观察与运动参数重建、昆虫悬停飞行的稳定性分析,以及PIV实验扑翼系统设计问题,旨在改进现有的昆虫壳体重建与姿态估计算法,给出变扑动频率的主动控制下昆虫悬停问题的分析方法,设计多自由度、能够实现精细化动作调节的PIV实验扑翼系统。
  针对昆虫壳体重建与姿态估计问题,本论文在昆虫全身为刚体、且身体截面为椭圆的假设下,基于椭圆半径曲线、身体中心线与翅膀轮廓线,对昆虫三维壳体进行了重建,并提出了先由昆虫飞行图像得到三维体素粗糙集合,估计位姿以作为初始状态,然后利用三维壳体投影进行匹配、精细搜索的位姿估计方法。对于昆虫飞行稳定性问题,本文应用准定常模型和叶素法重新建立了昆虫悬停飞行的空气动力学分析方法,在将原始的随时间变化的动力学系统,转换为随扑动角度变化的动力学系统后,应用平均理论得到了周期内的平均动力和力矩,根据小扰动理论得到了昆虫悬停状态下的扰动方程,并描述了基于Routh-Hurwitz稳定性判据的稳定性分析方法。对扑翼系统设计问题,本论文根据真实环境与实验环境要保持雷诺数和斯特劳哈数一致的原则,分析了用于PIV实验的仿真扑翼系统的设计准则,并分别阐述了仿蜜蜂扑翼机构和仿蜻蜒扑翼机构的设计思路,分析了扑翼机构的传动关系,引入了扑翼系统的控制系统。
  基于以上方法,本论文利用花蝇飞行数据集对昆虫壳体重建和姿态估计算法进行了实验验证,给出了壳体重建结果,估计得到了花蝇悬停飞行时的扑动角度变化曲线,发现在花蝇昆虫坐标系下,拍打角和摆动角有着相似的变化规律,证明了本章算法的有效性。针对稳定性问题,论文给出了一种仿蜂鸟扑翼机构设计方案,利用蜂鸟运动学与动力学参数分析了其纵向动力学系统在线性控制器下的稳定性,给出了控制器增益选择的稳定性区域。针对第三个问题,论文得到了扑翼机构尺寸大小和扑动频率之间应当满足的关系,提出了两种扑翼机构设计方案,给出了具体设计参数和其控制系统选型。
  本文的创新之处主要在于改进了昆虫姿态估计的方法,能够精细化估计昆虫飞行姿态;在昆虫飞行动力学系统变换的基础上,提出了针对变频率扑动控制悬停飞行的稳定性分析方法;设计了两种新型扑翼机构等。
[博士论文] 俞立呈
计算机科学与技术 浙江大学 2018(学位年度)
摘要:随着CPU和GPGPU在各种环境下得到应用,人们逐渐发现这两个处理器各自的独特优势。为了实现优势互补并支持更广泛的场景,由CPU和GPGPU组成的异构多处理器系统受到关注。其中CPU和GPGPU共享最后一级缓存(LLC)的片上紧耦合系统能实现更细粒度的交互。然而简单地将CPU和GPGPU连接到共享LLC时两种处理器在访存行为上的差异性导致数据共享效率受限,并不能充分发挥异构多处理器系统的计算能力。
  本文首先分析了CPU和GPGPU使用共享LLC进行数据交换时的访存特征。发现简单的缓存替换策略并不能提供最高的数据交换效率,会产生缓存抖动问题,中间暂存数据被写入内存也会引入不必要的内存事务并浪费了内存带宽。此外传统的交互模式往往造成一方处理器空闲等待对方提供数据,无法有效地实现数据生成和计算的重叠。为了解决这些问题,本文提出使用固定大小的元素作为数据交换单位,并在LLC中实现硬件管理的共享数据队列以支持基于元素的数据共享。进一步提出元素-原子的数据组织方式以移除元素大小限制,配合访问协议支持GPGPU大规模乱序访问。同时还使用后备存储避免死锁同时保持访问低延迟,并在共享数据队列中实现了低代价的全局同步。
  在使用传统LLC进行数据交换时,本文发现CPU和GPGPU的算法常常偏好不同的最优数据存储布局以满足各自不同的局部性,导致数据存储布局冲突。已有的转换方法会污染转换处理器的缓存、引入额外的转换代码执行或管理代价。本文通过在共享LLC中加入访存地址重映射实现体系结构辅助的自动转换。于是运行在不同处理器上的算法始终可以它们各自的最优数据存储布局访问共享数据,并充分利用各的自私有缓存。由于处理器不再直接进行布局转换,CPU或GPGPU代码中也不再需要加入额外的管理代码。其次,本文使用可编程的重映射控制器实现灵活的数据存储布局转换,移除了对数据大小和只支持特定目标布局的限制。
  根据GPGPU并行访存的特征,本文指出其访存过程中存在大量的仿射计算,即各线程执行完全相同的内存地址计算,只有作为输入的线程ID有差异。这种冗余计算导致GPGPU的计算资源浪费且不利于对访存统一调度。因此本文提出访存分离计算,由CPU生成仿射计算参数,交由共享LLC计算各线程的实际访存地址,并生成相应的访存请求。LLC最终将数据经过访存融合后推送给GPGPU的各线程。因此访存分离计算移除了GPGPU代码中大部分的访存地址计算和访存操作本身,将更多GPGPU的计算资源保留给实际工作,提高了系统效率。
  最后,本文使用模拟器环境验证提出的优化方法。其中共享数据队列相比传统的数据交换方法加速了48%,而CPU和GPGPU的平均全局同步时间分别缩短到21%和38%。使用共享数据存储布局重映射后,测试程序的平均执行时间降低到69%;相比于使用CPU和GPGPU进行数据存储布局转换,使用本文的方法的平均转换时间分别减少到58%和46%。访存分离计算则将运行时间平均降低到48%,GPGPU平均执行的指令数下降到84%。实验表明,本文提出的优化方法从不同角度提升了CPU和GPGPU在共享LLC架构下的数据共享性能。
[博士论文] 刘宝龙
数字化艺术与设计 浙江大学 2018(学位年度)
摘要:水路航运自古以来就是人类最重要的交通运输方式之一。在经济全球化的当今时代,水路航运承担着全球三分之二以上的贸易货物运输量。随着船舶使用量的不断增长,船舶碰撞、违法逃逸、海洋环境污染等一系列水路交通事故的发生频率也越来越高。如何对船舶进行准确身份识别、加强水路交通监管、提高水路运输安全性具有重要研究价值。
  图像分析、深度学习等人工智能相关技术在车牌识别、自动驾驶等陆路智能交通系统中已经取得了许多重要进展。然而,相关技术在水路智能交通领域的应用仍然比较缺乏。船舶是水路航运最重要的载体。船名标识是船舶最重要的身份识别信息之一。船名标识字符的自动化识别可以为船舶身份识别和船舶交通行为监控等任务提供有力的技术支持。本文对基于图像分析和深度学习的船名标识字符检测与识别这一课题做了一定的探索,主要工作总结如下:
  (1)提出两个船名标识字符基准数据集——ZJUSHIPS950和ZJUSHIPS60K,并提出了较为科学的船名标识字符检测与识别算法评价标准,解决了船名标识字符基准数据集和算法评价标准缺失的问题。ZJUSHIPS60K船名标识数据集包含67873张可用于船名标识检测算法测试和训练的船舶图片,同时包含了39053张可用于船名标识识别算法测试和训练的船名标识图片。ZJUSHIPS60K包含的图片由智能交通摄像机实景抓拍。ZJUSHIPS950是一个包含多种类船舶的船名标识检测数据集,其包含了950张货船、客轮、游艇、军舰等船舶的图片。以上船舶图片在获取时考虑了不同船舶类型、不同船名标识风格、不同图片分辨率、不同背景、不同季节、不同时段、不同光照、不同角度等影响因素。所有船名标识被人工进行了标注,以用于算法的训练和测试。统计和分析表明,以上两个船名标识数据集,特别是ZJUSHIPS60K,在数据分布上比较均衡、比较具有代表性。目前,ZJUSHIPS950和ZJUSHIPS60K数据集已经开源。
  (2)提出了一个引入格式塔理论的多语种船名标识字符检测方法。格式塔理心理学是西方现代心理学的重要流派之一,其不仅揭示了人类对外界事物的感知方式,也反映了人类以符合格式塔完型规则的方式来设计和制造事物。船名标识往往体现出较强的“格式塔”特征。不同船舶的不同语种船名标识包含的字符在颜色、字体、大小、宽高比和数量等方面经常表现出较大差异性,这种差异性给船名标识的检测任务带来较大困难。通过对船名标识字符更抽象的“格式塔”特征的分析和提取,我们提出一个在更高层次上对船名标识进行检测的方法。具体地,我们首先对船名标识字符的格式塔特征进行了总结。然后,通过设计合理的度量算法,分别进行了多语种文本粗检测、船名标识字符精定位、伪船名标识字符去除和漏检字符补全过程。最后,在ZJUSHIPS950数据集上的实验测试结果验证了该多语种船名标识字符检测算法的有效性。
  (3)提出了一个基于深度卷积神经网络迁移学习的船名标识字符检测方法。在进行船名标识检测时,船名标识的数据量不足、字符过小、尺度复杂和多行印刷特点也具有较大挑战性。首先,针对数据量不足的问题,我们基于深度卷积神经网络迁移学习的船名标识字符检测思路,分别进行了参数迁移学习和关系迁移学习。其次,针对符过小、尺度复杂问题,提出了模型金字塔船名标识字符检测机制,通过构建一个模型金字塔来进行小分辨率、多尺度船名标识字符的检测。最后,针对船名标识字符多行印刷问题,进行了船名标识字符检测结果后处理。实验结果表明,迁移学习、模型金字塔和检测结果后处理三者协调统一、相互补充,它们在整体上能取得较高检测准确率,同时还能保证较低的误报率。
  (4)提出了一个包含不定长字符的多行印刷船名标识布局归一化与非分割式识别方法。在设计船名标识字符识别算法时,船名标识字符的多行印刷、长度不固定和难以分割问题是我们面临的主要难点。针对以上难点,我们首先提出了一个船名标识字符归一化算法,通过算法将多行印刷的船名标识字符归一化到相对水平的同一行,提高船名标识的可识别性。然后,基于联结主义时序分类模型,提出一个基于深度卷积循环神经网络的船名标识字符识别模型,该模型由卷积层、空间变换层、循环层和转录层四个子模块组成。最后,在ZJUSHIPS60K船名标识字符识别数据集上的实验表明,该模型在船名标识字符识别任务上取得了较高的识别准确率和较低的平均编辑距离,超越了相关方法。
  (已选择0条) 清除
公   告

北京万方数据股份有限公司在天猫、京东开具唯一官方授权的直营店铺:

1、天猫--万方数据教育专营店

2、京东--万方数据官方旗舰店

敬请广大用户关注、支持!查看详情

手机版

万方数据知识服务平台 扫码关注微信公众号

万方选题

学术圈
实名学术社交
订阅
收藏
快速查看收藏过的文献
客服
服务
回到
顶部