绑定机构
扫描成功 请在APP上操作
打开万方数据APP,点击右上角"扫一扫",扫描二维码即可将您登录的个人账号与机构账号绑定,绑定后您可在APP上享有机构权限,如需更换机构账号,可到个人中心解绑。
欢迎的朋友
导航
万方知识发现服务平台
获取范围
  • 1 / 1
  (已选择0条) 清除 结果分析
找到 7 条结果
[硕士论文] 赵沐为
计算机应用技术 东南大学 2014(学位年度)
摘要:不断发展的生物实验测定技术产生了越来越多的生物网络数据,比如蛋白质相互作用网络、基因转录调控网络等,这些数据中蕴含了大量的关于各种有机体之间相互影响和相互作用关系的信息。如何解释和分析此类生物网络数据,已经成为当前生物信息学领域的一个亟待解决的问题。其中,有一类重要的研究工作就是生物网络数据的比较,即生物网络比对。生物网络比对,简言之就是要寻找两个(或多个)生物网络顶点之间的一组映射关系,使得生物网络之间的相似性得分最高。
  值得注意的是,由于一些原因,比如生物网络中相互作用模块的规模、密度、冗余度以及模块间的距离,甚至生物实验的误差,都会导致测量得到的数据不完全准确,使得其中含有许多不确定事件(概率事件),比如蛋白质相互作用网络中的边是以一定概率存在的,基因转录调控网络中的DNA也是以一定概率被转录成为RNA的。因此,在生物网络比对过程中,充分考虑和利用不确定信息,使用不确定图结构刻画原始网络,可以更准确地对现实情况进行建模,从而得到更准确的比对结果。然而,由于不确定图的概率特性,这些不确定信息在提高比对结果准确性的同时,也提高了算法的复杂度。目前绝大多数的生物网络比对算法都是针对确定生物网络比对问题而设计的,仅有极少数的算法可以处理不确定生物网络数据。因此,本论文针对不确定生物网络比对进行了研究,主要工作包括:
  1、本文提出了一种改进的不确定生物网络比对算法PBNA(Probabilistic BiologicalNetwork Alignment)。在确定生物网络比对算法IsoRank的基本框架之上,PBNA将不确定生物网络信息纳入到顶点相似性矩阵构建过程中,允许参与比对的两个网络中有一个为不确定网络,之后应用邻居二分图(NBG)和贡献者(Contributor)改进了相似性矩阵计算公式,从而提高了顶点相似性计算的精度,并应用概率母函数降低了求解矩阵内每个元素期望的复杂度。实验验证了PBNA能够得到现有的确定生物网络比对算法得不到的比对结果,并以我们所知的现存唯一的不确定比对算法Prob为参考标准,验证了PBNA可以在更短的时间内得到更具生物意义的比对结果。
  2、现有的Prob算法和PBNA算法仅能够利用到一个生物网络中的不确定信息,即只允许参与比对的两个网络其中一个是不确定网络。因此,本文进一步提出了“完全的不确定网络比对(Complete Probabilistic Alignment)”概念,并将现有的Prob算法与PBNA算法分别改进为完全不确定比对算法Prob CP与PBNA CP。两种改进的算法分别在原算法的基础之上,将之前被忽略掉的一个网络中的不确定信息纳入到顶点相似性矩阵构建过程中,并利用离散随机变量相关理论求其期望值,参与之后的运算。实验结果验证了两种扩展算法的有效性,并比较了二者的生物意义和时间效率,再次验证了加入Contributor等概念的PBNA_CP算法能够得到更具生物意义的比对结果,以及有着更高的时间效率。
[硕士论文] 陈大蔚
计算机应用 东南大学 2014(学位年度)
摘要:近年来,越来越多的研究人员把注意力转向了复杂生物网络。其中一项重要的目标就是理解生物网络中各种结构的意义。经过大量的研究后人们发现,虽然在大规模的生物网络中各结点之间的接连关系看似毫无规律,但是其中有很多频繁出现的子结构,并且这些子结构出现的次数明显超过随机生成的图中出现的次数。通过实验验证,这些子结构通常具有很显著的生物意义,这类子结构被定义为模体。
  通过对模体的研究,可以帮助研究者们更深入的了解复杂的生物系统。例如蛋白质功能预测,癌症基因的识别等。此类研究不仅对生物医学的发展有着巨大的促进作用,并且引起了复杂网络研究和社会统计学等领域的广泛关注,是目前生物信息学研究的重点之一。很多传统的算法都是挖掘确定模体的,而生物网络中存在固有的不确定性决定了模体本身可能存在概率信息,传统的确定模体无法表达这种生物意义,为此研究者们提出了带有概率信息的共有模体概念。在生物网络上的实验表明,共有模体确实可以表达出网络模体的中的不确定信息,更具有真实的生物意义。
  因此,本文针对共有模体的挖掘进行了研究,主要工作包括:
  1.提出了一种新的聚类方法CBOS(Clustering Base On the Score)算法来挖掘生物网络中的共有模体,通过将子图权重和子图间错配距离结合起来得到一个得分函数,来决定一个子图是否应该被聚类,因为成为模体的子图一般具有很大的权重,所以通过这个打分函数可以将更有可能成为模体的子图优先聚类。在转录调控网络E.coli和S.cerevisiae数据集上的实验结果证明我们的CBOS算法可以很好的挖掘出有意义的共有模体,并且算法具有良好的时间复杂度。
  2.CBOS算法是基于层次聚类的思想,所以CBOS算法无法解决层次算法一些固有的不足之处:(1)层次聚类无法应用模糊聚类。(2)层次聚类无法挖掘出聚类中心过近的聚类簇,而生物网络中常常出现距离较近的聚类中心。为此,我们提出了G-fuzzy(Graph fuzzyk'-means)算法,该算法将k'-means算法中的对手惩罚机制应用到模糊聚类中,使得算法可以自主的收敛到正确的聚类数K上,并且基于划分的聚类思想使得算法结果不再以聚类中心之间的距离作为度量值,避免了将距离较近的聚类合并为一类。在E.coli和S.cerevisiae上的实验结果表明G-fuzzy算法对输入参数不敏感,具有很好的健壮性,对聚类结果的分析证明G-fuzzy算法可以挖掘出层次聚类无法得到的有意义的共有模体。具有很好的实用价值。
[硕士论文] 夏靖
计算机科学与技术 中南大学 2013(学位年度)
摘要:在生物信息学领域,对生物数据进行分析是极其重要的一个过程。随着数据量的增大,对生物数据分析的耗时越来越长,严重制约了相关理论设想的验证。CPU-GPU协同计算,能够以较小的代价,组建一个高性能计算平台,加快数据分析与处理的速度。
  本文针对大量生物数据分析中硬件资源利用率低,计算耗时长的问题,在经过技术、性能以及资金消耗多方面的权衡下,提出了利用多核CPU与GPU搭建一个CPU-GPU协同计算平台的方案。平台采用OpenMP实现对多核CPU的编程,采用CUDA实现GPU并行程序的编写。并针对平台硬件的特征,提出了几种数据预处理与任务分配的策略,能够最大限度的缩减生物数据分析的处理时间,为研究提供支撑与促进作用。
  本文旨在解决标签SNP选择仿真实验以及DTI计算与预测两个具体的生物数据分析问题。本文通过对现有标签SNP选择算法进行分析,提出了HTag算法,并对该算法进行了并行化的具体实现,不仅使标签SNP的数量减少,而且使运行时间大幅缩短。本文针对NetCBP算法执行效率低的问题,对该算法过程进行了详细的分析与拆解,使之适合并行化。通过并行化使单药物DTI计算的时间缩短,并考虑到多药物同时计算的情况,通过并行任务调度缩短了多药物同时计算的时间。
  实际应用计算表明,利用CPU-GPU协同计算可明显缩短生物数据分析的计算时长。在对其他领域的数据分析处理中,也具备一定的参考价值。
[硕士论文] 田德朝
概率论与数理统计 东北师范大学 2011(学位年度)
摘要:在系统生物学,网络是一个分析结构型数据的越来越重要的手段,比如分析蛋白质网络。实验生物技术的发展产生了大量的蛋白质网络,这些网络的拓扑结构被认为和蛋白质网络的功能有很强的联系。这些大量的数据促进了计算技术在网络模型的发展。合适的有代表性的模型会提高人们对细胞的认识。为了判别一个模型是不是有代表性,需要对模型与实际网络进行数量上的比较,但是精确地比较是很棘手的,所以人们提出了很多启发性的拓扑统计量比较网络,但是对于拓扑统计量对网络特征的提取人们所知甚少。在文章中,对于拓扑统计量进行了分析,并基于这些统计量提出了一种有效分离无尺度模型和几何模型的方法。
[硕士论文] 赵斌
科学技术哲学 山西大学 2007(学位年度)
摘要:生物学哲学属于科学哲学的一个分支,而且是相对于其它分支比较另类的一项。从赫尔开创生物学哲学研究以来,以及迈尔、索伯、鲁斯、胡文耕、桂起权等一大批国内外著名的生物学哲学家的努力,其研究体系、研究方法渐渐走向成熟、研究方向趋于明确。同时,随着生物科学自身的发展不断加快,如何能从更好的角度出发,来把握整个生物学哲学发展趋势无疑将成为焦点。长期以来,科学哲学家们往往被数理逻辑的形式主义所左右,生物学科学本身的合理学科地位也由于还原主义者的影响而受到怀疑。迈尔将这些观点分为了三类:结构还原论、解释性还原论以及理论还原论,甚至纳格尔都是理论还原论的拥护者。另外,分子生物学产生以来所取得的辉煌成就往往被认为是还原论的胜利,虽然它只涉及了结构还原论。这也正是文章以分子生物学为着眼点的原因。这些质疑无疑也为生物学哲学提供了战场,无论是从学科的理论史方面还是学科研究的方法论史方面都体现了对生物学和生物学哲学的辩护。尽管早在赫尔的研究中就已经开始从科学解释学的角度来论述生物学哲学中的问题,但之后的尝试不是不够彻底就是缺乏延续性,没有构成真正意义上的生物学的科学解释学研究,因此,在生物学哲学研究中进行这一尝试,尤其是从符号表达体系入手无疑具有很强的启迪意义。 科学解释学不同于传统的哲学解释学,前者更偏向于对科学说明的研究,其主要观点认为,无论科学家或自然都是内在的嵌于历史性之中的,这种历史性具体体现在科学传统对科学研究的制约作用。尽管科学理论不断经历变革,但科学传统则是表现出相对的稳定性。在生物学内同样也不例外,这种传统具有广义的内涵,在长期的学科研究历史中沉淀形成,包括仪器设备、实践技能、表达方式、交流手段和认知旨趣等等。它无疑在学科体系内形成了一个广义的标准,潜移默化般的影响着科学家的研究。因此,对于生物学中形成的这种传统,文章更倾向于将其看作为一种广义语境。此外,依旧结合科学解释学的观点,对于生物学业已存在的知识体系,其表达本身依托于学科所形成传统之下的解释语境。因而在此看法基础上可进一步得出,对于整个生物学研究发展的历史以及学科范式的演变来说,其根源都可视为学科解释语境的演变。 相比其他学科,生物学属于多元科学,这意味在解释文本以及解释结构上同样具有多元性。此外,生物学有着更加广泛的研究领域,甚至有很大一部分处于传统数理科学和社会科学的交汇地带,这意味着传统逻辑实证主义的科学解释观终将无法很好的解决生物学哲学中遇到的问题。因为这种解释观将科学解释看做是一个无主体、无旨趣、无意向的过程,在科学解释与人文、社会科学解释的关系上坚持了科学主义的立场,所以往往造成种种理论偏失。因此,只有把握好理解与解释的关系才能真正的理解科学解释,从本体论、认识论和方法论三个层次建立完整的知识体系,并通过将解释语境概念引入生物学知识体系,作为体系内部的具体划分依据,从而在生物学哲学的解释学研究中,引入语境化的分析方法,以实现学科的整体解释有效性。
[博士论文] 顾祖光
生物化学与分子生物学 南京大学 2012(学位年度)
摘要:系统生物学是近二十年涌现出的一门新兴学科,它从一个崭新的视角来观察和研究生物系统。与基于还原论的分子生物学研究不同,系统生物学试图从整体上通过整合不同层次的生物数据和信息来了解生物系统的属性、结构和行为。系统生物学依赖于海量数据的处理和高通量技术的发展,同时也需要生物学、计算机科学、统计学、物理学等多学科的深入交叉融合,对21世纪的生命科学来说,是机遇也是挑战。本文针对基因表达调控这一重要的生命活动机制建立了一系列基于基因表达谱的系统生物学分析计算方法,并尝试肝癌基因调控的网络研究。具体分为三部分:
  1.SiGPAT基因集合分析方法的建立。生物系统基因表达显现复杂多变的特征并伴随广泛的随机变化信号,我们期望从复杂的基因表达谱数据中识别发生显著变化的生物功能。对这些功能的了解,可以帮助研究人员将注意力集中到最为重要的一组基因上去,从而细致研究它们的作用机理。基因集合富集分析方法的用途是从基因芯片数据中寻找当生物系统在外在环境发生改变后,被显著影响的生物功能和生物通路。本文首先对基因集合富集分析的方法论进行了详细论述,以模块化的方式对各种分析框架进行了详尽的描述。针对现有基因集合分析方法的不足,提出了一个新的统计模型,用来寻找具有显著表达模式的基因集合。对每个基因集合,通过分析其中基因的上调趋势和下调趋势来确定这个基因集合的表达模式和显著性。通过模拟实验表明我们的模型能够正确地识别出各个表达模式的基因集合,对两组真实的基因芯片数据集的分析表明,我们的模型能够找到与生物问题紧密相关的基因集合,并且在基因芯片数据分析中具有很高的稳健性。
  2.CePa生物途径富集方法的建立。生物途径包含着更为重要的生物分子之间的复杂作用,是一类特殊的基因集合。在生物体中,生物途径是一组基因或者分子,以化学反应、分子修饰或者信号传导的方式来实现特定的生物功能。在整个生物系统中,生物途径是作为子网络而存在的。因此,我们提出一个新的基于现有生物途径富集方法的扩展,在其中集成了生物途径的网络拓扑学信息。我们的模型突出关键基因在生物途径网络中的地位。此外,为了更准确地表述真实的生物情况,我们使用了网络节点作为分析的基本单位。这是因为在真实情况下,基因产物必须要组装成为复合物才能在生物系统中发挥正常的功能,而只要其中的某个成员基因失常,整个复合物的功能就会受到严重影响,从而对生物途径造成影响。我们使用模拟数据展示了不同的网络结构和不同的中心性度量是如何影响生物途径的显著性;对真实的基因芯片数据的分析表明我们的方法与现有方法相比能够更好的找到与生物问题紧密相关的生物途径。
  3.肝癌基因调控网络构建方法与系统分析。我们尝试从系统的角度对特定疾病的基因调控网络进行分析,试图在整体水平上揭示生物系统中最为重要的基因调控机制。我们重构了肝癌的基因调控网络,其中的调控子同时包含了转录因子和microRNA。我们使用了多种数据源:1)基因表达谱数据;2)经过实验支持的基因相互作用;3)基于靶点预测的基因相互作用。这些不同的数据源从不同角度描述了基因与基因之间的相互作用,而同时集成这些数据源,可以取长补短,最终筛选出可靠的相互作用关系。基于转录因子和microRNA作用机制的不同,我们在模型中为这两种调控子分别进行参数选择和优化。对基因调控网络的分析表明,肝癌中的基因调控是高度模块化的。其中microRNA主要调节线粒体和氧化还原相关的生物功能,而转录因子主要调控免疫响应、细胞外活动和细胞周期相关的生物功能。我们还发现存在着一个核心基因调控网络,其中包含全网络中最重要的调控关系,承担调节不同网络模块间信息交流和维持整个网络稳健性的功能。核心网络中大部分的节点都已被实验验证。我们相信该核心网络反映的相互作用和重要节点是认识肝癌调控机制的关键,并可作为下游实验生物学研究的基础。
  本文采用逐步递进的路线,从揭示基因调控系统基本的功能属性开始,进而分析系统的局部结构,最后对特定生物系统的整体结构进行深入研究,发展了一系列有效的计算方法和分析流程,并成功应用于分析肝癌基因调控网络。随着高通量基因检测技术的普及,本研究的成果将在各种疾病分子机制研究、新药机理研究中发挥广泛的作用。
[硕士论文] 黄利辉
情报学 中国科学技术信息研究所 2000(学位年度)
摘要:生物信息学是用数理和信息科学的观点、理论和方法去研究生命现象,组织和分析呈指数增长的生物学数据的一门学科.目前网上生物信息学资源与日剧增,各类数据库、分析软件及综合性网站大量涌现.因此有必要对网上生物信息学资源进行系统的分析研究和开发利用.该课题从两方面对Internet上的生物信息学资源进行分析;首先比较分析了目前网上的主要生物信息学资源的类型、组成、使用效果及其局限性,对常用的信息检索系统ENTREZ与SRS、序列分析软件 BLAST与FASTA的使用效果进行测试分析.测试结果显示了它们之间的差异;然后以对用户进行问卷调查的方式研究网上资源利用过程中存在的问题,并开发一个结合分类和关键词方式进行检索的搜索引擎框架,为用户使用Internet上分散的生物信息学资源提供帮助.
  (已选择0条) 清除
公   告

北京万方数据股份有限公司在天猫、京东开具唯一官方授权的直营店铺:

1、天猫--万方数据教育专营店

2、京东--万方数据官方旗舰店

敬请广大用户关注、支持!查看详情

手机版

万方数据知识服务平台 扫码关注微信公众号

学术圈
实名学术社交
订阅
收藏
快速查看收藏过的文献
客服
服务
回到
顶部