新书上架丨《人工智能在生物信息学中的应用》
随着大数据、物联网和云计算的迅速发展,当今社会已从信息时代逐渐步入智能时代,人工智能技术已经渗透到生命科学研究的各个层面,例如,在生物组学研究领域的成果层出不穷,采用人工智能方法对多组学数据进行整合分析研究,已成为科学家探索生命奥秘和疾病机理的新方向。因此,《人工智能在生物信息学中的应用》(雷秀娟,潘毅著. 北京:科学出版社,2023.10)一书的出版正当时。
▋人工智能在多组学数据分析中的应用
随着科学研究的发展,人们发现单纯研究某一方向无法解释全部生物医学问题,科学家提出从整体的角度出发去研究人类组织细胞结构、基因、蛋白质及其分子间的相互作用,通过整体分析反映人体组织器官功能和代谢的状态,为探索人类疾病的发病机制提供新的思路。
▲ 多组学研究
多组学融合技术是指结合两种或者两种以上的组学数据集来研究生物系统中多种物质之间的相互作用。将多组学数据进行整合,能够从大量并且繁杂的多组学数据中找到它们之间的内在联系,帮助人们全面地认识生命系统,对研究生命科学问题具有重要意义。由于组学数据是异质异构的,具有不同的维度、类型和格式,因此很难进行融合。现有的整合研究手段主要有基于统计的方法、基于机器学习的方法、基于深度学习的方法,后两种方法属于人工智能方法。
▲ 多组学数据整合分析的人工智能方法分类
在进行多组学数据融合时,通常首先需要提取多组学数据的特征。特征提取主要分为结点自身的生物属性特征和从关联网络中提取到的特征。前者主要考虑生物学意义,后者主要考虑网络中结点的拓扑信息。
生物的属性特征主要表征生物实体自身的特性,例如,基因的特征可以通过基因表达数据或基因本体信息来获得;RNA的特征可以通过将序列信息编码为数字特征向量来获得;蛋白质的特征可以通过挖掘基因和蛋白质关联的数据或自身的蛋白质相互作用(protein-protein interaction,PPI)网络来获得;基于三维化合物结构和分子指纹信息可以将化合物的分子结构量化为一系列的值,并以此作为药物的特征。
此外,基于网络来提取特征的方法也备受关注。基于网络传播类的方法有随机游走、PageRank、LeaderRank、HeteSim等。表示学习类算法如DeepWalk、Node2vec、Metapath2vec等。矩阵分解类的方法也被广泛使用,如概率矩阵分解和归纳矩阵完备化。图神经网络方法有图卷积网络(graph convolutional network,GCN)、图注意力网络(graph attention network,GAT)、图自编码器(graph autoencoders,GAE)和图生成对抗网络(generative adversarial network,GAN)等。
▲ 基于网络的多组学特征提取方法
基于人工智能的多组学数据整合分析的应用十分广泛,它可为精准医疗与医药研发提供有效的途径。目前人工智能和多组学数据的研究如火如荼,通过人工智能方法来研究多组学数据也可以加速新药研发,人工智能生物制药公司也在利用其独特的优势推动个性化医疗的发展,我国生物信息领域的研发能力已经接近或领先世界水平,我们正在进入一个由人工智能驱动的崭新时代。
▋人工智能与生物医药
近年来,人工智能技术正在融入生命科学的各个领域,已经成为临床诊疗中的重要工具,在新药研发领域也有着广阔前景。众所周知,新药研发是一个成本高昂、周期漫长、充满风险的过程。高通量技术的发展和应用产生了丰富的药物、疾病、基因和蛋白质等数据,使得人工智能药物发现成为可能。人工智能技术与分子动力学、物理、化学等技术的结合,将有助于提高药物发现与发展这一关键环节的效率与成功率,从而降低新药研发成本,为新药研发带来了新的发展动力。
▲ 人工智能技术在药物发现中的应用
人工智能技术在药物发现过程中有三个主要阶段(药物研发、临床研究、审批上市阶段),使用人工智能方法有助于缩短药物发现所耗的时间,提高药物发现效率。在药物研发阶段,利用机器学习、深度学习等算法可以识别药物靶点,筛选先导化合物,并进行结构学习与药理预测,进而生成新的药物化合物;在临床研究阶段,基于人工智能的图像处理等技术能及时跟踪病人的体内变化,宏观了解健康状况;在审批上市阶段,则可以利用大数据智能计算来为新药找寻市场定位。
← 左右滑动查看 详细信息 →
《人工智能在生物信息学中的应用》一书基于作者团队近年来的相关研究成果,运用人工智能方法对组学数据分析问题进行了全新阐述,力图为读者提供一些解决问题的新方法与新思路。本书首先对多个组学的基础知识和现有数据库进行了详细描述,继而对所涉生物网络构建方法、相似性计算方法等进行了归纳整理,并对研究中所涉及的人工智能算法如群智能优化、机器学习和深度学习等进行了概述,涵盖优化、聚类、统计、图神经网络和算法设计等多方面的知识。本书力求结构清晰、图文并茂、深入浅出,简明易懂,使初学者能在短时间内了解其感兴趣的生物组学数据以及相关人工智能方法的具体应用。
本书分为基础篇和应用篇,在基础篇,主要介绍组学的基本知识和数据、生物网络的特性与相似性计算、智能优化算法、机器学习、深度学习等人工智能算法。在应用篇,讲述人工智能算法在蛋白质复合物挖掘、关键蛋白质识别、疾病基因预测、非编码RNA与疾病的关联关系预测、circRNA与RBP结合位点预测、代谢物与疾病关联关系预测、微生物与疾病关联关系预测及其在药物发现中的应用等。
风劲帆满海天阔,科技创新正当时。《人工智能在生物信息学中的应用》一书的出版恰逢其时,作者结合近年来的研究工作全面系统地总结了这一领域的最新研究成果,具有一定的学术价值和实际意义。该书有望助推人工智能和生物信息交叉学科的蓬勃发展。
习近平总书记高度重视科技工作和家国情怀,家国情怀是新时代高校师生最基本的素养。人工智能 与生物信息学的研究必须与国家重大需求相结合,必须更加高效地应对科研范式变革所带来的新挑战。相信该书的出版不仅可以为交叉学科的研究添砖加瓦,在人才培养方面也会发挥应有的作用。
戴琼海
中国工程院院士
中国人工智能学会理事长
2022 年12 月
本文摘编自《人工智能在生物信息学中的应用》(雷秀娟,潘毅著. 北京:科学出版社,2023.10)一书“第1 章 绪论”“前言”“序”,有删减修改,标题为编者所加。
ISBN 978-7-03-076548-2
责任编辑:赵艳春 高慧元
本书以人工智能方法和生物组学数据分析为主线,阐述了人工智能中的群智能优化、机器学习、深度学习等算法的基本原理,并探讨了如何将这些算法应用于生物信息学相关问题的研究中,如蛋白质复合物挖掘、关键蛋白质识别、疾病基因预测、多种组学(转录组学、代谢组学、微生物组学)数据与疾病的关联关系预测、circRNA-RBP 结合位点预测、RNA甲基化位点预测以及药物发现等。本书系统收集整理了生物组学相关数据库,另结合应用问题,从人工智能算法设计到具体流程计算,再到结果分析,均给出了详细步骤,以上均是本书的特色所在。
本书适合人工智能、计算机科学、生物信息学、生命科学、生物统计、生物化学以及其他交叉学科专业的高年级本科生及研究生学习,也可供其他理工科专业研究人员、程序开发人员和生物信息计算爱好者参考。
《人工智能在生物信息学中的应用》
雷秀娟,潘毅 著
*以上内容包含广告
发货及发票说明
发货说明:商品付款后,工作日48小时内发货,节假日不发货,顺延至工作日正常发货。
发票说明:药渡书店图书下单7天内可以提供开票服务,下单时备注下发票抬头、税号及接收邮箱信息(三者缺一不可),则可在确认收货无误后我方提供增值税电子版普通发票。
评论排行