当前位置:主页 > 产业 > 医药 > 解析生物医学大数据,人工智能是最适用手段

解析生物医学大数据,人工智能是最适用手段

2023-06-20 12:30:03来源:科技日报

文章导读
◎本报记者 张佳星 当前最核心的生物医学大数据问题是解决各种可测量的数据,包括遗传密码与表观表型之间的关系问题。我们知道分子水平的基因组学、蛋白质组学研究产生的数据量不计其数,近年来发展起来的表型组学研究也在不断积累数据量,我们会逐渐拥有大量的表观数据。那么这两大数据如何偶联?如此规模巨大、系统复杂的分析只能由人工智能来完成。 近段时间,人工智能大模型展现了强大的自然语义处理能力,再次掀起了人工智能的...

  ◎本报记者 张佳星

  当前最核心的生物医学大数据问题是解决各种可测量的数据,包括遗传密码与表观表型之间的关系问题。我们知道分子水平的基因组学、蛋白质组学研究产生的数据量不计其数,近年来发展起来的表型组学研究也在不断积累数据量,我们会逐渐拥有大量的表观数据。那么这两大数据如何偶联?如此规模巨大、系统复杂的分析只能由人工智能来完成。

  近段时间,人工智能大模型展现了强大的自然语义处理能力,再次掀起了人工智能的研究热潮。从图灵测试开始,机器人能否与人对话就被用作判断机器是否具有高级别认知智能的依据。大模型的建立,融易新媒体,让人工智能距离通过图灵测试更近一步。

  那么,当前的人工智能还有哪些潜力?在生物医学领域应如何更进一步发展适用的人工智能?科技日报记者日前对中国科学院院士、中国科学院生物物理研究所研究员陈润生进行了采访。

  生物信息数据量大、维度广

  记者:距离人类遗传密码被破译已经过了20多年,但似乎仍有很多健康问题难以解决,这是为什么?

  陈润生:过去我们认为生物网络是“单色”的,或者说是单因素作用的。因为当时我们认为具有生命功能的分子只有蛋白质,遗传物质经过转录、翻译的过程转化为蛋白质,进而执行生命活动中的各项功能。

  基于这样的认知,人类遗传密码的破译被理解为解读“生命天书”。将人类全部30亿个碱基序列全部测序完成,就能读懂这部“生命天书”,提纲挈领地搞清生命活动的运转体系,从而揭开所有健康的秘密,获得解决健康问题的手段。

  但现在我们发现,生物网络不是“单色”的,生命活动的调控、抑制、互作中,还有核酸的参与。比如有些核酸序列也会发挥之前被认为属于蛋白质的功能,调控细胞活动。在承载人类遗传信息的30亿个碱基对中,还有很大一部分虽然我们读出了序列,但并不知道功能,它们在生命活动中究竟起到什么作用也没有被研究清楚。大量这样的区域被称为遗传物质的“沙漠区”……因此,当前对人类遗传密码的破译进程只走了解决健康问题过程中的一小步。

  记者:既然生命活动这么复杂,是否需要更多的生物信息数据才有希望破解健康难题?目前需要充分利用的有哪些维度的生物信息学数据?

  陈润生:这30年来,人类遗传密码的破译带动着整个生物医学领域内广泛的数据都成为了大数据。

  生物信息学最早的研究对象是遗传密码,研究任务是对遗传密码进行收集、整理、存储、发布、分析和解释。现在数据更广泛了,生物信息学的研究从20世纪八九十年代创立时的无信息可用,到现在数据呈现海量、多维、异质化特征。比如通过电子病历大数据挖掘,我们可以得到很多重要信息。中山大学一些研究人员通过电子病历分析找到的科学结论被发表在了国际著名期刊上。又比如可穿戴设备带来的生理生化指标,这类信息具备实时、环境情绪相关等特性。这些数据还包括医院中的影像学数据、临床病人在治疗用药后的病情变化数据、环境数据、微生物数据、地质数据、化学农药残留数据等。所有这些跟健康相关的数据集纳起来,构成了非常复杂的健康大数据类型。

  可大幅提高生物信息处理能力

  记者:如何解析复杂的健康大数据?

  陈润生:健康大数据很复杂,举例来说,电子病历写的是字,处理这样的信息需要自然语言处理模块,生理生化指标如脑电、心电等信息需要处理的是波形图,而影像学要处理图像,组学要处理符号。对这些性质各异的生物信息进行全面提取处理,就如同秦始皇统一六国不仅要统一文字、语言,还要统一货币、度量衡,需要将不同的信息融通,再做解析和决策。

  当前最核心的生物医学大数据问题是解决各种可测量的数据,包括遗传密码与表观表型之间的关系问题。我们知道分子水平的基因组学、蛋白质组学研究产生的数据量不计其数,近年来发展起来的表型组学研究也在不断积累数据量,我们会逐渐拥有大量的表观数据。那么这两大数据如何偶联?如此规模巨大、系统复杂的分析只能由人工智能来完成。

  目前来看,要解析生物医学大数据,人工智能技术是最适用的手段。

  记者:从最初的人工智能到阿尔法狗再到大模型,人工智能发生了哪些变化?当前的大模型在处理生物医学信息方面有哪些优势?

  陈润生:20世纪80年代,由于受算力和算法的限制,我们能设计运行的人工智能神经网络非常简单,只有几层。

  现在的人工智能神经网络,比如阿尔法狗、阿尔法折叠等,它的网络模型架构达到200—300层。当今的计算能力能够使它们完成更加复杂的任务。

免责声明
融易新媒体转载此文目的在于传递更多信息,不代表本网的观点和立场。文章内容仅供参考,不构成投资建议。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
热门文章
日榜 周榜
1 北京将16项辅助生殖项目纳入医保报销

记者今天从北京市医保局获悉,北京市将16项治疗性辅助生殖技术项目纳入基本医疗保险报销范...

2 解析生物医学大数据,人工智能是最适用手段

◎本报记者 张佳星 当前最核心的生物医学大数据问题是解决各种可测量的数据,包括遗传密码...

3 新稳定疫苗或助消灭脊髓灰质炎

科技日报北京6月15日电 (记者张梦然)《自然》杂志14日发表了两种新的脊髓灰质炎候选疫苗...

4 国产PD-1国内上市首次被拒 创新药或迎“洗牌”开端

中国商报(记者 马嘉)国产PD-1在国内上市被拒,这在创新药行业还是首次。近日,嘉和生物发...

5 医、药、险融合发展成共识 助力多层次医疗保障衔接

我国多层次医疗保障体系建设取得显著成效,医、药、险融合发展渐成行业共识。在近日召开...

6 “减肥神药”受追捧 中外药企忙布局

在减肥界大火的“减肥神药”司美格鲁肽最近迎来新进展。6月3日,国家药监局药审中心官网显...

7 信披违规,金城医药原持股5%以上股东上海睿亿被通报批评

因存在信息披露不准确、不完整的情形,金城医药原持股5%以上股东上海睿亿被通报批评。 深...

8 双鹭药业二股东被通报批评:减持达5%未信披并停止买卖

因减持双鹭药业股份比例达到5%时,未按照规定及时履行报告、公告义务并停止买卖,双鹭药业...

9 2022年度医保基金飞行检查情况公布 医保基金合理使用取得积极

央视网消息:6月13日,国家医保局公布2022年度医保基金飞行检查情况。2022年飞检聚焦医疗资源...

1 北京将16项辅助生殖项目纳入医保报销

记者今天从北京市医保局获悉,北京市将16项治疗性辅助生殖技术项目纳入基本医疗保险报销范...

2 解析生物医学大数据,人工智能是最适用手段

◎本报记者 张佳星 当前最核心的生物医学大数据问题是解决各种可测量的数据,包括遗传密码...

3 新稳定疫苗或助消灭脊髓灰质炎

科技日报北京6月15日电 (记者张梦然)《自然》杂志14日发表了两种新的脊髓灰质炎候选疫苗...

4 国产PD-1国内上市首次被拒 创新药或迎“洗牌”开端

中国商报(记者 马嘉)国产PD-1在国内上市被拒,这在创新药行业还是首次。近日,嘉和生物发...

5 医、药、险融合发展成共识 助力多层次医疗保障衔接

我国多层次医疗保障体系建设取得显著成效,医、药、险融合发展渐成行业共识。在近日召开...

6 “减肥神药”受追捧 中外药企忙布局

在减肥界大火的“减肥神药”司美格鲁肽最近迎来新进展。6月3日,国家药监局药审中心官网显...

7 信披违规,金城医药原持股5%以上股东上海睿亿被通报批评

因存在信息披露不准确、不完整的情形,金城医药原持股5%以上股东上海睿亿被通报批评。 深...

8 双鹭药业二股东被通报批评:减持达5%未信披并停止买卖

因减持双鹭药业股份比例达到5%时,未按照规定及时履行报告、公告义务并停止买卖,双鹭药业...

9 2022年度医保基金飞行检查情况公布 医保基金合理使用取得积极

央视网消息:6月13日,国家医保局公布2022年度医保基金飞行检查情况。2022年飞检聚焦医疗资源...

10 湘阴县人民医院眼科治疗之后更严重

挂号一个男医生边打电话边看一眼眼睛开个单子下去拿药,上来后不见那个主治矢生,不负责...

备案号:鄂ICP备2022006215号 Copyright © 2002-2022 关于我们 融易新媒体