欢迎访问中国科学院大连化物所中药科学研究中心网站!

科研进展
纳米孔信号智能解析研究进展
时间:2024-02-04       栏目类别:科研进展

糖链是碳水化合物的链状组装体,在许多细胞活动中发挥着多种关键功能,但糖链具有结构复杂、样品难制备、丰度低的特性。生物纳米孔信号可用于检测和识别生物分子,然而目前,无论是寡糖领域还是生物纳米孔信号分析领域都缺乏相关研究。现有的针对生物纳米孔识别方法存在研究对象的局限性、对国外软件的依赖和无法实时解析信号等缺陷,这些缺陷也限制了国内对生物纳米孔信号研究的发展。因此,卿光焱研究员团队(生物分离与界面分子机制创新特区研究组)联合中心中药大数据研究组提出一种面向糖链,利用深度学习识别糖链的生物纳米孔信号检测技术的研究方案。

中药大数据研究组在前期构建五种不同机器学习方法,利用连续纳米孔信号形成的图像特征,完成简单寡糖、支链寡糖、中性复杂寡糖等纯样品定性任务,以高精度方式鉴定糖链。接着探究已知不同糖链混合物含量问题,研究组相关团队搭建回归模型,验证了中性聚糖异构体含量测定的可能性,但模型泛化性还需进一步系统性研究。团队针对纳米孔单分子单事件识别难点进行重点攻关。首先解决阻塞信号识别分割问题,形成一套自主研发信号分割算法,然后构建一维信号卷积神经网络和频域增强深度学习模型,成功实现了单信号分子精确识别,结果与前期连续信号构建的机器学习方法相当。

研究组在糖组学鉴定领域,首次利用AI技术实现糖链经过纳米孔产生极短时间信号识别,构建一整套实验pipeline,初步探索了从定性到定量,最后完成端到端的纳米孔信号AI解析系统。研究组将继续深挖信号特征,构建软件平台支持卿光焱研究员团队在糖链上研究。相关成果发表在Nature Communications。(文/图 张晨、李效农)

图1 四种不同聚糖混合物的纳米孔数据散点图大幅度重叠

图2 机器学习模型识别不同长度线性聚糖

版权所有 © 中国科学院大连化学物理研究所  本草物质科学研究室  中药科学研究中心  辽ICP备05000861号

地址:辽宁省大连市沙河口区中山路457号  邮政编码:116023