当前位置:首页>新闻中心>​听起来高精尖的基因测序,真的离我们很远吗?

​听起来高精尖的基因测序,真的离我们很远吗?

  • 2019-12-02 20:51:07



  • 提到基因测序,大家可能会想到高精尖的科研院所,但这跟普通人有什么关系吗?事实是,关系真的很大!由于基因记录和控制着遗传信息的表现, 基于基因层面的“精准医疗” ,能够帮助治疗各种先天性疾病、肿瘤癌症等。




    近日,更是传来令人振奋消息,第三代基因测序仪研发取得阶段性成果。相比二代,其价格下降了10倍,速度提升了10倍,并且能在几个小时内生成报告。对于普通人来说,以后只需要花费几百元,就可以享受 消费级基因数据解读与个性化的健康服务 了。



    『 成果可喜  技术挑战依然任重道远 』


    虽然,基因测序技术的研究成果可喜。但是,依然面临着 计算量大、极端耗时 ,需要 超高速和超大内存的超级计算集群 以及 组装质量可靠性低、测序错误率高 等技术挑战。


    如何 攻克这三大难题 ,大幅度提高三代技术的市场竞争力,让基因测序惠及更多人,成为众多厂商、科研人员及从业者最关心的问题。


    7月1日,以“开启E级计算新篇章”为主题的2016联想全球超算峰会,在北京隆重召开。在 教育、科研、医疗行业分会场 ,来自清华大学医学院高性能计算中心、北京诺禾致源生物信息科技、药明康德新药开发等公司和Mellanox的专家就基因行业HPC(高性能计算)应用话题进行深入的交流和探讨。



    『 基因测序的突破  离不开HPC 』

    从基因测序中的蛋白质分析,到医学转化的精准医疗,都 离不开高性能计算和大数据分析 。在基因序列测序过程中,首先需要用电镜自动采集和实时存储基因蛋白质分子的图像,然后使用计算机对图像进行预处理和设置操作,进行2D和3D重构,并输出结果。


    而基因测序的医学转化,则需要利用高通量测序平台对人类不同个体或群体进行 全基因组测序 并在个体或群体水平上进行生物信息分析。全面挖掘DNA水平的遗传变异,为筛选疾病的致病及易感基因, 研究发病遗传机制和预防治疗方案提供重要信息。



    在蛋白科学研究和发展中出现了两大技术革命,一个是 直接电子探测器的发明 ,它的出现让数据采集规模提升了100倍。同时,在电镜图形质量上有了质的飞跃,并且在速度上大幅提高,还可以以电影的形式快速记录电镜图像。有了快速电影记录,研究人员就可以追踪图像漂移轨迹而对图像做运动矫正和辐射损伤矫正,大大提高数据质量。


    另一大技术革命就是 高分辨率图像处理算法的改进 ,它能够进行大规模的并行计算,并且拥有极高的精度、准度和收敛性。然而,这两大技术革命在为蛋白质科学研究带来跨越式进步的同时,也带来了数据处理和计算规模的临界点。




    HPC的发展为生命科学研究突破瓶颈,提供了强有力的支撑 。以采用了联想System x3950 ,单台服务器采用8颗Intel至强E7 CPU,内存可按需灵活扩展。同时,采用联想独有的内存加速技术,从4路到8路,性能提升1.6倍-1.7倍。数十项RAS高可靠性,有效保障数据安全。



    『 软硬结合  联想HPC可靠承载重托 』

    想新一代智能超算集群管理软件LiCO ,可为HPC用户提供简便的集群访问权,实现以更低的软件和管理成本使用HPC。此外,其“开放性”的架构使开发人员或使用用户,不仅可以根据自身需求对组件进行定制选择,还可以通过开放的软件接口进行二次开发,具有 很强的可扩展性 。在计算任务运行时间紧迫,分秒必争的情况下, 实现高效计算 ,提高单位时间的计算任务吞吐量,并保证大规模计算任务的稳定调度和运行。



    除了计算与管理, 指数级的数据增长带来的数据存储与管理挑战、数据存储要求不同带来的异构存储管理挑战 ,同样十分严峻。清华大学医学院高性能计算中心采用的是FEI TITAN KRIOS 300千伏透射电镜,4台Titan电镜手工模式下,每天的存储容量约为28TB,每年的存储容量约为10.2PB,三年累计数据超过30PB。 联想大容量分布式存储池,可为大规模的测序数据进行量身定制 ,实现注释、过滤和可视化的数据展现,同时非常好地实现数据的共享和隔离。




    对生命的探索没有尽头。未来,基因技术将会引领行业发展大爆发,带来无法估量的价值。HPC的发展,能够让这些看起来高精尖的技术,更快的应用到我们的生活。