燧坤智能采用 NVIDIA GPU,显著提升新药研发平台 AI4D™ 的计算效率、计算精度、模型训练速率,整个药物分子筛选流程提升了数十倍,满足了处理海量数据的需求。


本案例主要应用到 Tesla V100 GPU。

 

 

燧坤智能是新一代的机器学习+生物技术初创公司,致力于通过自主搭建 AI 平台万倍提升研发药物效率及成功率。该公司已同近 20 家国内外知名药企、上市公司、三甲医院、政府机构、科研院所建立合作,共同开发新药及 AI 模型。

 

 

新药研发的成功率极低,研发投入巨大。药物分子的活性、类药性、成药性对于最终成功完成临床实验并获批上市至关重要。如能在药物发现的早期准确预测上述属性,则可提高后期研发成功率。
 
药物大数据的数据规模动辄以十万甚至百万计,基于超大规模数据的 AI 算法开发和应用,对算力提出了巨大的挑战。一般的 CPU 计算平台存在速度慢的问题,典型的深度学习模型训练需要超过千万次的迭代和参数更新,将耗费大量的时间。GPU 在深度学习领域的应用加速了 AI 的发展。与 CPU 计算平台相比,使用 GPU 加速后,深度学习模型训练单次迭代时间能从数十分钟降低到几秒,极大地提高了 AI 算法开发的效率、降低开发周期,节约开发成本。
 
燧坤智能研发的 AI4D™ 线上服务平台采用了NVIDIA Tesla V100 GPU。借助 NVIDIA GPU 加速计算,使得 AI4D™ 的计算效率、计算精度、模型训练速率等方面得到显著提升。与仅使用 CPU 的系统相比,将实际应用程序的吞吐量提升 10 倍,大幅提高了训练模型的效率。GPU 的参与使双精度比早期硬件提升 10 倍,同时通过减少服务器数量,大幅降低了数据中心成本。
 
海量大规模数据处理:在文献信息挖掘过程中,需要对超过百万数量的文献文本进行处理。通过 GPU 加速,能在几分钟内完成全数据库的关系抽取查询,速度提升超过10倍,显著提高查询效率。
 
深度学习模型高效训练:深度学习模型训练速度较 CPU 提升了 100 倍以上,在相同的时间内允许更多次数的迭代,极大地降低了时间成本,有效地缩短了开发周期,提高了开发效率。
 
生物大分子优化设计:生物大分子的优化空间为指数增长,常规的优化需要耗费大量的计算资源。基于 GPU 平台开发的优化算法,利用 GPU 加速和多卡并行的策略,缩短了单次搜索所需时间,提高了单位时间内搜索次数,能够在数分钟内完成生物大分子的设计和优化,效率提升达到 40 倍以上。

 

 

AI 算法的成功,得益于其从海量结构化数据中挖掘深层信息的能力。燧坤智能利用 AI 系统,整合药物大数据,深度赋能药物研发全过程,包括从药物靶点相互作用全景图学习及预测、虚拟高通量分子筛选、大分子产量优化、个性化细胞疗法设计,到文献信息挖掘等多项应用。AI4D™ 平台不仅能够针对靶点的定向分子进行生成与筛选,还凭借团队深厚的药物研发知识,对分子的类药性及成药性进一步预测,从而聚焦真正的药物分子,对缩减药物研发的后期投入、提高临床及上市成功率提供助力。
 
在 AI4D™ 平台上,用户可以低门槛的使用 AI 进行药物分子的筛选,无需学习算法和编程,将一切繁琐、复杂、重复的事情交由机器完成,将自身精力专注于策略研究,大大地减少了用户的实验验证成本。传统药物分子筛选往往需要耗时半年到一年,甚至得不到任何结果,借助 NVIDIA 计算平台对机器学习的加速,将整个计算筛选流程提升了数十倍,满足了处理海量数据的需求,极大地减少了时间成本,更利新药研发的推进。
 
“机器学习在药物研发领域是一个划时代的工具,在生物医药领域有着巨大的应用前景。尽管机器学习对于算力要求不高,但是要用机器学习模型拟合生物机制的高复杂度,需要更强大的算力。NVIDIA AI 计算平台,可以让机器与生命的融合更进一步。” 燧坤智能 CEO 曾亥年表示。