隨著時代的發(fā)展,制藥業(yè)正在經歷翻天覆地的變化。2018年,一部現(xiàn)實主義電影《我不是藥神》讓仿制藥的話題引起了人們的關注。讓我們來看看一組原始的研究數(shù)據,根據PharmaIntelligence根據公司在2021年提供的報告,在過去的十年里,只有不到10%的藥物能夠順利完成臨床實踐I,II,III期間實驗,并在NDA/BLA后來獲準上市。
那么,作為仿制藥的對象,原研究藥物的重點是什么呢?原研發(fā)工作風險巨大,投資時間長,投資成本高,所以所謂的行業(yè)流傳“雙十定律”也就是說,制藥企業(yè)在開發(fā)創(chuàng)新藥物時,通常需要花費超過10億$,開發(fā)周期往往需要十年甚至更長的時間,從藥物設計到臨床實驗,再到申請上市。
也正因此,大量制藥企業(yè)正在期待利用計算機輔助藥物設計,降低研發(fā)成本、縮短研發(fā)周期,并最終提高成功率。
數(shù)字技術加速新藥研發(fā)
藥物的研發(fā)一般起始于藥物探索與發(fā)現(xiàn),隨后進行臨床前研究與臨床實驗,在成功后進行相關審批,通過審批的藥物則可以進入商業(yè)化生產與藥物銷售流通環(huán)節(jié)。在藥物探索階段,靶點的發(fā)現(xiàn)可謂至關重要,如果靶點不是創(chuàng)新的,這便不能被稱作一款真正意義上的創(chuàng)新藥。為此,很多制藥企業(yè)選擇與國內知名的轉化醫(yī)學中心進行合作,進行臨床數(shù)據挖掘與生物信息分析。
早在2017年,瑞金醫(yī)院國家轉化醫(yī)學研究中心已經開始著手打造一個集存、傳、算、用(即:數(shù)據存儲、數(shù)據傳輸、數(shù)據分析計算和數(shù)據的整合應用)為一體的定制化高密度計算平臺——ASTRA。
ASTRA擁有4000個CPU計算核心,存儲系統(tǒng)為總容量10PB的高性能并行文件存儲系統(tǒng),同時配備了200GB的HDR IB網卡以及15 PetaFLOPS的AI計算能力。其采用的第三代英特爾® 至強® 可擴展處理器更適用于需要兼顧生產和科研的平臺,能夠靈活滿足相關需求。同時,借助英特爾開發(fā)的DAOS(Distributed Asynchronos Object Storage,分布式異步對象存儲)開源文件系統(tǒng),使得瑞金醫(yī)院的ASTRA系統(tǒng)能夠突破存儲瓶頸,充分發(fā)揮性能,滿足實時、高頻和高效的數(shù)據訪問和處理需求。
借助這一平臺,瑞金醫(yī)院針對某基因組的變異分析耗時和某腫瘤全基因組分析的時長都大大降低。通過這樣的提升,此前的很多醫(yī)學設想也得以照進現(xiàn)實。
在瑞金醫(yī)院的技術應用實踐之外,借助AlphaFold2與GROMACS,科學計算在轉化醫(yī)學和新藥研發(fā)等領域的關鍵性驅動作用也愈發(fā)明顯。前者是DeepMind提出的深度神經網絡蛋白質形態(tài)預測方法,也被稱為迄今為止準確度最高的蛋白質三維結構預測模型;后者則是一個分子動力學軟件包,用于模擬設計新藥物的蛋白質、脂質和核酸。這些模擬為研究人員提供了所需的生物大分子結構信息,以了解結構與功能關系,用于指導藥物研發(fā)和設計過程。基于顯著提升了人工智能與深度學習性能的第三代英特爾® 至強® 可擴展處理器,輔以英特爾AI套件的轉換與優(yōu)化,上述工具突破性地實現(xiàn)了23倍的性能提升,每日可預測的蛋白質長度從4.56大幅提升至105.35,這也意味著藥物研發(fā)的試錯過程能夠被顯著縮短。因此,這一進步也在醫(yī)藥行業(yè)大分子藥物研究領域產生了不小的震動。
而在小分子藥物的發(fā)現(xiàn)中,以晶泰科技為代表的本土研發(fā)團隊則更有發(fā)言權——借助阿里云第七代云服務器ECS的計算單元,以及英特爾® oneAPI提供的編譯器數(shù)學庫和優(yōu)化能力,包括GATK,NAMD,LAMMPS,RELION和GROMACS在內的諸多生命科學領域的前沿應用運行速度大幅度提升,部分增長高達60%以上,結構晶體預測與碳化合物構成的研究變得更加容易。對于晶泰科技們而言,這有助于研究人員更有效地設計和評估新藥,并能夠顯著節(jié)約資源。
化解隱私安全疑慮
當一種藥物的靶點和化合物,包括化合物優(yōu)化完成后,新藥就已具雛形。不過距離來到患者手中,它還要經歷六到七年的臨床試驗階段。在臨床藥物試驗過程中,第三代英特爾® 至強® 可擴展處理器的一種獨特安全技術——英特爾® 軟件防護擴展(SGX)——也在簡化和加速流程方面發(fā)揮著重要作用。
英特爾® 軟件防護擴展(SGX)的核心是一組指令,可提高應用代碼和數(shù)據的安全性,從而為它們提供更好的保護,以防止泄露或修改。
2020年7月,國家藥品監(jiān)督管理局發(fā)布了《新冠肺炎疫情期間藥物臨床試驗管理指導原則(試行) 》,這意味著通過遠程智能的臨床實驗,患者可以足不出戶,通過冷鏈配送獲取藥物,同時利用可穿戴設備完成數(shù)據的采集與上傳。在這種情況下,保護患者隱私與數(shù)據安全就可能形成一個巨大的技術挑戰(zhàn)。
但現(xiàn)在,情況出現(xiàn)了轉機。英特爾® 軟件防護擴展(SGX)能在CPU的支持下,在內存等特定硬件環(huán)境中構建出一個可信安全的飛地。這種飛地獨立于操作系統(tǒng)、虛擬機以及BIOS系統(tǒng)之外,也就是說,即便這些比客戶應用程序更底層的基礎軟件或系統(tǒng)在惡意攻擊中淪陷,由英特爾® 軟件防護擴展(SGX)技術生成的飛地也可以通過基于硬件的、增強型的安全防護更有效地阻斷這些攻擊,盡力避免其中的數(shù)據或代碼被竊取或篡改。這有助于確保數(shù)據完整性和隱私,提供了在各方之間安全共享私有信息的工具,并創(chuàng)建一個協(xié)作、實時的臨床信息系統(tǒng)。而基于這一加密計算能力,阿里云ECS安全增強通用型g7t服務器持信息以更快、更安全的方式進行共享和驗證,相關治療方法可以更快地提供給有需求的人。
算力加速新藥落地
多年之后,終于來到新藥上市前的生產與流通環(huán)節(jié),算力也在持續(xù)提供著加速。
如今,制藥企業(yè)可以利用機器視覺替代檢測人員,不僅減少了在整個生產環(huán)節(jié)的人工成本,更提升了檢測的準確率與效率。目前,通過阿里云與英特爾等公司的合作,此類應用已經在部分企業(yè)率先落地。經過簡單模型與復雜特征的多重訓練后,機器視覺與人工標注的一致率已經高達98.879%。
而在最終的藥物流通上,數(shù)據仍然蘊含著大量亟待挖掘的價值。因此,大量的AI算法應運而生,藥物需求的預測正在成為可能。憑借第三代英特爾® 至強® 可擴展處理器強大的AI加速能力,以及英特爾在邊緣計算上的全面布局,藥物流通行業(yè)的參與者們也得以乘上數(shù)字化轉型的東風,通過邊緣實時的計算進行更精準的預測,從而制訂更科學合理的藥物銷售與存儲策略。
工具的極大豐富與快速迭代使醫(yī)療機構與制藥企業(yè)從數(shù)字技術中獲得強大的助推力。借助算力與算法誕生的顆顆新藥,也正在為人類的健康提供更堅實的守衛(wèi)。