莆田小鱼社区

搜索
查看: 147|回复: 0

[软件交流] 从癌症到COVID-19,预判疾病的预判

[复制链接]
发表于 2022-11-26 22:34:30 | 显示全部楼层 |阅读模式
  有朝一日' i5 v% ~6 I9 m2 ?
' C; ^- ^: b, O. U; f
  人们可以预知将来会患上哪种癌症
# A( ?5 b" \+ V6 I" H; |
, F, ^8 G5 c4 R6 x8 P  并在它出现之前开始预防治疗
, z1 `' z* G/ n+ x) l
" Z7 y  {$ {3 L9 R5 |# E6 z  听起来是不是很狂野?2 a# @& N8 [" R. u

) l" z7 m, r* w* ?% c/ L" |) s  让我们格局打开,无论是癌症,还是COVID-19,都和基因有关。基因测序可以认识疾病的形成机制,高性能算力可以加速这一发现过程,当技术先进到足以预判绝症的预判,这一畅想就离我们不远了。; N6 D2 Z# |8 l; M, x* t, F
2 a: H: p! J) d8 V$ N
  今天的主角是戴尔科技集团的老伙伴TGen,该机构以开展改变生活成果的突破性研究为己任,通过基因测序揭开致命疾病的秘密,以精准医疗帮助人们改善生活成果。- E! T8 @! L! T0 b+ u5 [. Q
( w( f9 e4 ]! J, g5 z; Z
  加入抗击COVID-19的战斗
6 ?: X6 ]. M% b* G) r9 x2 B6 M7 `! Y
  "这个星球使用DNA来编码生命的存在方式,病毒也没什么不同。尽管从遗传学的角度看病毒可能比人类简单得多,但它们仍然需要DNA作为运转的代码。重要的是了解病毒是如何工作的,以便与疾病作斗争。”
* Z' ?  ^5 x* G+ k
# E* ^4 \- I) S, P; F  James Lowey
; _8 J  C3 j; Z0 r/ d3 M" ~) B
: z0 A) H3 I; i3 O5 a) W8 b1 h( v  TGen首席信息官
8 M3 R2 ?9 Z( k' L5 S- M# T$ y- ?4 O1 x& ]- q% Q
  TGen(Translational Genomics ResearchInstitute)是美国希望之城(City of Hope)下属的转化基因组学研究所总部位于亚利桑那州。
2 x' v/ u  ^7 J; i5 q/ E
9 V6 p6 q  q3 b& Q$ j  希望之城:美国一所顶尖的非盈利研究和治疗中心,专注于癌症、糖尿病和其他危及生命的疾病。
" s4 v1 D- m9 ~% S
% X$ F; }+ q1 d/ Z6 J1 H. t1 F* A$ Z+ Z  N3 f  作为一家非营利性医学研究机构,TGen致力于解开常见及复杂疾病(包括COVID、癌症、神经系统疾病、传染病和儿童罕见病等)的遗传成分,通过这种方式确定治疗方案,有助于推动医疗向更加合理、精确、个性化的方向迈进。
1 c* q( d0 y1 h
# |& \) \) i" A3 ?) U  作为其人道主义使命的一部分,TGen努力破解传染病的秘密。& p1 p0 _- X: t# W0 {: x

; z$ n/ M8 r0 d  [2 b7 g7 d  新冠疫情出现以来,该机构积极投身于全球对抗COVID-19疾病的斗争中,其位于亚利桑那州弗拉格斯塔夫市的分支机构TGen North(专注于新病原体基因组学和生物防御研究),开发了一种针对COVID-19的RNA检测方法,从2020年3月初开始一直在亚利桑那州对人们进行检测。作为此过程的一部分,研究人员正在对所有阳性检测结果进行测序,并建立了一个基因签名生物银行。+ L5 U' r/ o# T) L1 r7 J& p
# P* z* \. Y# T) R5 G# S
  在今天,不仅是TGen,对各种各样的机构和组织都是如此,获悉疾病的遗传成分后可以了解SARS-CoV-2的不同亚株——这些亚株会影响病毒的传染性,并影响病毒在人群中的传播方式。- `3 b  @& K; t- W3 Q7 |

6 \3 E$ v' D5 B9 ?, u7 j7 A' p. T  s  在这一科学探索过程中,TGen与戴尔科技集团HPC和AI创新实验室合作,在实验室的Zenith超级计算机上分析数据。TGen从所有已知的COVID序列中抽取了一个优异的子集,将其加载到超级计算机上并开展一系列复杂的测序工作。
, Q* p$ n9 U. V% `6 `. J' G; Q' N/ G  {# \) r+ b$ i: d) ]
  
  {- C) ~# f' C8 J! ^: e- @/ d  U6 n4 ^0 n6 E! S
  这有助于TGen进行人群水平测序,从而实现快速基因组分析,提高公共卫生部门识别COVID-19哪种毒株比其他毒株传播得更多、什么可能导致当地疫情,以及基因组突变和变化的速度的能力。通过在全球基因组信息的背景下比较结果,该COVID-19测序项目还可以为生物医学研究人员寻找COVID-19新疗法和疫苗的更佳靶点提供信息。
# C9 N/ q: l/ D! ?  }6 c8 Q6 ]7 P* D8 x: |2 G' G( A8 ]3 |3 b5 s3 p
  基因组测序% u) m% j- `2 _2 o/ _7 r

2 P% W4 x( G$ A6 k9 Q  从2-3周到7-8小时: g+ \* _2 [7 a7 L5 Q/ f  u
) f. [2 w, i: d! `4 ^# y, G
  TGen积极探索精准医疗,为患者带来更好的成果,研究人员通过基因组测序将实验室中的发现迅速有效地转化为治疗方案。$ K* W0 I* ?; g0 h) h# z

- c" F+ L  A$ W5 n* m  这项工作需要操纵大量数据的能力——将数据移动到需要的地方,安全地管理它,并在高性能计算系统上快速、智能地处理它。8 J! I0 ~7 }) p# z, l) C7 P. P

0 ~4 R8 k* a# z  在临床应用中,越早得出临床结果,医生就越能及时做出决定,甚至挽救生命。而如果没有合适的高性能计算和存储系统,整个基因组的测序就会耗费大量时间,可能产生贻误治疗的后果。* c* ?  D6 q- x+ |1 N/ |

1 E0 A2 F9 U7 m" n+ u. l$ z  7 a+ ], W# _1 k$ x- a- G

7 X8 q# v  U. i5 l  当TGen在2008年首次开始研究下一代测序技术(NGS)时,其超级计算机花了大约两周时间来处理整个基因组——别说在临床环境中使用数据为患者确定个性化治疗方案,等这个过程结束,恐怕黄花菜都得凉了。! ?1 {% E7 Z3 d4 M' c/ ]3 i9 `
% ?6 N. Z4 S6 o2 Q% ?' z  C. `
  能否将漫长的临床结果返回时间缩短呢?带着这一目标, TGen与戴尔、英特尔携手在2012年促成了一个雄心勃勃的HPC项目——创建一个优化的高性能计算平台,以快速处理NGS样本。3 g4 T8 _9 Q* e8 W4 T" w# U9 @

6 V& Z9 u' v% Y8 M0 Q4 q  通过后续升级,这台基于戴尔PowerEdge服务器的超级计算机拥有3000个英特尔 至强 计算核心的处理能力,该集群每月提供100万个CPU小时,每秒执行50万亿次操作。此外,基因组学测序系统还提供超过3PB的戴尔PowerScale横向扩展网络附加存储。
* ^) t: C1 e# M. f1 g: L/ q. ?; g7 F  J
  超级计算机投入使用后,基因组测序的速度大大加快,数据处理时间从较早一代系统的两周缩短到仅仅7至8小时。这种性能上的巨大提升,使得TGen的科学家和医生团队能够加速数据分析,更及时地提供个性化治疗。3 B  B. [. {% J, P$ H
" d, c" n4 k+ {# ?$ p
  
  ?& F- P( w3 `/ o3 I
" B  I1 B% Q2 ]0 C% w  Lowey表示:
6 C- V7 b; I9 @4 z- X; h
  m6 A/ |( c; H& V& Z( l& Y7 H5 E3 p! F  “
, H% U4 g, j7 x0 s' r  F
  ?" a  O+ @0 z: _) ?2 }  我们能够把勉强处于临床相关时间段的东西,带到与临床更相关的地方。你可以在同一天得到结果,这对病人和家属来说意义重大。
( d/ G. s) j/ }# j6 l3 ?0 }0 P; n2 J. S1 k) A2 ~' r' Q
  ”& R. c% V4 v' C% ?; q5 d

" r! R" Y" r  z, Z" L% h  虽然临床医疗向前迈出了一大步,但TGen并未止步于此。如今,该研究所正在与戴尔及其他合作伙伴合作,建立一个能在1-2小时内对基因组测序数据集进行同样数量处理的系统——随着测序技术从实验室走向临床护理的主流,这种速度是极其重要的。  T( i+ T, U% T2 M+ h
5 F7 C3 U7 a! D% U& c
  与戴尔科技集团的合作
: {% z: p6 Y4 M+ L  f4 N' E  i0 F/ }  S
  除了专注于下一代测序的超级计算机外,TGen还运营着其他基于戴尔系统的高性能计算资源。
7 F, ^, @. Y$ Q, d1 v1 [8 a; ]2 |$ D2 T& k0 [& e% {1 J
  比如TGen North正在使用戴尔PowerEdge R640服务器、PowerScale存储和PowerSwitch网络建设一个新系统;TGen还与希望之城合作,基于戴尔基础架构建设了一个以GPU为中心、用于分子动力学模拟的系统。
6 T% p) W4 D  Y
" i  K1 m+ C: L  戴尔PowerEdge服务器搭载英特尔?至强?可扩展处理器,在核心、缓存、内存以及I/O方面进行了大量优化,使得其在整体性能上有了极大的提升,可满足多种工作负载需求。
" U5 o: W# L' B" \
" N, @5 ]( N4 u- r  L5 E  TGen和戴尔科技集团有着长期而富有成效的合作关系,这种关系远远超出了技术范围——虽然技术和创新的解决方案很重要,但TGen同样也需要能真正帮忙解决问题的合作伙伴,比如大幅加快测序处理的速度。6 c1 A- C" z0 b% e% v7 s+ P2 Q

; c* e7 F8 c0 {, u  "这需要一个既有产品又有头脑的公司与我们合作,为一个非常困难的问题提出解决方案——将测序时间从几周缩短到一小时。"Lowey说,"技术很重要,你必须有出色的工具来完成这项工作,但我们也要对想完成的事情达成一致性。”
) U' r: m4 X, l# M
7 f$ y' \& ?9 o  
4 W' \1 C) ?4 U, J
6 `5 l" S. B7 z! @6 A  在更高的层面上,Lowey将戴尔视为与TGen共享美好未来愿景的合作伙伴,并正在努力使之成为现实。5 n% J) t* w: }' j- R6 ], {

& W! z0 S: [* ^3 \6 R1 U" G3 _  “多年来,我有机会与戴尔的许多人一起工作,他们对自己的工作真正充满热情,并相信我们的使命。"Lowey说,“我认为Michael Dell说得很好:‘这不仅仅是为了技术而建立技术,而是建立技术来解决问题,在现实世界中工作并有所作为。’这一理念与我们在TGen所做的事非常吻合,拥有一个真正付诸努力让事情变得更好的合作伙伴绝对是至关重要的。我们非常重视这一点。”
- Z# m& z* Y# \9 }  y$ u/ P, Y
6 Z; d9 ^% v  z6 E- m6 `4 U9 d

本版积分规则

快速回复 返回顶部 返回列表