PGT-A路在何方?深度解读陈子江院士团队NEJM最新研究数据|对未来的启示

测序中国
2021-12-12 09:02 来自北京市

近日,全球顶尖医学科学期刊《新英格兰医学杂志》(NEJM)发表了山东大学附属生殖医院陈子江院士团队领衔的一项大样本、多中心、随机对照临床试验的研究成果。该试验比较了接受常规体外受精(IVF)与接受“第三代”试管婴儿非整倍体检测(PGT-A)患者的临床结果。研究发现,在一年期限内,最多三次植入单个囊胚的情况下,IVF常规形态学评估患者组的累计活产率为81.8%,接受PGT-A检测患者组的累计活产率为77.2%。以上结果提示,在存在胚胎活检风险的前提下,接受“第三代”试管婴儿PGT-A检测的患者,支付了昂贵的单精子注射(ICSI)与分子检测费用,但最终的妊娠成功率并不高于接受“第一代”试管婴儿治疗的患者。

图1

PGT-A技术的“进化论”,从1.0走向未来!

一直以来,辅助生殖行业对PGT-A的临床获益效能存在一定的意见分歧,该研究结果的发表,对这一争议可谓是“火上浇油”。

PGT-A的曾用名为“PGS”,早期的PGS是基于免疫荧光杂交检测(FISH)方法。FISH是一种低通量检测方法,检测前必须指定目标染色体。因为荧光染料颜色数目的限制,即使将前次检测的荧光信号漂白,然后对同一样本再做一次检测,基于FISH技术的PGS最多也就检测5、6条染色体,远远无法全面覆盖人类的22对常染色体和两条性染色体。那么,基于FISH的胚胎植入前非整倍体检测能否改善、提高试管婴儿患者的妊娠成功率?经历20余年的艰苦摸索,大量临床研究之后,未得到令人满意的答案。

进入新世纪后的第二个10年,高通量分子检测技术获得了蓬勃发展,与单细胞全基因组扩增技术的突破性改进(例如MALBAC技术)相结合,高通量DNA芯片、高通量测序(NGS)方法开始应用于PGS。高通量分子检测技术可以一次性对胚胎的全部染色体进行整倍体检测筛查,除了整染色体的拷贝数异常外,甚至可以检出染色体局部片段的拷贝数异常。与传统的FISH检测相比,高通量分子检测技术极大地提高了检测效能,因而被称作“PGS2.0”。此前,“PGS1.0”无法在提高试管婴儿成功率方面使患者临床获益,“PGS2.0”虽然在技术指标上有所提高提升,但真的能改善患者进行试管婴儿的妊娠成功率么?临床医生们对此持谨慎的态度。

近十年来,越来越多的临床研究表明,基于高通量分子检测的“PGS2.0”,即“PGT-A”,可以在试管婴儿妊娠结局方面使患者临床获益。例如,三项随机对照试验的Meta分析结果显示,与依据形态学进行胚胎选择对比,PGT-A获得了更高的临床妊娠率、持续妊娠率和活产率,降低了流产率,同时缩短了妊娠所需时间。此外,8项观察性研究的Meta分析结果也表明,与常规IVF相比,PGT-A的临床妊娠率和持续妊娠率均有所提高。

那么问题来了,难道上述发表在NEJM上的多中心、随机对照临床研究所得出的结果与上述其它研究结果相矛盾么?其实并非如此。那么,我们应该如何理解这一最新研究结果与此前他人研究结果的关系呢?简单来说,这项最新研究与已有此前研究的观察角度略有不同, 该研究阐释了试管婴儿这个复杂问题的另一个方面。

一项医疗技术的临床获益评估并不是非黑即白那么简单,而是条件性、多维度的。从不同视角去观察,经常会看到不同的效果。长期、多角度的临床观察研究正是为了使我们对一项医疗技术的理解更加深入、完善。只有经过全面、完善、多视角、多维度的研究才能找到这项医疗技术最闪亮的临床获益点,找到其最佳适应症,使最恰当的患者群在其最需要的方面获益。此外,即使当前的技术水平还不够理想,还不能在所有维度使患者获益,从多角度的观察研究中我们也可以找到技术改进的努力方向,以增加获益、减少损害,兴利除弊,这正是科技创新的必由之路。陈子江院士团队的最新研究成果从一个新的视角观察了PGT-A的临床效能。通过深入分析其结果数据,与已有研究结果相印证,正可以起到指明PGT-A发展方向的作用。笔者不揣浅陋,在此愿与各位读者一起对这项工作中所获得的各项数据做一点比较深入的分析与探究。希望借此可以一探PGT-A未来的发展道路。

PGT-A成功为若干特定患者人群解决不孕不育问题!

首先需要注意的是,这项研究所纳入的患者人群是“符合IVF指征的20~37岁不孕症患者”,与当前临床常规的PGT-A适应症并不相同。

当前常规的PGT-A临床适应症是:

女方年龄38岁及以上

不明原因反复自然流产2次及以上

不明原因反复种植失败3次以上

严重畸精子症

在试管婴儿治疗中,高龄女性获得的卵子数目显著较少,卵子质量显著较差。从该研究中的患者人群基础数据可以看出,与临床常规PGT-A适应症人群相比,这批患者年龄比较年轻(平均29岁左右),有流产史的患者占比较少(10%左右),因输卵管因素导致不孕的患者占比较高(55%以上)。简而言之,该研究所纳入的患者属于IVF适应症人群中胚胎非整倍体发生概率相对较低的一部分,可以称之为“亚PGT-A适应症”人群。

相应地,从研究数据可见,纳入患者在促排卵后的获卵数较多(平均20个),形态学优质囊胚较多(平均7个以上),整倍体胚胎占比较高(达69.8%, 一般为50-60%)。从补充数据中可以发现,这批患者的临床结局远好于普遍的IVF人群。其按胚胎形态学移植的对照组,在单胚移植的情况下,首次移植的活产率即达62.1%,远高于临床常见的40%左右。

需要注意的是,该研究的主要临床观察终点指标是一年内三次单个胚胎移植的累计活产率。这一临床疗效指标在此前的其它研究中也有应用,但经常作为次要指标来考察。为了减少研究周期,研究最常用的主要观察终点指标是首次移植的持续妊娠率。即使将活产率作为临床效能研究的主要指标,也是观察首次移植的活产率。“首次”与“多次累计”的差异,正是试管婴儿这项医疗技术的独有特点。

得益于促排卵技术,在试管婴儿治疗中,女性患者接受一次促排可以获得多个卵子,受精成为胚胎后即可获得多次植入机会。只要其中存在一个优质胚胎,无需任何检测,坚持一个个地植下去,只要患者子宫内膜没问题,怀孕就会成功。另一方面,无论应用什么检测技术,所能达成的最优效果都是把那个优质胚胎挑出来,最先植进去,尽早受孕。如果该患者在促排周期中一个“好”卵都没得到,再好的检测技术也无力回天。所以,理论上讲,检测与不检测,累计妊娠成功率不会存在差别。PGT-A检测可以预期达成的临床获益是“快”,使患者尽早地成功妊娠。

PGT-A让患者更“快”获益!

临床获益“快”首先体现在时间上,但意义绝不仅仅是时间。从患者角度而言,一次又一次地胚胎植入失败、早期流产的心理煎熬、健康损害是旁人无法体会的,同时也增加了患者的医疗经济负担。临床获益“快”可以减小对患者的损害与经济负担。

临床获益“快”方面,陈子江院士团队的研究结果与已有研究结果相比如何?此前研究中常用的观察指标为首次植入活产率,在该研究中并未被列入观察指标,因此未必体现在论文正文。笔者根据论文的补充资料将这些数据进行分析,按研究的实施过程绘制了拓扑图(见图2)。

图2

从上图中可见。第一次移植后的活产率,PGT-A组比形态学组稍高(66.3% vs.62.1%)。在第二次移植后,PGT-A组仍能保持一个较高的活产率(62.2%),形态学组的活产率下降比较显著(55.2%)。第三次移植,PGT-A组只有5人,计算活产率40%,比形态学组的38.8%稍高。那么,最终获得活产结局的患者,平均每人需要植入多少次才能获得成功?经计算,PGT-A组需要1.44次,形态学组需要1.69次。这些数据表明,PGT-A组的妊娠成功率在三次移植中每一次都高于形态学组,且PGT-A组中受孕成功的患者耗费时间最短。这正是PGT-A检测的预期效能。

正如前文所述,该研究中的患者人群并非当前临床PGT-A适应症人群,而是“亚PGT-A适应症”人群,她们的胚胎中发生染色体非整倍体的概率低于PGT-A适应症人群。也就是说,亚PGT-A适应症患者的优质胚胎概率高于PGT-A适应症人群。在不做染色体检测的情况下,亚PGT-A适应症患者中最终妊娠成功的速度,比PGT-A适应症人群依据形态学植入而妊娠成功者更“快”。在亚PGT-A适应症患者中我们可以观察到,PGT-A组的患者妊娠成功比形态学组实现得更“快”。因此,可以合理推测,在PGT-A适应症人群中做与不做PGT-A检测,妊娠成功的快慢差异比该研究在亚PGT-A适应症患者中所展示出的差异更加显著。这与先前诸多的PGT-A临床研究结果正相一致。

PGT-A的高“弃植率”,在加速患者妊娠成功的同时是否也意味着更多“浪费”

该研究限定了每位患者最多只能接受三次胚胎植入。在对比了PGT-A组与形态学组每次植入的成功率后,或许会有读者感到奇怪:在三次胚胎植入中的每一次,PGT-A组的活产率都高于形态学组。可为什么这三次植入的累计活产率,PGT-A组却低于形态学组(77.2% vs 81.8%)?

经过仔细分析计算过程发现,每次植入后的活产率与累计活产率计算,其分子都是婴儿活产数,是一个“分项之和等于总项”的关系。可对应的分母就不同了,三次接受植入患者的总和数并不等于纳入研究的患者总数,而是小于。也就是说,部分患者在第一次植入失败后没有接受第二次植入,选择放弃。部分第二次植入失败的患者也没有都接受第三次植入,选择放弃。在分别计算两组的累计活产率时,分母中是包括了这些放弃植入的患者。但在计算每次植入后的活产率时则无法包括这些患者。PGT-A组三次植入后每一次的活产率都比形态学组高,最后的累计活产率却比形态学组低。这提示着,PGT-A组有更高比例的患者,即使在前一次植入后没有成功妊娠也无法接受下一次植入,只能放弃。

该研究并没有给出每个阶段放弃植入的患者数量。笔者利用每次接受植入的患者数量、每次植入获得的活产数,和接受下一次植入的患者数量进行了推算(见图2中红字部分)。分析发现,形态学组第一次与第二次植入之间,第二次与第三次植入之间的“弃植率”分别为14.7%和43%。PGT-A组同阶段的“弃植率”高达38.7%和88.9%!高“弃植率”,正是PGT-A检测使这批患者在“快”的方面小有获益,却在最终成功妊娠(累计活产率)方面受损的根本原因。

为什么会有患者放弃植入?

在形态学组是因为患者没有了4BC或以上级别的胚胎。在PGT-A组是因为没有了整倍体胚胎(该研究设定,不植入嵌合胚胎)。需要知道的是,任何检测判断都是会存在假阳性的,形态学判断、PGT-A检测都不例外。不论依据形态学判断还是PGT-A检测,遭到假阳性判断的胚胎,其结局就是被放弃、被浪费。从该研究的结果数据来看,在累计成功率没有统计学差异的情况下,每次植入时,PGT-A组的“弃植率”都高达形态学组的两倍以上,说明PGT-A检测的假阳性率比形态学判断更高。因此在同等时间内(一年),PGT-A组患者中获得成功妊娠比形态学组更快,但并不是使获得成功的患者数量更多,因为PGT-A组的胚胎浪费率更高。

胚胎浪费是部分学者、医生对PGT-A持反对态度的关键所在,他们认可PGT-A检测可以使患者能够更快的实现妊娠成功,但他们同时质疑PGT-A(与形态学判断相比较)较高的假阳性率使更多患者浪费了她们的胚胎,陷入“无胚可植”尴尬境地,失去了成功的机会。与简单、廉价的形态学判断相比,冒着胚胎活检风险、付出更高经济代价的PGT-A检测对她们来说受益有限。陈子江院士团队的这项研究结果正是从这个角度支持了PGT-A反对者们的质疑。同时,对研究数据经过深度分析,我们也可以发现,该研究结果同样支持PGT-A赞同者们的正面观点。

当前的PGT-A技术远非完美,造福更多患者,路在何方?

行文至此,通过对陈子江院士团队该研究数据的深入分析,可以发现PGT-A有利也有弊,我们需要做的是趋利避害,小心选择。具体而言,这项研究表明,亚PGT-A适应症患者并不适于接受当前的PGT-A检测。将现有的PGT-A检测泛化到所有IVF患者是不恰当的。严格掌握PGT-A检测的临床适应症,使真正获益概率最高的患者接受这项检测才是正确的做法。

当前的PGT-A检测并非完美,怎样改进才可以扬长避短,使其更好地服务于患者呢?笔者希望借这个机会,结合自身的工作经验和感悟与各位读者做一点探讨。

胚胎非整倍体检测的假阳性比形态学判断更高,从一定程度上来讲,这说明PGT-A检测对胚胎质量的判定标准比形态学判断更加严格。如果可以调整判定标准的严格度,使PGT-A检测与形态学判断等同,使PGT-A组的“弃植率”低到与形态学组的同等水平,理论上是可以达成在患者接受检测后,使妊娠成功更快,同时不伤害任何患者的成功机会,使所有患者的成功机会都不低于形态学判断方法。这才是PGT-A的理想效果。

但这个思路在常规的临床检验概念框架下是无法实现的。首先,PGT-A检测假阳性结果的来源有一个深层次的生物学原因:胚胎的自修复现象。PGT-A的是检测一个时点上(胚胎体外培养第5天)胚胎染色体的数目状态。越来越多的研究表明,胚胎在成长发育过程中,染色体异常细胞可以更倾向于死亡、淘汰。当异常细胞死亡殆尽时就实现了胚胎的自我修复,成功发育成胎儿。但哪些、什么样、什么程度的染色体异常可以在胚胎发育中自我修复,目前尚不得而知。

其次,当前临床检验的常规概念,是对检测对象做一个两分法判断,通常是:阴性-正常与阳性-异常。为实现这种“非黑即白“式的两分法判断,在检测的方法学建立过程中必须要设定一个判断阈值或阈值范围。当检测结果符合阈值或阈值范围时就判断为阴性-正常,偏离阈值或超出阈值范围就判定是阳性-异常。在PGT-A检测中,这个阈值就是染色体的拷贝数。正常的常染色体都是2个拷贝,检测结果是2个拷贝就判定为阴性-正常,其它判定为阳性-异常。阴性-正常的胚胎可以植入,阳性-异常的胚胎不可以植入。

PGT-A检测采用这种两分法判定逻辑,无法应对胚胎自修复这个生物学现象。在胚胎检测时按拷贝数阈值判定的阳性-异常并没有错,是真阳性。但胚胎可能在后续发育中修复,这样检测结果就成了假阳性。理想的PGT-A检测不应是一个“非黑即白“的判断,而应该对“不那么正常”的胚胎的自修复有个评估、预测功能。即使无法做到100%地准确预测,做出概率性的评估也好。研究人员可以按胚胎成功发育的概率给某患者的全部胚胎做一个排序。然后按顺序一个一个地植入。这样就可以最大化地利用患者的全部胚胎,减少浪费,获得最高的累计成功率,同时使患者更快妊娠成功。

获益与风险的平衡,无创胚胎移植潜能筛查(NICS)或是更优选择!

胚胎发育潜能排序,这是个突破临床检验常规概念的思路,并且已经有临床科研和产品研发人员在这个思路上迈出了第一步。近期,在Reproductive BioMedicine Online上发表了一篇题为《Non-invasive embryo selection strategy for clinical in vitro fertilization treatment to avoid wastage of potentially qualified embryos》的研究工作,正是针对胚胎浪费问题,按上述胚胎发育潜能概率评估预测的思路,通过人工智能(AI)、机器学习的方法做出了解决方案,并展示了优良的效果。此外,笔者得知,由北医三院乔杰院士牵头,十余家临床中心参与的一项大样本、多中心、随机对照的无创胚胎检测的临床研究已经进展过半,该研究中即采用了相同的胚胎评级思路与方法,效果良好可期!

细心的读者可能会发现,笔者上面提到的两项研究并非常规依赖胚胎活检的PGT-A,而是基于胚胎体外培养液检测的无创胚胎检测方法。新概念的胚胎发育潜能AI评估分级方法正是基于这个无创检测实验方法(NICS)实现的。PGT-A胚胎活检的创伤性,一直也是PGT-A反对者们的重要理由之一。

任何医疗技术的实施,其伦理前提都是给患者带来的临床获益要大于风险和代价。如前文所述,当前的PGT-A技术可以给适应症患者带来尽快受孕成功的益处。但一旦检测适应症掌握不当,也可能给某些患者代来胚胎浪费的风险,并且胚胎活检的风险是当前所有接受PGT-A检测的患者所必须承受的。整体平衡下来,获益与风险孰重孰轻,确实需要慎重考虑。如果可以消除当前PGT-A的弊端,具体而言,以胚胎发育潜能分级排序植入的方法取代非整倍体两分法判断,从而避免胚胎浪费,同时以无创的胚胎培养液检测取代胚胎活检,避免胚胎创伤风险。这样即使亚PGT-A适应症人群也可以没有风险代价地从胚胎植入前染色体检测筛查中获益。因此,无创的PGT-A(niPGT-A)是PGT-A的一个技术发展方向。

此外,当前PGT-A技术的弊端还不止上述提到的那些。按照当前临床规范,进行PGT-A必须采用单精子注射(ICSI)的方法对卵子进行受精。ICSI本是针对男性不孕中的少、弱精患者所不得已而采取的受精办法。越来越多的研究表明,受精过程中缺失了精子之间的自由竞争,人为地武断选取一颗精子注射入卵子,对妊娠期不良并发症的发生与后代健康都存在着一定不利影响。例如,已有研究发现,经ICSI出生的儿童,其孤独症的发病率比人群平均高出4.6倍。

PGT-A之所以要求用ICSI方法受精,是因为顾虑父源的多余精子与母源的颗粒细胞污染会干扰检测。因为这一顾虑,本来无需接受ICSI受精的患者无端承受了母婴健康的额外风险。

除了给患者、胚胎带来短期与长期的健康风险以外,从医生与医院的角度来看,胚胎活检与ICSI都是对仪器设备、耗材物资、人员操作技能要求极高的医疗技术,这些无可避免地会转移到患者身上成为其医疗经济负担。

畅想未来,真正完美的胚胎植入前检测,姑且称其为“IVF-niPGTA”,无需ICSI——IVF受精就可以;无需胚胎活检——以胚胎培养液为活检样本;不是按染色体拷贝数阈值对胚胎进行正常与异常的两分法判断——而是对检测结果进行AI评估,按照其发育潜能的概率大小进行分级排序。

上文提到,无创检测与胚胎评估分级在技术上已经实现,相关科研论文已经发表,正在进行大规模的临床试验研究,并且,应用这一技术的体外诊断产品已经顺利通过国家注册检验,未来应用已经前景可期。避免ICSI,实现IVF受精的无创胚胎检测,技术上需要克服父源精子污染与母源颗粒细胞污染的难题。据笔者了解,对精子污染的克服当前已经有了解决方案。通过培养液全基因组扩增前的差异化裂解就可以实现只扩增胚胎游离DNA,避免精子DNA的扩增,从而避免了精子DNA对检测的干扰。据悉,相关的研究工作已经完成,科研论文正在发表之中。

母源颗粒细胞污染的克服比较困难。颗粒细胞是IVF受精所必须的辅助因子。精子的顶体反应需要颗粒细胞才能激活,然后钻透卵子的透明带,进入卵子。所以在IVF受精时,在卵子的周围必须保留较多的颗粒细胞。即使在体外培养三天并换液后,培养液中颗粒细胞DNA污染的风险还会比较高。因此,必须建立一种可靠的技术手段,对培养液中来自胚胎的DNA与来自颗粒细胞的DNA进行有效区分,选择性地排除掉母源DNA的检测信号,只使用胚胎来源的检测信号进行胚胎染色体评估。该技术路线从原理上可行,具体技术方案还在摸索、建立之中,拭目以待。

路漫漫其修远兮,PGT-A仍将上下而求索,造福不孕患者兮,来日可期!

一项技术创新从萌芽到广泛应用,必然是一个逐渐发展、完善的曲折过程,无法一蹴而就。从PGS1.0,PGS2.0,到现在的PGT-A,新突破的niPGT-A,未来的IVF-niPGTA,胚胎植入前染色体筛查检测技术的发展正在展现着这样一个过程。在这个过程中,每个阶段的技术水平都有这样那样的不完美甚至缺陷。对此我们不应因噎废食,而应该小心谨慎地以抽丝剥茧、拂尘见金的态度去寻找其最佳应用,并针对性地改进其弱点、弥补缺陷,最终将其打磨成为服务人类健康的完美工具。惟其如此,才不负我辈科技人员的社会使命。

本文仅代表作者个人观点,不代表平台立场

热点新闻