编者按
中药已经在中国使用了数千年,并在维护人体健康方面发挥关键作用。全球普遍开始寻求自然、整体的疾病治疗方式,世界范围内对中药的需求稳步增长。随着人们对中药复杂性认识的加深,为了更好地认知中药的化学成分,多成分含量测定已成为中医药领域科学家的共识。
中国工程院院刊《Engineering》2019年第1期刊发中国科学院上海药物研究所研究员果德安研究团队的《对良好中药标准的深层化学认知》一文。文章系统总结了中药非靶向和靶向分析化学的最新技术和方法学进展,并描述了应用一标多测法和一法多用法两种制定中药质量标准的质量控制策略。
一、引言
中药已经在中国使用了数千年,并在维护中国人身体健康方面发挥了关键的作用。随着全球普遍开始寻求自然、整体的疾病治疗方式,世界范围内对中药的需求稳步增长。这使得制定国际认可的质量标准比人类历史上任何时候更为重要。药品的主要质量标准以药典中的说明为主。现今,《中国药典》《美国药典》和《欧洲药典》越来越重视增加草本药物相关专论的数量和提高相关专论的水平。中药正在走向全球化发展道路,《欧洲药典》(9.2版)中共收载了81种中药材标准,《美国药典》(41版)中共收载了37种植物药及其制剂。
更好地了解中药的化学成分可以提高中药整体质量控制的水平,现在应用创新质量控制技术使应对这些挑战更具有可行性。尽管最新版的《中国药典》(2005版)中收录了618种中药材和中药饮片,但这些专论仍缺少重现性好的整体质量标准,有的甚至缺乏明确的定量指标。因此,可以看出传统质量控制模型不适用于复杂的中药质量评估。文章提出了一种系统的中药质量研究方法,即在全面、系统的研究基础上发展普遍适用的、简化的标准。就本方法而言,更深入地认识中药化学性质是理解和转化中药标准最重要的一环。这是因为化学成分是中药的治疗基础,因此与中药质量有着不可分割的紧密联系。更深入地了解化学成分情况也有利于揭示中药质量研究的四大挑战和制定质量标准:①中药植物中化学成分的分析和表征,尤其中药复方中所含的化学成分;②单一成分质量控制方法不适用于多成分体系的中药,迫切需要制定全面的质量控制模型;③需要阐明中药中的活性成分,甚至有效成分;④需要制定可广泛应用的科学的、实用的、可行的质量标准。如丹参包含两种主要的化学成分:正是基于在20世纪30年代首次发现的丹参酮和依靠20世纪80年代分离技术的发展分离出的丹酚酸。《中国药典》(1990版)首次将丹参酮IIA列为一种鉴定标记,《中国药典》(2005版)将丹酚酸B选作一种定量指标。随着更深入地了解丹参的化学性质和质量控制方法的进展,利用丹参酮IIA同时定量其他两种丹参酮——隐丹参酮和丹参酮I,以便提高整体质量控制,同时保持检测的总成本。《美国药典》(38版)和《中国药典》(2015版)中已经收录了最新的丹参专论。最近,提出了一种新的中药质量标准物(Q-marker)概念,这将改变中药质量控制模式的范式。它被定义为一种中药的天然、可分析、功能性可追踪的化学成分。这种中药质量标准物概念也体现了深入了解各种中药化学成分的重要性。
自1997年以来,液相色谱(LC)-质谱(MS)联用技术已广泛应用于中药化学成分的深入分析。一种中药的成分包含数千种初级代谢产物和次级代谢产物。在大多数情况下,分析研究均着重于次级代谢产物——分子量在2000 Da以下的小分子。色谱分离和结构解析等传统的植物化学技术仍是获得有关中药化学成分复杂性准确信息的金标准。但是,若要快速了解中药的化学组成,采用化学成分分离的方法就过于繁琐耗时。将MS技术与色谱技术结合的联用分析技术的发明提供了一种非常强大的手段,可以详尽分析中药中的微量成分,并通过单次实验提供中药化学复杂性的鸟瞰视图。就这一点而言,超高效液相色谱(UPLC)-MS联用技术和超临界流体色谱(SFC)-MS联用技术均是非常有效的手段。与简单的色谱仪相比,科学家借由此类联用仪器可以得知中药中含有多少种成分,哪些成分可以提供准确的质荷比(m/z)、有规律的离子碎片信息和离子的碰撞横截面积(CCS)。过去5年来,随着LC-MS联用技术的飞速发展,智能地探索中药中数千种化学成分和定量数百种分析物成为可能。这种分析能力开辟了深入认识中药化学性质的全新纪元,并开启了结构解析的智能大数据时代。应当注意的是,探索大量化学成分应与整体质量和(或)功能活性相关联,且应通过智能数据挖掘为中药质量标准提供有用信息。
随着对中药高度复杂性的认识逐渐加深,多成分含量测定已成为中药科学家的共识。但是,在中药制药行业实践中应用多成分质量控制有两个难题:一是对照物质成本高昂;二是在中成药质量控制中,常常同一成分需要采用不同的处理方法,导致检测工作耗时耗力。针对第一个难题,提出了一标多测(SSDMC)方法,该方法将广泛应用于《中国药典》(2020版),为了解决第二个问题,提出了一法多用法,可用于通过相同的样品制备和分析方法定性或定量不同中成药中的多个相同成分。
2009年,应用液质联用技术系统分析了中药中不同次级代谢产物分析方法的应用。Zhang等综述了质普分析法在中草药的体外和体内应用,He等报道了1997—2005年采用液质联用技术进行中药分析的文献计量学评价。该文章主要涵盖过去5年内深入探索中药化学成分的新技术的发展,包括二维(2D)LC-MS联用技术、仪器依赖型数据采集法、仪器非依赖型数据采集法、通过LC-MS联用技术进行多成分定量测定、SFC-MS联用技术的新应用以及智能数据挖掘法。文章还提出了两种新的质量控制方法来建立完善的中药质量标准(图1)。
图1 良好中药质量标准的深层次中药化学认知
二、关于深入了解中药化学性质和质量标准的理念
(一)关于深入了解中药化学性质的理念
利用物质信息数据库对中药进行全息描绘是加深中药化学性质理解的基本思路。如上所述,中药通常包含数千种化学成分。这些成分包括有关该中药质量和功能活性的所有信息。因此,首先要探讨的是以下3个问题:①中药中含多少种化学成分?②这些化学成分的结构是什么?③这些化学成分的含量是多少?然而,即使这些问题相对简单,仍然无法通过对某些类型的代谢产物使用现代分析技术来完全解答这些问题。
幸运的是,对于被广泛认作主要活性物质的主要次级代谢产物,如香豆素、皂苷、生物碱和黄酮类,已经报道了许多创新技术,这些技术可以更好地应对上述3个问题的挑战。多维LC-MS联用技术是目前最重要的技术,用于探索中药中多样又复杂的化学成分,该技术包括离线和在线全二维 LC-MS分析。若结合离子淌度(IM)作为参数,则可以实现四维分析方法。该方法使得采用2D LC-MS联用技术解析化学成分的理论峰容量可达9000左右,完全满足中药的复杂程度。在没有离子碎片信息的情况下很难表征和鉴定获得的所有成分。因此,提出了许多用于获取二级质谱(MS/MS)或多级质谱(MSn)碎片信息的智能触发数据依赖型采集(智能DDA)方法,包括仪器依赖型方法和数据后处理方法。与LC-MS联用法相比,SFC-MS用法提供了一种正交选择性,更适合探索脂类和同分异构体成分。针对所探索化学成分的定量信息,已提出了广泛靶向定量的多反应监测(MRM)方法。随着化学成分数据集的不断积累,应采纳智能数据挖掘方法,例如利用UNIFI软件自动分析MS数据、利用全球天然产物协会分子网络(GNPS)自动对离子碎片MS/MS分类、利用支持向量机(SVM)或神经网络(NN)技术关联和预测质量。
(二)关于中药质量标准的想法
应认真考虑中药质量标准检测的成本和效率。对于整体质量标准而言,对照物质的成本是实施专论的主要障碍之一,尤其是在企业环境中。一标多测法提出仅通过一种对照物质准确测定所有其他分析物的含量,这大大降低了对对照物质的需求。检测时间长是使检测过程变得繁琐的另一个因素,尤其是在对不同复方中药中相同成分进行定性或定量分析时。针对定性分析的一法多用法以UPLC-QDa MS技术为基础,是通过采用一种低成本、紧凑的单四极杆MS技术。在本项技术中,通过选择性离子监测(SIM)方法监测植物药物的特征质量成分,那么含有该成分的所有中成药(CPM)均可使用该方法进行定性控制。对于定量分析,则采用2D LC多次中心切割分离(MHC)技术。一个中药的多个分析物可按顺序转移至第二个色谱柱,这将最大限度降低对紫外检测器的干扰并通过紫外检测器直接进行检测。该方法也适用于含相同草本的所有中成药。
三、中药物质基础解析技术的最新进展
(一) LC-MS 联用技术的多维分离
事实证明,LC-MS联用技术是一种非常实用的方法,可以揭示中药的化学基础、新陈代谢和作用机制。尽管在结构、色谱柱和检测器灵敏度方面有所改善,但由于中药的复杂性,传统的LC-MS联用法仍可能存在代谢产物共洗脱的问题,尤其是微量分析物和高丰度分析物之间。目前已提出了通过增加额外的分离维度(即2D LC和IM-MS)来提高性能的策略,尤其是在提高色谱和质量分离方面。
根据两个维度之间接口的方式,2D LC可以大致分为离线2D LC和在线2D LC。在离线2D LC中,第一维分离出的各流分被收集、处理和重新注入第二维中。此过程自动化程度较低,因此未引入接口。在线2DLC分析中引入了一个特殊接口,自动将各流分转移至第二维。根据是否所有1D洗脱液均经过了2D分离,可将2D LC分为全2D LC分离和中心切割2D LC分离。在中心切割2D LC中,只有当前关注的那些成分转移至第二维。
1. 离线 2D LC
离线2D LC不涉及溶剂的不相容问题,因为第一维分离出的各流分在注入第二维前已经加以浓缩和重新溶解。因此,该系统体现了不同分离机制的正交联用并提供了显著增加的峰容量。尽管因为人为介入浓缩、重新溶解和重新注入程序而存在样品损失、低效率、低自动化和潜在污染等问题,该系统仍然是对复杂中药进行全面分析的最有效的方法。
通常,建立离线2D LC-MS联用系统有4种组合模式,分别是正相(NP)×反相(RP)、亲水作用色谱(HILIC)×RP、RP×RP、细胞膜色谱(CMC)×RP。在所有这些模式中,RP色谱柱通常充当第二维色谱柱,因为RP色谱柱经观察具有高峰容量且与MS良好相容。
(1)NP×RP:由于其独特的保留机制,NP色谱柱是RP色谱柱良好的替代品。蟾蜍皮是最著名的中药之一,具有很强的抗肿瘤活性。Zhang等提出了一种根据第一维的XAmide色谱柱和第二维的XUnion C18 色谱柱检测蟾蜍甾二烯内酯的全离线2D NP/RPLC-MS联用法。通过几种面积算法,利用15种蟾蜍甾二烯内酯混合物研究了该系统的正交性,研究结果正交性达到49.6%。最终,在蟾蜍皮中鉴定处理64种蟾蜍甾二烯内酯,包括33种微量成分和11对异构体。该团队还提出采用其他两种离线二维系统(HILIC×RP和RP×RP)进行蟾蜍甾二烯内酯的制备法。
(2)HILIC×RP:尽管NP显示与RP色谱柱存在高正交性,但由于其溶剂不环保且应用范围有限,即使在2D LC系统中也未得到广泛利用。HILIC通常被视为“高度含水的NP”色谱,以乙腈和水为主要流动相。和RP不同,水是强效洗脱溶剂。2016年,Jin等综述了HILIC固定相的最新进展和应用。HILIC显示了与常规RP固定相的互补分离,适用于糖苷、低聚糖、类固醇和酚酸。这种模式的重点在于HILIC用作第一维色谱柱的顺序。这种模式已成功应用于人参属的人参皂苷、红花的查耳酮碳苷和黄酮类O-糖苷、丹参(根茎,Salvia miltiorrhiza)的酚酸以及银杏(Ginkgo biloba)叶提取物的成分。为了表征人参根茎和人参叶中的人参皂苷,提出了结合XBridge Amide色谱柱(1D)和亚乙基桥杂化(BEH)-C18 色谱柱的2D LC系统,该系统与线性离子阱四极杆(LTQ)-Orbitrap系统连接。此离线2D LC系统的正交性为69%,峰容量可达到8925。共检测出646种人参皂苷,其中427种为潜在的新代谢产物,而在2012年之前报道11种人参中仅有289种皂苷。在2018年,利用相同的2D LC系统并结合新的数据依赖性采集(DDA)技术,首次在三七(根茎,P.notoginseng)中筛查出945种人参皂苷,揭示了662种潜在的新型人参皂苷(图2)。在这种模式下,分析物特点是具有中等极性,可以保留在HILIC和RP中。
图2 利用离线2D LC-高分辨质谱(HRMS)联用技术和基于UNIFI软件预测代谢产物数据匹配对三七(P. notoginseng)叶(PNL)进行全局分析的典型流程图
(3)RP×RP:此模式首次应用pH正交性。该模式由酸性条件流动相(1D)与带正电荷的RP色谱柱(Acchrom XCharge C18)和碱性流动相(2D)与常规反相色谱柱(EVO C18 )组成。利用此模式,首次系统解析了《中国药典》(2015版)中收录的钩藤(钩藤属)5种植物来源的吲哚类生物碱。离线2D LC系统的正交性为74%。有效地显示和表征了钩藤5种植物来源的1227种吲哚类生物碱,表明该物种具有较高的化学多样性。中药中生物碱成分更适用于这种模式。
(4)CMC×RP:CMC是一种生物亲和性色谱。具有特定受体的细胞膜吸附在活性硅表面,形成细胞膜固定相。只有与受体高度亲和的成分才得以保留。将细胞膜色谱作为第一维构建2D LC系统有利于克服色谱柱寿命短、效率低、峰容量低以及结构鉴定效率低的缺陷。Yue等利用自制的β-1肾上腺素能受体(β1 AR)/CMC柱分析了黄连(Coptis chinensis)提取物,并通过UPLC-MS联用技术分析了各流分。最后,鉴定黄连碱是抑制β-1 AR的主要活性成分。通过体外药理学试验进一步证实了该结果。此模式可以直接筛出有效的活性成分。
2. 在线 2D LC
在线2D LC分析中引入了一个特殊接口,将各流分自动转移至第二维色谱柱。中药全在线2D LC-MS分析的1D分离时间较长(1~2 h,为了提高分辨率),而2D分离时间较短。因此,该方法的峰容量通常小于离线2D LC-MS联用法的峰容量;但是,其重复性优于离线2D LC-MS的重复性,且该方法更适用于多个样品的分析。
(1)接口创新:在全在线2D LC系统中,接口是将所有流分从第一维自动转移至第二维最重要的一环。HILIC×RP系统也在在线2D LC系统中显示了良好的正交性;但是,在注入2D色谱柱前需要对1D洗脱液进行稀释,以便消除溶剂效应。为了分析丹参中的酚酸,选择反冲捕捉柱作为最佳接口,包括可调节分流器、100 μL样品环管和100 μL溶剂混合器。从丹参中成功分离和检测到196个色谱峰。该系统的正交性高达73%。
(2)色谱柱和流动相创新:正交性和1D色谱柱的有机相强度是在线2D LC-MS联用的主要考虑因素。Zhou等提出了一种新开发的苯基/四唑硫醚(PTAS)键合固定相,用于构建RP×RP 2D LC系统。PTAS色谱柱(1D、2.1 mm × 150 mm、5 μm)与亚乙基桥杂化-C 18色谱柱(2D、3 mm × 50 mm、1.7 μm)的选择性差异很大,主要在于其正交性可达93.2%,且疏水性较弱使其与C 18 色谱柱相容。该系统用于分析莪术(根茎,Curcuma kwangsiensis),该中药共检测出439个色谱峰(正/负离子模式),初步鉴定出105种化合物,包括73种以前未报告的代谢产物。混合模式的固定相还有利于提高正交性。与SAX-PFP×C 18 系统相比,改进的SAX-CN×C 18 系统在分析白花蛇舌草(全草,Hedyotis diffusa)和半枝莲(全草,Scutellaria barbata)时显示出更好的峰分布情况和更合理的分析时间。此外,在在线2D LC-MS系统中,可将细胞膜色谱柱用作1D色谱柱。使用该模式成功地从附子(根,Aconitum carmichaelii)中发现了16种抵抗阿霉素(DOX)诱导心力衰竭的潜在活性生物碱成分,并在黄芩(根,Scutellaria baicalensis Georgi)经口给药后的大鼠含药血清中发现了3种潜在的抗肝癌成分——汉黄芩素、千层纸素A和黄芩新素。
对于在线全2D LC,在1D分离中采用超低流速将最大限度降低转移量,并增加每个1D分离色谱峰的采样,从而可在2D分离中进行多次切割。因此,为了分析甘草的次级代谢产物,在第一维中使用微径SeQuant ZIC-HILIC色谱柱(1 mm×50 mm、3.5 μm),以便在降低洗脱强度的情况下降低第一维中的分离速度和实现最小的转移量。最后,检测出89种成分,有趣的是,根据检测到的特定化合物可以区分不同地理位置的甘草样品。对于RP×RP 2D LC系统,可以通过优化流动相中的有机溶剂来提高正交性。在分析甘草中的酚类化合物和三萜皂苷时,利用同步梯度模式可以提高色谱分离,并且在40 min内共检测出311种化合物。峰容量为1329,正交性为79.8%。同样地,使用全RP×RP 2D LC-MS系统从皂荚(猪牙皂,Gleditsia sinensis)中分离和鉴定出72种三萜皂苷。
(3)结合多中心切割(MHC)技术:由于中药错综复杂,在全2D LC-MS分析后通过MHC技术对1D分离出的部分洗脱液进行再次分离。MHC可通过一系列环管收集、保留和分析连续的流分,该环管的采用可使第二维分离时间长达3~5 min。使用该技术可在全2D LC分析后发现更多成分。使用该技术分析了两种中成药葛根清凉汤(GQD)和灯盏生脉胶囊(DZS)。对于葛根清凉汤,使用与全2D液相色谱中相同的色谱柱结构,在4.4 min时将1D洗脱液装入11个40 μl的环管。通过2D分离连续分离这11种馏分,共分解出13种其他的化合物。对于灯盏生脉胶囊,则将另一种手性高效液相色谱(HPLC)柱作为MHC的2D色谱柱,共分离出另外12对具有良好分离度的异构体。该技术也可用于去除主要化合物,以探索是否存在更多微量元素。通过这种方法,在35 min内分别从葛根(根,Pueraria lobata)和粉葛(根,Pueraria thomsonii)的提取物中分离出271个和254个峰。该技术还可用于解决中成药多成分含量测定的难题。
3. 离子淌度
离子淌度光谱仪是带电离子在电场的作用下通过离子迁移池中惰性气体实现分离。作为确定CCS的关键参数,离子的漂移时间取决于离子的大小、形状和电荷。CCS是给定化合物在特定条件下的物理性质。因此,它是构建库的重要参数。色谱分离(s)、离子迁移(μs)和质量检测(ms)的不同时间尺度使其可以串联工作。在三者串联时,除LC-MS分析的维度外还新增了一个维度,该维度有利于分离中药、代谢体和蛋白质组等复杂系统中的异构化合物。
Tose等通过UPLC结合IM-MS联用技术从大麻(Cannabis sativa)、印度大麻制剂和大麻植株花叶中分离出大麻素类异构体。利用改良型MOBCAL计算了大麻素类异构体的CCS,并将其与行波离子迁移质谱(TWIM-MS)结果相关联。Pacini等使用超高效液相色谱(UHPLC)-紫外(UV)-TWIM MS联用技术分析了微藻样品中的色素。色素在450 nm处通过特征吸收突出显示,接着通过TWIM-MS进一步分解和鉴定了31种不同的色素,而通过UHPLC-UV-MS联用技术仅发现了26种色素。这些表征结果也有利于区分小球藻(Chlorella vulgaris)、杜氏盐藻(Dunaliella salina)和三角褐指藻(Phaeodactylum tricornutum)等不同微藻物种。Wang等在分析栀子(Gardenia jasminoides)果实时通过IM-MS实现了对异构体藏红花素-3和藏红花素-4的分离。Willems等根据主要产物离子的强度区分了咖啡酰奎宁酸,并通过电喷雾离子化(ESI)-高场不对称波形离子迁移谱(FAIMS)-MS技术对其进行了分离。采用耗时不到1 min的新方法分离和鉴定了苹果汁/梨汁样品中的单咖啡酰奎宁酸。Zhang等提出了一种多级MS方法,通过整合源内碰撞诱导解离(ISCID)和时间排列平行碎裂提供母离子和子离子之间更可靠的碎裂关系,接着他们使用该方法研究了多环多异戊烯基取代间苯三酚类化合物(PPAP)的碎裂特性。从山竹子(果实,Garcinia oblongifolia)的粗提物中共检测出140种PPAP,其中7对共洗脱、同分异构体的PPAP是通过UHPLC-IM-MS联用技术分化出。2D LC系统串联IM-MS构建四维分离系统,并用于分析银杏(Garcinia oblongifolia)、白花蛇舌草和半枝莲的植物提取物。在第二维中每种化合物均只呈现一个峰,对数调制时间为4 min。在IM的帮助下,可以根据高分辨质谱(HRMS)上的不同分子形状区分相同的m/z离子,而在没有IM的情况下不可能实现这一点。
(二) LC-HRMS 联用技术的智能触发数据依赖型采集(DDA)模式
利用多维分离可以发现更多中药化学成分,但是,若没有m/z和离子碎片信息,将无法鉴定大多数化学成分。随着HRMS技术的广泛使用,离子碎片采集成为最重要的一环。通过DDA和数据非依赖型采集(DIA)可以获取离子碎片信息。一些文章已经对这两种模式进行了讨论,但大部分中药成分筛查研究倾向于根据DDA模式智能获取离子碎片。获得的靶离子碎片越多,破译的中药化学成分越多。最近总结了利用LC-MS联用技术根据特征碎片信息分析微量成分的研究,归纳了获取更多碎片的新型DDA策略。
根据离子强度、质量包含列表或排除列表、同位素模式、拟中性丢失(NL)和质量亏损触发DDA模式。为了深入解析中药的成分类型,这些智能触发DDA可分为仪器依赖型和仪器非依赖型采集。
1. 仪器依赖型智能DDA模式
大多数仪器依赖型智能DDA模式均依赖于所使用的仪器,如LTQ-Orbitrap系统或离子阱(IT)-飞行时间(TOF)系统。最近提出了3种新方法,即NL触发MS3(NL-MS3)法、质量标签触发DDA、根据逐步母离子列表(PIL)光栅质量亏损过滤(MDF)触发DDA。
这些方法中,NL-MS3法的使用频率最高。该方法已用于鉴定具有相同残基或结合物的特定类别的化合物,如黄酮类O-糖苷、丙二酰基结合物和脂肪酸结合物。NL-MS3法旨在利用特定的NL列表确认二羧酸结合的蟾毒素(DACB),通过筛查高能C-阱解离(HCD)下的各种侧链(二羧酸)可获得该列表。最后,在蟾酥(Venenum bufonis)中共发现了78种DACB成分,其中68种为潜在的新化合物。
质量标签触发DDA已用于研究人参提取物中的丙二酰基人参皂苷。通过利用丙二酰基人参皂苷的碎片规律,其中丙二酰基人参皂苷的负离子模式碰撞诱导解离(CID)更容易消除CO2 (43.9898 Da),采用了ISCID。然后,启用“质量标签”功能,使用LTQ-Orbitrap质谱仪确定MS1中的m/z值差异。如果全扫描谱(离子强度高于阈值)中存在与定义的质量标签一致的质量对,质谱仪将关闭ISCID能量并触发选中离子对的多级激活MS/MS。这样,只有在MS1中离子碎片质量差值等于43.9898Da的成分才能获得MS2。接着,结合NL触发MS3法确认丙二酰基人参皂苷。该策略更智能且避免了复杂的数据处理过程。
逐步母离子列表(PIL)光栅MDF触发DDA模式旨在筛查钩藤(Uncariae Ramulus cum Uncis)5种植物来源的吲哚类生物碱[图3(a)]。通过线方程和LTQ-Orbitrap中的最佳母离子质量宽度(PMW)参数创建理论吲哚类生物碱的逐步PIL。根据实验室建立的钩藤生物碱库,以整数质量为x轴、以质量亏损为y轴建立方程。PMW经过优化,可以覆盖潜在的吲哚类生物碱并尽可能排除其他成分。与传统的MDF法相比,这种方法非常方便,可以鉴定更多潜在的新吲哚类生物碱。
图3 使用(a)逐步PIL光栅MDF扫描法和(b)多边形MDF法筛查钩藤中吲哚类生物碱的过程图示
在这3种智能DDA方法中,NL-MS3法适用于糖苷类或脂类成分,而质量标签触发DDA法仅适用于在ISCID中存在固定质量差异的成分。最后一种DDA模式适用于在波动范围较小的情况下MDF和质量之间存在线性关系的成分。
2. 仪器非依赖型智能DDA
母离子列表法(PIL)触发DDA模式通常不依赖仪器,这意味着这类模式可用于大多数高分辨串联质谱仪。为了智能地生成包含特定种类成分的PIL,目前已提出了3种新方法,分别是多边形MDF法、源内多次碰撞(IMC)-中性丢失过滤法(NLF)和同位素模式精过滤法(FIPF)。
通常,通过软件实现MDF,如AB Sciex PeakView、Waters MetaboLynx XS、Thermo Scientific MetWorks和Microsoft Excel。目前已经相继设计了经典矩形MDF法和改良MDF法等不同算法,目的是在降低假阳性和扩大靶覆盖范围之间找到可接受的折衷方案。MDF法已用于通过高分辨质谱数据选择性地检测、提取或分析关注的成分。MDF法可有效鉴别中药的不同化学成分。提出了两种不同于常规矩形绘图算法的多边形MDF法。在筛查三七(P. notoginseng)中的皂苷时,设计了五边形绘图算法来挑选当前关注的母离子。在筛查华钩藤(Uncaria sinensis)中的吲哚类生物碱时,提出了多边形MDF法[图3(b)]。这种算法以各钩藤生物碱库和分子设计为基础。钩藤中所有潜在的吲哚类生物碱均涵盖在质量范围-质量亏损范围内(质量范围指观察值m/z的整数部分),并表现为由8个顶点描绘的八角形区域;然后可以根据全MS总离子列表的限制生成PIL,以确定吲哚类生物碱的种类。
IMC-NLF法用于生成人参中丙二酰基人参皂苷的PIL。该方法利用丙二酰基人参皂苷的碎片规律,即以低能量碎裂产生CO2或丙二酰基。首先,使用多源碰撞能量获取全扫描原始数据,处理数据并将其导出至逗号分隔值(CSV)表格中。然后,使用NL-MS检测器软件生成PIL。最终从人参中提取和鉴定了69种丙二酰基人参皂苷。
使用FIPF法筛查中药中硫衍生物,在m/z=400时将分辨率设定为100 000半峰全宽(FWHM)。硫磺熏蒸中药是一个关键问题,因为这种中药能产生具有未知生物效应的硫衍生物。但是,很难通过传统的同位素模式过滤法(IPF)找出新的硫衍生物,因为天然稳定的 34S不如 37Cl和 81Br丰度高,也就是说, 34S信号将受 13C2 + 18O贡献的巨大影响。根据M+2同位素组成(12Cx1Hy16Oz32S 13C218O、12Cx+21Hy16Oz+134S),硫衍生物的M+2差异为Δm=0.0098 Da。采用这种细化的标准,从葛根和粉葛中初步鉴定出9种硫衍生物,并且快速比较了55种市售样品,这表明可以从更多葛根样品中鉴定出硫磺熏蒸过程。
在上述3种方法中,多边形MDF法适用于大多数成分为相同类型的样品。IMC-NLF法可用于通过DIA法获取的大量原始数据。而FIPF法仅适用于具有特殊元素的成分。大多数PIL触发DDA法会与动态排除(DE)结合使用,如葛根、陈皮叶(Citrus reticulata)和香砂六君子加减颗粒分析所示。应该指出的是,MS实验过程中质量列表过长可能导致工作缓慢和数据丢失,PIL可以拆分为两个或两个以上的分列表。Shen等利用两个各含约250种化合物的分列表表征了丹参中的190种聚合酚酸。
(三)使用 LC-MS 联用技术进行靶分析
使用LC-MS联用技术进行多维分离通常用于化学成分的非靶向分析。但是,靶分析同样重要,因为靶分析可以提供更可靠的中药定量信息或更具体的质量特征相关信息。目前存在两种主要的采集模式:MRM和SIM。上述两种方法已得以广泛应用,但是,鉴于中药的复杂性,本章也提及了一些创新方法。
1. 多反应监测
MRM法应用三重四极杆LC-MS/MS联用系统,同时监测每种分析物的特定母离子和特征产物离子,现已成为广泛用于同时对多种低丰度代谢产物进行定量研究的常用方法。然而,MRM法存在一些瓶颈,如浓度范围、极性范围、一次实验中离子对数量有限以及缺乏真实的对照物质。为了解决甘草属物种(根茎)中成分的浓度范围问题,采用7种方法对3个来源的样品中151种生物活性次级代谢产物进行了定量分析,通过UPLC/MRM法确定了微量成分。通过DNA条码的相关性分析,发现甘草杂交可能显著改变甘草的化学成分,而且父本对后代的贡献大于母本。若极性范围广或存在对映异构体,则在连续通过模式或中心切割2D模式下采用两个不同的色谱柱。在连续通过模式下使用RP LC和HILIC的色谱柱最终鉴定了肉苁蓉(全草,Cistanche salsa)中的21种化合物,并在中心切割2D模式下结合非手性-手性柱同时对18种香豆素进行定量分析,包括前胡(根,Peucedanum praeruptorum)的7对对映异构体。定时MRM法或动态MRM法可用于增加同时检测的离子对数量,从而可在提高灵敏度、优化检出限(LOD)和定量限(LOQ)的情况下鉴定更多化合物,包括牛黄上清丸中的41种成分以及人参和西洋参中的221种人参皂苷。而针对缺乏真实对照物质的问题,需要新的方法来优化MRM参数和实现绝对定量。定量核磁共振氢谱(q1H-NMR)结合色谱分离用于产生假混合标准溶液,从而可以对更多化合物进行定量分析。在四极杆飞行时间(QTOF)仪器上使用步进式MSAll (sMSAll)技术可以预测没有标准值的MRM参数,并将这些参数传输至三重四极杆MS系统。同样地,IT/MS的 MS2可用于生成MRM模式的主要参数,这些参数在定量测定中可提供快速直接的转换设计。
2. 选择性离子监测
由于需要对中药中特征化合物进行表征,从而为中药质量控制 、定性分析和鉴定研究提供支持数据,选择性离子监测法应运而生。与MRM法相比,SIM法在应用ACQUITY QDa MS系统等紧凑型单四极杆MS时易提供合理的选择性、更好的适用范围。因为可在ES– 和ES+ 之间快速切换、参数设置少、成本低、占用空间少,QDa MS是进行SIM的理想工具。
(四)超临界流体色谱(SFC)
SFC是一种传统技术,该技术中将具有低黏度和高扩散性的超临界流体作为流动相,如超临界二氧化碳(sCO2)。随着技术的进步,现已具有更优良的重复性和稳定性,使该技术更适用于中药研究,如超高效超临界流体色谱法(UHPSFC)。该技术具有分离效率高、流动相速度快、分析时间短和环境友好等特点。近年来,已有研究对SFC在中药研究中的应用进行了综述,文章将提到部分特殊应用。
1. 中药脂质组学
脂质组学是对基质中的大量脂质进行全局分析的学科,在很大程度上依赖于分离科学技术的新发展。SFC-MS联用技术可以在降低成本和减少分析时间的同时提高脂质覆盖率,因此可以作为其他分析技术的替代方案。通过UHPSFC/QTOF-MS联用技术综合分析和比较了使用甲基叔丁基醚从三种人参同属种中提取的脂质组。将甲醇作为改性剂、甲醇/0.2 mmol·L−1乙酸铵作为补充流体,利用1.7 μm填料粒径的Torus 2-吡啶甲基胺色谱柱分析样品。成功分离了6种脂质亚类,且与RP系统相比,实现了对极性脂质和脂质异构体更好的分离。在分析了60批人参样品后,共发现了24种三酰基甘油。该技术还用于探索不同产地薏仁的脂类标记物,在这种情况下,二酰甘油酯可作为主要的质量标记物。
2. 中药的极性化学成分
除脂类之外,还通过有效应用SFC技术研究中药的极性化学成分。呋甾皂苷类化合物C-22位羟基具有活性,且易与低级醇发生反应。在40 ℃时,使用甲醇(含0.2% NH3 ·H2O和3%水,作为改性剂)在二醇基色谱柱上分离了22 min,成功分离出10种相似的呋甾皂苷类结构。SFC技术也可用于分离具有相同糖苷配基和不同糖链的螺甾皂苷类化合物,该技术对糖苷配基中羟基的数量和位置非常敏感。但是,使用UHPSFC技术分离具有不同糖苷配基和相同糖配基的螺甾皂苷类化合物并不是一种理想的手段,可以用UHPLC法取代。UHPLC法可有效鉴别糖苷配基的变化,且显示是否受糖苷配基中双键的影响。将甲醇/乙腈(体积比70:30)、1%三氟乙酸(TFA)作为改性剂,流速为0.8 mL·min−1,使用亚乙基桥杂化色谱在25 min内对苍耳子(果实,Xanthium sibiricum Patr)中的8种酚酸进行了定量分析。针对类黄酮,将0.1%磷酸甲醇溶液作为极性流动相,使用Zorbax Rx-SIL色谱柱在15 min内对菊花(花,Chrysanthemum morifolium Ramat)中的5种类黄酮进行了定量分析。对于药用真菌牛樟芝(Antrodia camphorata)中的7对25R/S-麦角甾烷 类化合物,Chiralcel OJ-H色谱柱(4.6 mm×250 mm、5 μm、手性)和Princeton乙基吡啶色谱柱(2-EP、4.6 mm×250 mm、3 μm、非手性)具有不同的分析优势。手性色谱柱有效分离每对化合物,而非手性色谱柱能有效分离不同的对,即使每个25R/S差向异构对的分离效果不如OJ-H色谱柱的分离效果好。此外,SFC-MS联用技术优化了3种三萜皂苷(苦丁冬青苷、甾体皂苷和人参皂苷)。为了综合判断SFC技术的代谢产物分析性能,采用120种高度多样化的天然化合物对15种不同固定相色谱柱进行了比较。研究发现,3种固定相(二醇、未封端C18 和2-EP)适用于非靶向监测分析和方法开发,因为这些固定相可以对120种天然化合物中的101种进行适当洗脱。研究发现,未封端T3 C18 和极性P-PFP可以为特定天然分子亚类提供更大的选择性。
3. 制备对照化合物
制备高纯度对照物质是中药质量控制的关键。然而,由于极性溶剂或水溶剂可能出现快速结构变化,或由于热不稳定性,一些天然化合物纯度不高,无法用作标准物质。使用无水流动相在两个非手性Torus 1-氨基蒽(1-AA)色谱柱和Torus DIOL色谱柱上分别分离了两对7-螺羟吲哚类生物碱。离线2D SFC-RP LC联用系统具有良好的正交性,已成功从牛蒡子(果实,Arctium lappa L.)中分离出12种木酚素。
(五)大数据库集的数据挖掘
通过LC-HRMS法或SFC-HRMS联用法对中药进行全面的非靶向分析,获取高维度大型数据集。即使与代谢组学相比,从这些大数据库集中收集数据挖掘信息也非常困难,因为中药的化学组成多样性明显多于生物内源性化学组成。此外,很少有科学家涉足该领域,能够获取的专业数据库屈指可数。因此,借助各种生物信息学策略,试图从大量数据集中挖掘数据。将介绍数据挖掘的3个方面。
数据匹配:通常是第一步,利用精确的质量或分子式检索化学库,从而识别潜在的化合物。但是,库中储存的化学结构数量有限,因此利用化学库鉴定植物代谢产物非常具有挑战性。代谢产物预测算法可以在枚举中使用预先定义的子结构或“构筑块”,以便预测代谢产物中是否存在结构成分;这将增加可用化学库的化学覆盖空间,实现更高效、结构去重复且预测更准确。该方法尤其适用于结构多样的糖苷分子,如皂苷类和糖化黄酮类化合物中的糖苷分子,这些分子通常由与各种糖基和酰基轭合的糖苷配基组成。借助商业软件UNIFI或内部软件PlantMATM,在库中生成使用葡萄糖、木糖、鼠李糖和丙二酰基单元一步修饰和两步修饰的人参皂苷。利用这种方法匹配了三七叶中的更多人参皂苷,这种方法也适用于木酚素和多酚。
数据筛选/分类:基于LC-HRMS联用技术原始数据(包括MS1和MS/MS或MS n 数据)中包含的大量信息进行数据筛选/分类仍是一项艰巨的任务。目前,已提出许多后采集数据处理策略,用于数据筛选或分类。对于MS1数据,无处不在的基质干扰使微量成分的表征难上加难。因此,通过结合各种筛选方法,提出了整合的筛选策略和R脚本。该策略成功快速地从艾叶(叶,Artemisiae argyi)的UPLC-HRMS数据集中筛查出16种甲氧基化黄酮类化合物和55种绿原酸类似物。
对于MS/MS数据,从碎片离子信息中获取大量结构信息。因此,提出了关键离子过滤策略,用于筛选和划分黄芩中的不同黄酮类化合物。最后,从黄芩中鉴定出132种化合物,其中59种首次报道。同样地,根据诊断产物离子划分了威灵仙(根茎,Clematis chinensis Osbeck) 中的三萜皂苷、 紫草( 根,Arnebia euchroma)中的紫草宁和紫草呋喃以及杜仲(皮,Eucommia ulmoides Oliv)和蒺藜(果实,Tribulus terrestris)中的成分。全球天然产物协会分子网络(http://gnps.ucsd.edu)是另一种高效划分大量MS/MS数据集的方法,这是一个面向全社区组织的开放知识库,可以共享原始的、处理后的或鉴定的串联(MS/MS)MS数据。该平台可用于根据改良的余弦评分方案创建分子网络,这种方案可判定两个MS/MS的相似性并使大量MS/MS数据的归类过程可视化;它将成为一种宝贵的中药化学研究手段。
对于MSn 数据,可使用Mass Frontier软件中的质谱树状图相似度过滤技术(MTSF)来鉴定化合物和获取子结构信息。该技术可以筛选有用的HRMS和MSn 数据,并通过计算相似度匹配分数建立未知化合物和模板化合物之间的联系。在分析二仙汤时,使用该技术成功排除了不相关的离子。
对于混合模式,不同裂解模式可以提供互补的碎片离子信息。通过在LTQ-Orbitrap中结合传统的CID-MS3和HCD-MS2,使用诊断产物离子(DPI)过滤法和NLF法对红花中黄酮类O-糖苷的糖苷配基和糖分类。
数据挖掘:利用化学计量学进行数据挖掘已成为一种广泛使用的中药质量研究手段。主成分分析(PCA)和(正交性)偏最小二乘判别分析[(O)PLS-DA]是最常用的监督和非监督数据挖掘方法。可以识别对应不同物种、植物不同部分、不同产地、不同“炮制”、不同供应商]以及不同批次的质量标记物。然后,利用人工神经网络(ANN)或支持向量机(SVM),根据这些质量标记物预测中药的质量。此外,可以通过主成分分析鉴定新型化合物。在三重四极杆质谱仪上通过12种不同NL/母离子(PRE)扫描得到了12份姜黄(根茎,Curcuma longa)离子色谱图。接着,PCA能够将具有相似NL/PRE模式的数据进行聚集,而无需了解其分子量,而那些具有不同NL/PRE模式的化合物很容易被识别为可能具有新结构的异常值。
四、中药质量控制的应用
随着对中药化学性质认识的加深,可以确认哪些质量标记物可用作中药质量标准。为了节省标准物质的使用和检测时间,提出了两种质量策略。
(一) 一标多测(SSDMC)法
SSDMC法仅需要一种标准物质就能同时鉴定十余种化合物。尽管该方法非常方便,但是其校正因子对UV检测器和峰测量参数极度敏感。此外,用于计算校正因子的对照溶液的浓度应在合理范围内。目前,SSDMC法已广泛用于中药的质量控制,包括薏苡仁(种子,Coix lacryma-jobi L.)中的7种三酰甘油、附子中的6种生物碱、人参中的9种人参皂苷、黄芩中的4种黄酮类化合物、灵芝(Ganoderma)中的17种三萜类化合物、天麻块茎(根茎,Gastrodia elata)中的11种成分、丹参酮提取物中的4种丹参酮、金银花中的6种化合物(花,Lonicera)、虎杖(根茎和根,Polygonum cuspidatum)中的4种化合物、功劳木(枝,Mahoniae Caulis)中的4种生物碱、红景天(根茎和根,Rhodiola crenulata H. Ohba)中的3种酚类化合物以及甘遂(根,Euphorbia kansui)中的13中成分。波长程序、蒸发光散射检测器(ELSD)和MS检测器已用于一标多测法中。但是,对于质谱检测器,在将该方法用作质量标准方法前需要考虑更多影响因素。除了SSDMC法,通过对照物质提取物进行定量分析(QASRE)和定量核磁共振(qNMR)光谱技术在节省标准物质方面均具有独特的优势。每种方法各有利弊,应具体情况具体分析。
(二) 一法多用法
由几种到几十种中药制成的中成药是中药的主要利用形式。一方面,中成药极大地丰富了中药的应用范围,促进个性化的药物治疗方案;另一方面,中成药形成了极其复杂的基质,妨碍质量控制。考虑到中成药的庞大数量及其质量控制的难度,针对每种中成药构建定性和定量方法将非常耗时且相当困难。因此,文章提出了一法多用法,便于对不同中成药中的相同中药成分进行鉴定和定量测定。
1. 鉴定
中药质量控制的主要化学鉴定方法是薄层色谱法(TLC)和高效薄层色谱法(HPTLC)。TLC法和HPTLC法的灵敏度低,峰容量差,表明需要针对不同中成药中的相同中药成分开发新的方法。因此,这将导致样品制备程序复杂,实验时间长,甚至造成无法实施任何鉴定方法的情况。
红花常用于多种中成药中,但因为中成药中红花含量较少,大多数使用红花的中成药无法鉴定红花的成分。因此,通过UHPLC/QTOF-MS联用技术对20批红花进行了化学分析,并进行了热稳定性试验后,选择6种查耳酮C-糖苷作为化学分类学标记物。接着,在这6个标记物的基础上建立了一种灵敏且具有高度特异性的SIM方法,鉴定了28种不同中成药的红花成分。令人惊讶的是,在其中10批样品中,这6个标记物无法全部检出,而在其中两批样品中,几乎检测不出这6个标记物中的任意一个标记物。同样地,在鉴定舒胸片的3种中药成分即三七、川芎(根茎,Rhizoma Chuanxiong)和红花(花)时,《中国药典》(2015版)中采用了3种繁琐的TLC法。通过QDa MS检测仪,选取覆盖3种中药的11个标记物来评估12批疏血通片。在一次实验中鉴定出所有3种中药,表明QDa MS技术拥有与QTOF-MS联用技术相同的鉴定能力。
2. 定量测定
不同中成药中相同中药的定量测定涉及复杂的样品制备程序和案例依赖型色谱参数。因此,需要建立一套通用的方法,可以同时对涉及相同植物的不同中成药进行质量评估。
三七是许多中成药中常用的一种中药。三七皂苷R1及人参皂苷Rg1、Re、Rb1和Rd是主要活性成分,因此被视为标记物成分。《中国药典》(2015版)收录了80多种涉及三七的中成药,其中11种中成药将三七作为君药。研究发现,某些中成药没有质量控制或其质量控制的少量几个成分分析条件受色谱条件影响较大。构建了中心切割2D LC系统,同时测定8种不同中成药中的5种标记物皂苷。2D LC技术具有高峰容量,因此简化和统一了样品制备方法。从专属性、线性、重复性、稳定性和准确性等方面对该方法进行了验证,结果证明该方法具有高特异性、良好分辨率和高分析效率等优点。对于那些具有相同定量指标的中成药,这种统一的方法极大地促进了质量控制(图4)。
图4 一法多用法与中心切割2D HPLC-UV联用系统的图示
五、展望
文章系统地总结了中药非靶向和靶向分析化学的最新技术和方法学进展,并描述了两种制定中药质量标准的质量控制策略。随着LC-HRMS联用技术、液相色谱-固相萃取(SPE)-NMR联用技术和SFC-HRMS联用技术等联用分析方法的不断发展,可以轻松快速地识别中药中的更多微量成分。针对非靶向分析,离线 2D LC-HRMS联用技术是最有效的方法,可用于鉴定中药中的多种成分,尤其是该技术与离子淌度联用时。在自动化和标准操作以及计算机辅助数据挖掘等方面的更多进展将提高重复性并减少该方法的数据分析时间。应该指出的是,大多数非靶向研究仅关注中药中的几种次级代谢产物,如皂苷、黄酮类、生物碱、酚酸和萜烯类,普遍认为这些产物与生物活性相关。但是,应该更多地重视中药中其他含量丰富的成分,如单宁、多糖、脂类和蛋白质,这些成分也可能影响药理活性,从而影响质量。对于在线全2D LC-HRMS联用技术,改进第二维色谱柱的分析时间将显著提高峰容量。而针对中心切割2D LC方法,更好地集成接口可能使该方法更适用于中药的质量控制。在LC-MS分析中,IM技术为成分分析提供了一个额外的参数,非常有利于鉴定。提高IM分离将使其更适用于中药的化学分析。在LC-HRMS分析中,采用DDA模式最大程度地暴露中药化学成分的二级碎片需要及其精巧的设计。然而,只有特定类型的化合物能产生DDA模式所需的碎片离子信息。DIA是一种生成MS/MS碎片的非靶向模式,它需要通过计算方法来解决碎片离子信息。DIA领域仍需要更多创新方法。实用性和覆盖率是靶分析的两大主要方面。MRM的覆盖范围越广,验证效果越好,就越能提供更可靠的中药质量信息的相关信息。SIM方法结合使用紧凑稳健的质谱仪,其实用性可能引起行业内中药质量标准模式的变革。随着SFC-MS联用技术重复性和稳健性的提高,一旦设计出更多专用色谱柱,就可以将该方法用于更多化学分析中。R、Python或MATLAB等计算机语言非常有利于理解和处理从LC-HRMS中获取的大数据集。GNPS是一个非常有用的MS/MS数据分类和数据匹配平台。在不远的将来,人工智能(AI)必将成为数据挖掘最重要的手段。随着对中药化学性质认识的加深,所有质量相关化学信息均可以以全息方式储存在物质数据库中。
检测成本和检测时间是评估中药质量标准实用性的两个重要因素。采用SSDMC法和一法多用法执行更多应用和标准规范。“深入研究,浅出标准”的理念将提高中药质量标准,并更容易将中药转化为药品。
改编原文:
Jinjun Hou, Jianqing Zhang, Changliang Yao, Rudolf Bauer, Ikhlas A. Khan, Wanying Wu, De'an Guo. Deeper Chemical Perceptions for Better Traditional Chinese Medicine Standards[J]. Engineering,2019,5(1): 83‒97.