美章网 资料文库 测序技术的应用影响分析范文

测序技术的应用影响分析范文

本站小编为你精心准备了测序技术的应用影响分析参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

测序技术的应用影响分析

DNA测序技术是分子生物学研究中最常用的技术,以应用DNA双脱氧链终止法的Sanger测序为代表的第一代测序技术,在分子生物学研究领域发挥过重要的作用[1],如人类基因组计划(Humangenomeproject,HGP)的完成就是基于第一代测序技术[2]。目前,应用该技术的美国应用生物系统公司(AppliedBiosystems,ABI)3730系列全自动测序仪仍然被广泛使用。伴随着基因组和后基因组时代的来临,第一代测序仪已经不能满足深度测序和重复测序等大规模核酸测序的需求,这就促使自2005年以来诞生了以Roche/454GenomeSe-quencerFLXSystem、Illumina/SolexaGenomeAnalyzerIIx和ABISOLIDSystem等测序平台为标志的新一代测序技术。新一代测序技术又称为深度测序技术,其最主要的特征是高通量测序,测序时间和成本都显著降低[3]。本文对新一代测序技术的基本情况、主要应用以及对作物分子育种的影响等三个方面进行重点阐述。

1新一代测序技术的基本情况

基于不同创新方法的各种新一代测序平台,尽管从模板文库构建、片段扩增到测序等过程所采用的技术与生物化学相当多样,但是共同点是均采用了大规模矩阵结构的微阵列分析技术,其测序的核心思想是边合成边测序(Sequencingbysynthesis,SBS)或者边连接边测序(Sequencingbyligation,SBL)。首先将片段化的DNA双链两侧连上接头,随后变性得到的单链固定在固体表面,运用微乳滴PCR(EmulsionPCR,emPCR)、桥式PCR等不同方法产生几百万个克隆阵列,然后利用聚合酶或连接酶进行延伸反应。生成DNA互补链时,加入的dNTP通过酶促级联反应催化底物激发出荧光,或者直接加入被荧光标记的dNTP或半简并引物,在合成或连接生成互补链时,释放出荧光信号。通过成像检测系统捕获光信号并转化为一个测序峰值,获得互补链序列信息。由于所有的克隆都在同一平面上,这些反应就能够大规模平行进行,每个延伸反应所掺入的荧光标记的成像检测也能同时进行。DNA序列延伸和成像检测不断循环,最后经过计算机分析就可以获得待测DNA片段的序列信息。

1.1Roche/454测序平台454生命科学公司是新一代测序技术的奠基者,最早推出了划时代的新型高通量基因组测序系统———GenomeSequencer20System,这一技术的建立开创了边合成边测序(Sequencingbysynthe-sis,SBS)的先河,利用微乳滴PCR实现DNA片段的扩增,光学信号的产生基于焦磷酸测序法[4-5]。之后,454公司被罗氏诊断公司(RocheInc.)收购,测序仪经过改造升级,相继推出GSFLXSystem和GSFLX+System。为适合规模较小的实验室,Roche/454还推出初级版的新一代测序仪GSJun-iorSystem。目前,最新的Roche454GSFLX+System最长读长能达到1kb,平均读长700bp。相对其他公司开发的新一代测序仪,Roche/454测序仪的突出优势是较长的测序读长,但是测序价格比较昂贵。对于那些要求较长读长的应用,如复杂基因组的从头测序项目,Roche/454测序仪是最理想的选择。

1.2Illumina/Solexa测序平台Illumina公司的新一代测序仪最早由Solexa公司研发,基于边合成边测序(Sequencingbysyn-thesis,SBS)的思想,利用其专利核心技术“DNA簇”和“可逆性末端终结(Reversibleterminator)”,实现自动化样本制备和大规模平行测序,其文库片段的扩增是通过桥式PCR来实现[5]。Illumina公司收购了Solexa,目前推出多种型号,满足各种需求的测序仪,按测序产量的多少排序为HiSeq2000(600Gb)、HiSeq1000(300Gb)、HiScanSQ(150Gb)、GenomeAnalyzerIIx(95Gb)、MiSeq(>1Gb)。数据产量最大的HiSeq2000测序系统的末端配对读长可达到2×100bp,虽然在读长上比Roche/454测序仪短,但是由于运行成本低廉,数据读取量大,Illumina/Solexa测序仪是性价比较高的新一代测序平台,已经得到广泛应用。

1.3ABISOLID测序平台美国应用生物系统公司(AppliedBiosystems,ABI)的3730系列全自动测序仪在第一代测序方面一直占据着重要地位。新一代测序技术出现以后,ABI公司推出SOLiD新一代测序平台,并且不断进行改进,如今升级到SOLiD5500xlSystem。与Roche/454测序仪相似,ABISOLID测序平台也是通过微乳滴PCR扩增DNA模板,该平台的独特之处在于碱基测序过程中没有采用传统的聚合酶延伸反应,而是以四色荧光标记寡核苷酸的连续连接反应为基础[5]。SOLiD测序过程中的连接反应没有DNA聚合酶合成过程中常有的错配问题,再加上SOLiD特有的“双碱基编码技术”又提供一个纠错机制,这种设计上对每个碱基判读2次的优势使得SOLiD在系统准确性上大大领先于其他新一代测序平台,SOLiD5500系统准确性达到99.99%。该测序平台的主要缺点是序列读长相对较短,目前SOLiD5500系统最大测序读长为75bp,末端配对读长为75bp×35bp。

1.4其他新一代测序平台HelicosBiosciences公司开发的HeliScopeSingleMoleculeSequencer,原理是“单分子测序”,仍然基于边合成边测序;但是不同于以上3种测序平台,不需要经过PCR扩增构建单链DNA测序文库,它采用了一种非常灵敏的荧光捕获系统,能够直接检测到一个单分子所释放的荧光信号[6]。目前,HeliScopeSingleMoleculeSequencer的序列读长范围是25bp到55bp,平均读长是35bp。Heli-ScopeSingleMoleculeSequencer避免了PCR扩增而引入的不确定因素,同时所消耗的试剂量大大降低,有利于控制成本;但是该平台测序准确度明显较低,主要是缺失错误。而经过改造后,在第一轮测序结束,通过加热解链去掉延伸链,可以对同一模板从相反的方向进行二轮测序,这样显著提高了准确率。另一种单分子测序平台是PacificBiosciences公司开发的单分子实时技术(Singlemoleculerealtime,SMRT),其单分子的荧光探测依赖于一种被称为零级波导(Zeromodewaveguide,ZMW)的纳米结构来实时观察DNA聚合和消除背景荧光干扰[7]。单分子实时技术与HeliScopeSingleMole-culeSequencer平台一样,提高原始数据的准确率是一个挑战,不过同样可以通过对同一样品进行重置后的多轮测序来降低错误率,而且该平台在长序列产出、高速测序和低成本等方面具有巨大优势。

2新一代测序技术的主要应用

随着新一代测序技术商业化平台的不断推出,由于其在基因组学研究方面具有低廉的价格、高通量的数据、简易的样品处理过程等优点,生物科学家已开始越来越多地应用新一代测序技术来解决相关生物学问题。

2.1全基因组从头测序(denovosequencing)对于基因组序列未知的物种,可以应用新一代测序系统对其基因组进行从头测序,通过拼接组装,从而获得该物种的基因组序列图谱。Huang等[8]通过联合运用Sanger测序技术和Illumina/SolexaGenomeAnalyzer测序平台绘制了黄瓜基因组草图,得到平均72.2倍覆盖度的基因组序列,其中3.9倍是用Sanger技术得到的,68.3倍是用Illumina/SolexaGenomeAnalyzer测序平台得到的。Wang等[9]利用Illumina/SolexaGenomeAn-alyzerⅡ测序仪对白菜基因组进行测序,产生72倍覆盖度的成对短序列,组装得到283.8Mb基因组序列,覆盖基因序列98%以上,预测基因大约42000个,发现白菜基因组中存在3个类似但基因密度明显不同的亚基因组,推测白菜基因组在进化过程中经历了2次全基因组复制事件与2次基因丢失过程,还发现在基因组发生复制之后,与器官形态变异有关的生长素相关基因发生了显著的扩增,这可能是白菜类蔬菜具有丰富根茎叶形态变异的根本原因。相对于传统的Sanger测序技术,采用新一代测序技术实现全基因组的从头测序,从根本上改变着解析生物基因组的方式,其强大的数据产出能力,显著提高了基因组测序效率,急剧降低了成本,使得对任意物种进行全基因组测序成为现实。目前,一大批重要作物的全基因组正在应用新一代测序技术进行测序,包括基因组复杂的油菜和棉花等。

2.2全基因组重测序(Resequencing)在某物种参考基因组序列已知的前提下,新一代测序平台能高效率地完成该物种不同群体或个体的全基因组测序,从而进行基因组序列的差异化分析。由于新一代测序技术的高通量、大规模、低成本,所以物种基因组重测序迅速得到推广,应用前景广阔。Lai等[10]对6个玉米骨干自交系进行了全基因组重测序,每个自交系平均测序深度约5.4倍,分析发现100多万个单核苷酸多态性位点和3万多个插入缺少多态性位点,以及101个低多态性序列区段,这些区段内含有大量在选择过程中与玉米自交系优良性状有关的候选基因,同时还鉴定出数百个基因在自交系之间有存在与丢失的多态变化,这种基因存在与丢失多态性和其他有害突变的互补作用可能与杂种优势有关。Huang等[11]通过对517个水稻地方品种的全基因组测序鉴定出约360万个单核苷酸多态性位点,并构建了高密度的水稻单体型图谱(HapMap),然后利用373个籼稻品种群体对株型、产量、子粒品质、着色和生理特征等14个农艺性状进行全基因组关联分析,结果鉴定的位点可解释约36%的表型变异,其中有6个位点的峰值信号与之前鉴定的农艺性状基因紧密连锁,该研究为水稻遗传学研究和育种提供了重要的基础数据资源。Xu等[12]利用40个水稻栽培品系和10个野生稻材料进行15倍覆盖度以上的全基因组重测序,获得约650万个单核苷酸多态性位点,80多万个插入缺失突变和9万多个结构变异以及1676个拷贝数变异,基于这些数据分析发现数千个在水稻驯化过程中与人工选择有关的基因,这些基因可能与水稻相关农艺性状有重要的相关性。应用新一代测序平台,通过对不同目的材料的全基因组重测序可以实现单核苷酸多态性位点进行基因分型的检测[11,13]、不同群体间进化分析和表型变异相关基因的发掘[12,14-15]、突变基因位点的快速定位[16]等。

2.3RNA测序把高通量测序技术应用到由mRNA反转录生成的cDNA测序上,从而获得特定样品中基因mR-NA片段的信息,这就是RNA测序。根据采用的测序策略不同,RNA测序分为表达标签测序(Tag-Seq)[17]和转录组测序(RNA-Seq)[18]。表达标签测序(Tag-Seq)策略的原理是一个转录本3'端特定位置21bp(CATG+17bp)的标签可以特异性地代表该基因。首先采用2种特殊的限制性核酸内切酶NlaIII和MmeI制备标签文库(Taglibrary),然后利用深度测序技术获得所有标签的序列信息,最后将这些标签与参考基因序列数据库比对,得到样品中基因的表达情况。每个基因的表达量来源于其对应的标签数量,相对于传统的基于核酸杂交的基因芯片技术,标签测序技术不需要预先针对已知基因序列设计探针,结果能够提供更为准确的数字化信号,而且检测通量更高、范围更广[19]。Wang等[20]应用标签测序技术研究了徐州142和其无绒突变体在棉花纤维发育起始阶段和纤维伸长阶段胚珠的基因表达谱,基因差异表达分析发现在野生型和突变体对应时期的比较中表达基因的种类和数量都明显不同,而且重点分析了表达差异倍数最大的前20个基因,涉及纤维素合成、磷脂酶及脱氢酶等。Wang等[20]还分析了已经功能验证的与纤维发育有关的基因,结果发现这些基因理论表达模式与表达谱分析结果一致,充分证明标签测序技术的准确性,与前人利用基因芯片技术的结果相比较,标签测序获得数字基因表达谱数据在分析深度和范围上都明显改善。转录组测序(RNA-Seq)是通过新一代高通量测序技术对片段化mRNA反转录生成的cDNA进行测序,利用拼接并统计相关序列测序次数,获得不同转录本(mRNA)的表达信息。转录组测序是目前深入研究全转录组复杂性的强大工具,可以研究任意物种的特定状态下所有基因转录本的丰度信息,以及发现新的转录本、可变剪接体和检测单核苷酸多态性等。Zhang等[21]第一次应用转录组测序技术对栽培水稻的8个不同组织进行了转录组学水平分析,发现了一大批以前技术未发现的新转录本,可变剪接分析表明33%的水稻基因存在顺式剪接,另外鉴定出由于反式剪接产生的234个转录本,这些结果证明水稻转录调控比以前预测要复杂得多。这一结论在另一模式植物拟南芥中也被证实,Filichkin等[22]通过相同的方法,发现至少42%的含有内含子的基因在拟南芥中有可变剪接,这一数据远远高于以前基于cDNA/EST测序方法的估计值。Graham等[23]利用Roche454测序平台对青蒿材料进行转录组测序,鉴定关键基因和分子标记,然后构建了一张青蒿遗传图谱,定位了与青蒿素产量有关的数量性状基因位点(QTL)。

2.4其他应用基于新一代测序技术的小分子RNA测序(SmallRNAsequencing),通过分离特定大小的RNA分子进行高通量测序,能够一次性获得数百万条小分子RNA序列,可以快速定性和定量地鉴定某种组织或细胞群在特定状态下的几乎所有小分子RNA。应用小分子RNA测序方法能分析不同样品中的小分子RNA差异表达,鉴定新的小分子RNA并预测其靶基因。Wang等[24]利用陆地棉品种徐州142及其无纤维无短绒突变体的胚珠作为材料,发现7个纤维起始相关的miRNA,并明确了其作用的靶基因,另外还鉴定出36个新的棉花miRNA。小分子RNA测序还可以与转录组测序技术相结合,综合分析mRNA和小RNA的表达模式,研究小RNA与其靶基因表达的相关性[25]。高通量测序技术与染色体免疫共沉淀技术(Chromatinimmunoprecipitation,ChIP)结合,即ChIPSequencing,通过采用特异性抗体免疫沉淀目的蛋白质,富集目的蛋白质所结合的基因组DNA片段并在高通量测序平台上测序,从而检测到目的蛋白在基因组中的结合位点,全面分析蛋白质与DNA的相互作用。Kaufmann等[26]成功将该技术应用在对拟南芥转录因子SEPALLATA3在基因组中结合位点的研究。DNA甲基化是非常重要的表观遗传修饰方式,基于新一代测序技术的亚硫酸氢盐(Bisulfite)处理测序技术是分析全基因组DNA甲基化的有效手段,Lister等[27]就通过该技术获得了拟南芥野生型与DNA甲基转移酶突变体的全基因组甲基化图谱。

3新一代测序技术对作物分子育种的影响

新一代测序技术的出现,催生了一批新的基因组学和“后基因组学”研究手段,使遗传学研究产生了革命性进步,呈现出全新的面貌。基于新一代测序技术的基因组水平上的全基因组测序、重测序方法和转录水平上的表达谱分析、转录组测序以及研究转录后调控的小RNA测序等分析方法使科研工作者对作物生长发育过程各种生理生化机制的探索上升到基因组水平,从而对作物分子生物学和品种遗传改良带来深远影响。更多的基因组未测序物种应用新一代测序平台高效率、低成本地完成全基因的从头测序,丰富核酸序列和基因资源,为进一步开发分子标记、挖掘重要功能基因和解析生长发育机制等分子生物学研究提供重要基础和依据。通过全基因组重测序,可以完成检测单核苷酸多态性位点进行基因的分型、不同群体间进化分析和表型变异相关基因的发掘、快速定位突变基因位点等。基于新一代测序技术的大规模转录组学分析方法,相对于基因芯片技术,以其高通量和定量信息更准确的优点,被迅速地广泛应用,大量实验证明这些方法是分离候选目的基因和研究目标性状形成或特定生理发育过程分子机制的有效途径。总的来说,分子标记的开发、遗传图谱的构建、功能基因的分离以及遗传机制的阐明等,极大地丰富分子标记辅助选择育种、转基因育种和分子设计育种的利用资源,显著促进种质资源的挖掘与利用效率,大大缩短育种年限和降低成本投入。目前已有报道,通过对玉米骨干自交系进行全基因组重测序探究杂种优势机理[10],在水稻育种方面,新一代测序技术已广泛应用于发掘与重要农艺性状有关基因[11-12]。可以预见,随着技术方法的不断创新,新一代测序技术必将促进作物分子育种的快速发展,使利用功能基因组学进行分子设计育种逐步成为现实。