NGS基础 - 高通量测序原理
从1977年Sanger发明了双脱氧链终止法一代测序技术开始,测序技术发展至今已有四十多年时间,先后经历了以GS FLX、Solexa、SOLID为基础的二代测序技术,以及基于单分子实时测序(SMRT)和纳米孔测序技术的三代测序技术。虽然三代测序在蓬勃发展,并在基因组和转录组测序等领域展现出前所未有的优势,但限于成本问题,其应用范围尚不及二代测序。
二代测序技术以其短读长、高通量、准确性高的特点,仍在测序市场上占优势地位。以Illumina Solexa为例,首先利用超声波将DNA打断成200-500bp小片段文库,加接头后DNA片段随机附着于flowcell表面,经过桥式PCR扩增形成“DNA簇”,实现碱基信号强度放大,采用边合成边测序的方法,进行全基因组全面,准确的测序。
2014年Illumina推出HiSeq X Ten测序仪,它利用数十亿个纳米孔的流动槽,较大缩短了测序周期。2017年它又推出了新一代测序仪NovaSeq系列,我们以相同文库分别进行Hiseq Xten系列和NovaSeq系列测序,DNA重测序产出数据指标如下:
看完重测序,再看看转录组文库测序比较:
基于以上结果,总结了以下几点:
1.测序原理:X-ten与Nova6000测序原理均是基于solexa的边合成边测序的原理;Nova6000采用Illumina的EX-AMP簇生成技术,以及新一代的Patterned Flow Cell。
2.Q30质量值:在实际测序中Nova6000的Q30相对于X-ten更稳定且测序时长更短,试剂衰减对质量影响更小,整体的Q30 Nova6000要优于X-ten。
3.测序方式:受限于X-ten的控制软件以及试剂等因素,X-ten只能进行单Index的测序识别;而Nova6000可以进行I7 I5双端Index的测序,理论上可以做到更精准的识别。
4.DNA文库冗余度:Nova6000明确优于X-ten平台。
有木有发现随着二代测序仪器的发展,测序结果真是又快又好,目前二代测序较多的应用于基因组重测序,转录组分析,小分子RNA研究等领域。基于二代测序技术进行遗传图谱构建,基因定位的研究也越来越多。
小白的生信笔记(1)——高通量测序的一些基础知识
1977年,英国化学家桑格(Frederick Sanger)发明了双脱氧链终止法,这个技术以及吉尔伯特(W.Gilbert)发明的化学降解法被称为一代测序技术。 Sanger法测序利用一种DNA聚合酶来延伸结合在待定序列模板上的引物。直到掺入一种链终止核苷酸为止。每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP),并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP)。由于ddNTP缺乏延伸所需要的3-OH基团,使延长的寡聚核苷酸选择性地在G、A、T或C处终止。终止点由反应中相应的双脱氧而定。每一种dNTPs和ddNTPs的相对浓度可以调整,使反应得到一组长几百至几千碱基的链终止产物。它们具有共同的起始点,但终止在不同的的核苷酸上,可通过高分辨率变性凝胶电泳分离大小不同的片段,凝胶处理后可用X-光胶片放射自显影或非同位素标记进行检测。 不同于一代测序,NGS采用的是边合成边测序的策略,主要的技术路线以Roche公司的454技术、illumina公司的Solexa,Hiseq技术和ABI公司的Solid技术为代表。为了增强测序准确性,需要对同一模板通过PCR扩增多个拷贝来矫正偏差值。因此整个测序分为PCR扩增(一种可以快速复制大量产生相同DNA片段的技术)和测序两个步骤。但是PCR过程会一定程度增加系统的错误率,并且带来的错误具有偏向性,这也是二代技术存在的问题之一。 illumina公司主打产品MiSeq测序仪、HiSeq X Ten测序仪、Miseq FGx测序仪、NextSeq 500/550桌上型测序仪、MiniSeq台式测序仪等,涵盖了不同的应用场景的不同需求。 第二代测序技术测序平台和测序成本,测序费用,花费时间,建库等实验技术难度,错误率以及读长(150-400bp),分析工作的体量,对于满足更高的科研需求和在医疗诊断中的普及都是不小的阻碍。其PCR过程带来的误差和偏好或成为其在医疗诊断大规模运用的阻碍。三代技术主要解决二代测长较短的问题。 PacBio 的SMRT 技术,LifeTechnologies 的 IonTorrent 半导体测序技术和 Oxford NanoporeTechnologies 纳米孔单分子测序技术是三代测序技术的代表。 PacBio SMR PacBio的SMRT仍然运用边合成边测序的策略,但是其超强活性的DNA聚合酶是实现超长读长(~1000bp)的关键。反应在纳米管中进行,方便达到超高通量的目的。利用的是ZMW(零模波导孔)原理在超小的纳米孔中区别荧光信号的背景。其测序速度很快,每秒约10个dNTP。目前的问题在于测序的错误率太高(81-83%),这也是大多数三代技术需要解决的共同问题。不过错误随机,几乎没有偏向性,为其通过矫正来减少错误率提供了可能。目前这个技术已经投入市场。 Oxford Nanopre MinlON 而Nanopore的MinlON测序仪应用纳米孔单分子技术,这是一种基于电信号的测序技术,比起其他的光信号测序技术来说是一个革新。技术核心是一种特殊的内有分子接头的纳米孔,由蛋白质小孔嵌在人造膜上形成。膜两侧加上电压,使电流通过小孔。当不同的DNA碱基通过纳米孔时,其对电流的阻碍作用短暂地影响流过纳米孔的电流强度,不同碱基影响的程度不同,这种差异被灵敏的电子设备捕捉从而鉴定所通过的碱基种类。这种技术的优点很多,读长长(大约在几十kb,甚至100 kb),错误随机,而不是聚集在读取的两端,通量较高,该公司也在努力简化样品制备流程。理论上运用这个技术RNA也可以直接测序,还能检测到甲基化的胞嘧啶。不过不能实现理想的错误率控制,或成为其投入市场的阻碍。 LifeTechnologies IonTorrent IonTorrent 使用半导体芯片,在芯片的微孔中固定DNA链。依次加入AGCT的碱基,DNA合成时如果碱基可以结合到模板链则会释放一个氢离子。这个氢离子导致局部HP值发生变化。离子传感器检测到PH 变化后,便将化学信号转变为序列信息。而如果DNA 链有两个连续的相同碱基,则记录到的信号翻倍,从而将其识别。如果不匹配,则记录不到变化。这种技术由于不涉及荧光激发和拍照,则运行时间被大大缩减(仅数小时),无需激光光源,光学系统和照相系统,也不需要荧光标记,规避了这些环节带来的误差。但是其读长不算太长(200bp),并且当遭遇多个连续的相同碱基时,强烈的PH变化会带来误差。 de novo测序也称为从头测序:其不需要任何现有的序列资料就可以对某个物种进行测序,利用生物信息学分析手段对序列进行拼接,组装,从而获得该物种的基因组图谱。 外显子组测序是指利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后进行高通量测序的基因组分析方法。外显子测序相对于基因组重测序成本较低,对研究已知基因的SNP、Indel等具有较大的优势,但无法研究基因组结构变异如染色体断裂重组等。 Magenomics研究的对象是整个微生物群落。相对于传统单个细菌研究来说,它具有众多优势,其中很重要的两点:(1)微生物通常是以群落方式共生于某一小生境中,它们的很多特性是基于整个群落环境及个体间的相互影响的,因此做Metagenomics研究比做单个个体的研究更能发现其特性;(2) Metagenomics研究无需分离单个细菌,可以研究那些不能被实验室分离培养的微生物。 单核苷酸多态性singlenucleotide polymorphism,SNP 或单核苷酸位点变异SNV。个体间基因组DNA序列同一位置单个核苷酸变异(替代、插入或缺失)所引起的多态性。不同物种、个体基因组DNA序列同一位置上的单个核苷酸存在差别的现象。有这种差别的基因座、DNA序列等可作为基因组作图的标志。人基因组上平均约每1000个核苷酸即可能出现1个单核苷酸多态性的变化,其中有些单核苷酸多态性可能与疾病有关,但可能大多数与疾病无关。单核苷酸多态性是研究人类家族和动植物品系遗传变异的重要依据。在研究癌症基因组变异时,相对于正常组织,癌症中特异的单核苷酸变异是一种体细胞突变,称做SNV。 基因组上小片段(《50bp)的插入或缺失,形同SNP/SNV。 当基因组发生某一段的缺失,或转录组的剪接,在测序过程中,横跨缺失位点及剪接位点的reads回帖到基因组时,一条reads被切成两段,匹配到不同的区域,这样的reads叫做soft-clipped reads,这些reads对于鉴定染色体结构变异及外源序列整合具有重要作用。 由于大部分测序得到的reads较短,一个reads能够匹配到基因组多个位置,无法区分其真实来源的位置。一些工具根据统计模型,如将这类reads分配给reads较多的区域。 拼接软件基于reads之间的overlap区,拼接获得的序列称为Contig(重叠群)。 基因组de novo测序,通过reads拼接获得Contigs后,往往还需要构建454 Paired-end库或Illumina Mate-pair库,以获得一定大小片段(如3Kb、6Kb、10Kb、20Kb)两端的序列。基于这些序列,可以确定一些Contig之间的顺序关系,这些先后顺序已知的Contigs组成Scaffold。 Reads拼接后会获得一些不同长度的Contigs。将所有的Contig长度相加,能获得一个Contig总长度。然后将所有的Contigs按照从长到短进行排序,如获得Contig 1,Contig 2,Contig 3...…Contig 25。将Contig按照这个顺序依次相加,当相加的长度达到Contig总长度的一半时,最后一个加上的Contig长度即为Contig N50。举例:Contig 1+Contig 2+ Contig 3+Contig 4=Contig总长度*1/2时,Contig 4的长度即为Contig N50。Contig N50可以作为基因组拼接的结果好坏的一个判断标准。 Scaffold N50与Contig N50的定义类似。Contigs拼接组装获得一些不同长度的Scaffolds。将所有的Scaffold长度相加,能获得一个Scaffold总长度。然后将所有的Scaffolds按照从长到短进行排序,如获得Scaffold 1,Scaffold 2,Scaffold 3...……Scaffold 25。将Scaffold按照这个顺序依次相加,当相加的长度达到Scaffold总长度的一半时,最后一个加上的Scaffold长度即为Scaffold N50。举例:Scaffold 1+Scaffold 2+ Scaffold 3 +Scaffold 4 +Scaffold 5=Scaffold总长度*1/2时,Scaffold 5的长度即为Scaffold N50。Scaffold N50可以作为基因组拼接的结果好坏的一个判断标准。 测序深度是指测序得到的总碱基数与待测基因组大小的比值。假设一个基因大小为2M,测序深度为10X,那么获得的总数据量为20M。覆盖度是指测序获得的序列占整个基因组的比例。由于基因组中的高GC、重复序列等复杂结构的存在,测序最终拼接组装获得的序列往往无法覆盖有所的区域,这部分没有获得的区域就称为Gap。例如一个细菌基因组测序,覆盖度是98%,那么还有2%的序列区域是没有通过测序获得的。 用测序的数据组装成转录本。有两种组装方式:1,de-novo构建; 2,有参考基因组重构。其中de-novo组装是指在不依赖参考基因组的情况下,将有overlap的reads连接成一个更长的序列,经过不断的延伸,拼成一个个的contig及scaffold。常用工具包括velvet,trans-ABYSS,Trinity等。有参考基因组重构,是指先将read回贴到基因组上,然后在基因组通过reads覆盖度,junction位点的信息等得到转录本,常用工具包括scripture、cufflinks。 比较基因组学(ComparativeGenomics)是基于基因组图谱和测序基础上,对已知的基因和基因组结构进行比较,来了解基因的功能、表达机理和物种进化的学科。利用模式生物基因组与人类基因组之间编码顺序上和结构上的同源性,克隆人类疾病基因,揭示基因功能和疾病分子机制,阐明物种进化关系,及基因组的内在结构 Q30是指一个碱基的识别可靠性等于99.9%,或者说出错可能性是0.1%。Q20则是指碱基识别的可靠性等于99%。Q30数据量是指一批数据中,质量高于等于Q30的数据的量的总和。 PF是pass filter的意思。也就是质量合格的意思。Illumina的测仪序会自动地对一个read(序列)的质量可靠性进行打分。对于前25个碱基中的是否有两个碱基的识别可靠性低于0.6,是PF的判断标准。这句话翻译成较容易理解的话: 就是前25个碱基中,如果低质量的数据有2个或更多,则这条read被判定为不合格,PF就不通过。反之,则质检通过。 PF是国际公认的质检标准。对于哺乳动物基因组重测序、外显子测序,我们保证数据质量是Q30的比例高于80%。对于mRNA测序,smRNA测序,我们保证对照Lane的数据质量是Q30的比例高于80%。 一般情况下: 哺乳动物基因组重测序、外显子测序,GC比例在40%左右,Q30的比例是80~95%; RNA-seq,GC比例在50%左右,Q30的比例是~80%。如果Poly(A)特别多的情况下,Q30会更低一些; SmRNA-seq,因为有许多的read读通之后,只剩下一串的A,质量会更低,我们的实验结果%Q30在70~75%。 Illumina的测序仪的数据产量高,数据质量也是最高的。因为采用带终止基团的荧光dNTP,所以在测Homopolyer(碱基同聚物,例如一串4个T:TTTT)等的时候,不会产生移码错读。 Roche 454采用的是pyrosequencing的测序原理,通过水解DNA全成过程中所产生的焦磷,放出光,通过测这光来读出序列。优点是读长最长。但是数据产量是最低的。 Ion Torrent,包括PGM和Proton,采用测量DNA合成过程中所释放的氢离子引起的PH值的变化,来得到序列。优点是速度最快,上机前约3~4天的时间,上机只要2~4个小时。 SOLID采用的是杂交,连接反应,再测荧光的方法。因为杂交,所以速度慢,测长较短。现在事实上已被淘汰。 PacBio是三代测序,也就是单分子测序。目前的情况是测序长度可以在1个KB以上,而且可以测出DNA序列的修饰情况。但是其缺点在于测序的准确度很低,目前的测序准确度只有每个碱基80~90%。另一方面通量较小,一次读7万条reads.***隐藏网址*** 1977年,英国化学家桑格(Frederick Sanger)发明了双脱氧链终止法,这个技术以及吉尔伯特(W.Gilbert)发明的化学降解法被称为一代测序技术。Sanger曾经在1958年及1980年两度获得诺贝尔化学奖,是第四位两度获得诺贝尔奖,以及唯一获得两次化学奖的人。其第一次获奖是凭借定序胰岛素的氨基酸序列,证明蛋白质具有明确构造,而第二次获奖就是因为其双脱氧链终止法——Sanger法的发明。利用这个技术他成功测定了Φ-X174噬菌体(Phage Φ-X174)的基因组序列。Sanger也是一个传奇的大科学家,现在基因组研究中举足轻重的桑格研究院(Sanger Institute)便是这位大牛一手建立的。 第一代测序技术的特点是测序读长可达1000bp,准确性高达99.999%,但测序成本高,通量低等方面的缺点,严重影响了其真正大规模的应用。但由于高精度,现今一代测序仍然是基因检测的金标准,也是对新一代测序结果进行评估验证的主要手段。而在当时,正是一代测序技术使得基因组的研究在当时成为了可能,浩浩荡荡的人类基因组计划即将轰轰烈烈的展开。1977年,英国化学家桑格(Frederick Sanger)发明了双脱氧链终止法,这个技术以及吉尔伯特(W.Gilbert)发明的化学降解法被称为一代测序技术。Sanger曾经在1958年及1980年两度获得诺贝尔化学奖,是第四位两度获得诺贝尔奖,以及唯一获得两次化学奖的人。其第一次获奖是凭借定序胰岛素的氨基酸序列,证明蛋白质具有明确构造,而第二次获奖就是因为其双脱氧链终止法——Sanger法的发明。利用这个技术他成功测定了Φ-X174噬菌体(Phage Φ-X174)的基因组序列。Sanger也是一个传奇的大科学家,现在基因组研究中举足轻重的桑格研究院(Sanger Institute)便是这位大牛一手建立的。 第一代测序技术的特点是测序读长可达1000bp,准确性高达99.999%,但测序成本高,通量低等方面的缺点,严重影响了其真正大规模的应用。但由于高精度,现今一代测序仍然是基因检测的金标准,也是对新一代测序结果进行评估验证的主要手段。而在当时,正是一代测序技术使得基因组的研究在当时成为了可能,浩浩荡荡的人类基因组计划即将轰轰烈烈的展开。
新一代测序原理及意义是什么怎样理解高通量及操作简单
新一代(第二代)测序技术的测序原理是“边合成边测序”. 先把基因组打断成100kb左右的小片段,每个片段单独测序,测完以后依靠大型计算机进行拼接,所以新一代测序仪测序简单,难在拼接. 测序时,以待测DNA片段为模板,进行互补链的合成,每延伸一个碱基就进行一次激光扫描,读出是哪种碱基(四种碱基事先进行不同标记,在激光下呈现不同颜色),很方便地就完成了测序. 高通量体现在一次上机能测的样本数,第一代测序仪一次上机仅能测96个样本,第二代测序仪一次上机能测数万个样本. 操作简单体现在机器自动化. 新一代测序的意义,是实现了高通量、低成本、快速、操作简便,为开展大规模物种测序及人类基因组研究提供了可能.,10, coala_731 举报 难怎样准确的拼接?样本量不太大(《15)的时候跟一代测序优缺点在哪? 难以拼接是因为样本打断得太小了。像人类基因组大小是3G,打断成100kb,相当于是打成了3万个片段,用3万个片段去拼出一个完整的人类基因组,计算量及复杂程度可想而知。 样本量很小的时候二代测序没有任何优势,反而会成本很高。 二代测序的最突出优势就是高通量,只有很多样本批量上机时,成本才能降下来。一代测序就显得很灵活,样本量多少不会牵涉到成本。,
高通量测序的介绍
高通量测序技术(High-throughput sequencing)又称“下一代”测序技术(Next-generation sequencing technology),以能一次并行对几十万到几百万条DNA分子进行序列测定和一般读长较短等为标志。
二代测序原理及应用
二代测序又称为高通量测序(High-throughput sequencing),是基于PCR和基因芯片发展而来的DNA测序技术。
关于二代测序的临床应用:
二代测序作为一种检测手段,主要应用于基因的生殖变异(遗传性)与体细胞变异(获得性)的检测。对于遗传病,主要的技术方案是靶向区域测序(targeted panel),全外显子测序(whole exome),全基因组测序(whole genome)和线粒体DNA测序。
其中,靶向区域测序主要针对明确表型的疾病相关基因进行测序,常见的panel有:免疫缺陷panel,骨髓衰竭综合征panel,致盲或致聋缺陷panel,线粒体病panel,肾脏疾病panel,神经疾病panel,结缔组织疾病panel,心肌疾病panel和遗传性肿瘤易感panel等。
靶向测序类方案有最大的特点是不同实验室由于方案制定与panel设计的年代局限,检测的基因范围都会有不一样。对于肿瘤类检测,由于针对的样本类型不一样,使用场景的设计不一样。
更是大多区分为:1.针对每个基因的编码区域,或者加上UTR甚至外显子的边沿(exon padding,为了更好的发现剪切体变异--splicing mutation),2.针对某些临床证据或者药物作用靶点/耐药位点的特定热点(hotspot panel)。
另外还有基于胎儿游离DNA的NIPT也是二代测序在转化医学中非常经典的应用例子。随着技术的成熟,二代测序也开始应用于肿瘤游离DNA的检测,HLA的分型,病原体检测,转录组测序,以及甲基化测序。
但是这些领域的应用,特别是对ctDNA的二代测序应用于肿瘤早筛,学界仍存在担忧,作者主要是提出两点:1.在正常人的游离DNA中也能检测出假阳性的驱动变异,2.在某些早期阶段的肿瘤,ctDNA NGS的灵敏度可能存在不足(30%~60%)。这两点可能限制ctDNA用于肿瘤早期筛查的适用性。
关于二代测序的技术方案:
目前二代测序主要技术方案,是靶向区域测序(panel),从靶向区域获取的技术来区分主要分为液相捕获技术(采用RNA探针或者DNA探针),以及PCR目标区域捕获技术。通常的,液相捕获是先把DNA片段化为特定的长度(酶切或者超声),加入接头,然后用探针捕获。而PCR捕获不需要DNA片段化,直接先PCR把目标区域富集然后再加接头。
而不论是哪种捕获技术,靶向区域测序一般都有以下环节:DNA提取,文库制备,目标区域富集,上机测序四大环节。
DNA提取:
常规DNA提取一般都能满足二代测序的样本要求。但是对于肿瘤的FFPE样本处理起来要特别小心,特别是对于陈旧的样本来源,DNA损伤与降解非常常见,而且FFPE样本一般要经过显微切割与脱腊等步骤,也可能造成DNA的得率的下降。DNA提取的一个很关键的质控步骤,一般选择Qubit来定量,因为低浓度DNA Qubit的测量值比NanoDrop相对更灵敏一点。
基因组高通量测序的原理
测序方案建立在双脱氧测序法(Sanger等,1977)的基础上。为了从每一克隆插入片段两端成对地进行测序,每一个质粒模板DNA板应配备两个384孔循环测序反应板。
测序反应采用BigDyeTerminatorchemistryversion3.1(AppliedBiosystems)和标准M13或常用正向引物和反向引物。测序反应通过BiomekFX(Beckman)移液操作工作站建立。
机械臂负责等分模板试样,起与反应液混合的作用,反应液含有双脱氧核苷酸、荧光标记的核苷酸、TaqDNA聚合酶、序列引物和缓冲液。
模板和反应板有条形码,且在BiomekFX移液操作工作站上有条形码读取器跟踪,确保模板和反应液转移中没有错误。30~40线性扩增步骤连续循环在MJResearchTetrads或9700热循环仪(Ap—pliedBiosystems)中进行。
***隐藏网址***
扩展资料:
技术发展:
高通量测序平台(high-throughput_genome_sequence_database)自从2005年454LifeSciences公司(2007年该公司被Roche正式收购)推出了454FLX焦磷酸测序平台(454FLXpyrosequencingplatform)以来。
曾推出过3730xlDNA测序仪(3730xlDNAAnalyzer)的AppliedBioSystem(ABI)这家一直占据着测序市场最大份额的公司的领先地位就开始动摇了。
因为他们的拳头产品毛细管阵列电泳测序仪系列(seriescapillaryarrayelectrophoresissequencingmachines)遇到了两个强有力的竞争对手,一个就是罗氏公司(Roche)的454测序仪(RochGSFLXsequencer)。
另一个就是2006年美国Illumina公司推出的Solexa基因组分析平台(GenomeAnalyzerplatform),为此,2007年ABI公司推出了自主研发的SOLiD测序仪(ABISOLiDsequencer)。这三个测序平台即为目前高通量测序平台的代表。
高通量测序原理
高通量测序原理是将基因组 DNA 片断化,然后克隆到质粒载体上,再转化大肠杆菌。对于每个测序反应,挑出单克隆,并纯化质粒 DNA。
高通量是相对于第一代测序的,第一代测序只能一次测1个样品的1段序列,产生的数据量相对来说很小,而高通量测序一次能够产生的数据量在几十G上百G,可以一次测很多的样本。
高通量测序技术的诞生可以说是基因组学研究领域一个具有里程碑意义的事件。该技术使得核酸测序的单碱基成本与第一代测序技术相比急剧下降,以人类基因组测序为例,上世纪末进行的人类基因组计划花费30亿美元解码了人类生命密码,而第二代测序使得人类基因组测序已进入万美元基因组时代。
高通量基因测序检查俗称无创DNA,即抽取孕妇静脉血,进行胎儿染色体的检查,目前进行该项检查的孕妇数目逐渐增多。无创DNA检查具有一定的适应症,符合适应症的孕妇需遵医嘱进行检查。
高通量基因测序产前筛查相比血清学产前筛查,费用较为昂贵,约为1900元,筛查率和准确率更高,21-三体筛查的准确率一般可达95%。
高通量测序分的原理是什么
对DNA分子进行序列测定。
1.对几十万到几百万条DNA分子进行序列测定和一般读长较短等为标志。
2.根据发展历史、影响力、测序原理和技术不同等,主要有以下几种:大规模平行签名测序(Massively Parallel Signature Sequencing, MPSS)、聚合酶克隆(Polony Sequencing)、454焦磷酸测序(454 pyrosequencing)、Illumina (Solexa) sequencing、ABI SOLiD sequencing、离子半导体测序(Ion semiconductor sequencing)、DNA 纳米球测序 (DNA nanoball sequencing)等。
3.高通量测序技术是对传统测序一次革命性的改变,一次对几十万到几百万条DNA分子进行序列测定,因此在有些文献中称其为下一代测序技术(next generation sequencing)足见其划时代的改变,同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又被称为深度测序(deep sequencing)。
4.自从2005年454 Life Sciences公司(2007年该公司被Roche正式收购)推出了454 FLX焦磷酸测序平台(454 FLX pyrosequencing platform)以来,因为他们的拳头产品毛细管阵列电泳测序仪系列(series capillary array electrophoresis sequencing machines)遇到了两个强有力的竞争对手,曾推出过3730xl DNA测序仪(3730xl DNA Analyzer)的Applied BioSystem(ABI)。
参考资料
互动百科.百度
二代测序技术原理及流程
第二代测序(Next-generation sequencing,NGS)又称为高通量测序(High-throughput sequencing),是基于PCR和基因芯片发展而来的DNA测序技术。我们都知道一代测序为合成终止测序,而二代测序开创性的引入了可逆终止末端,从而实现边合成边测序(Sequencing by Synthesis)。二代测序在DNA复制过程中通过捕捉新添加的碱基所携带的特殊标记(一般为荧光分子标记)来确定DNA的序列,现有的技术平台主要包括Roche的454 FLX、Illumina的Miseq/Hiseq等。由于在二代测序中,单个DNA分子必须扩增成由相同DNA组成的基因簇,然后进行同步复制,来增强荧光信号强度从而读出DNA序列;而随着读长增长,基因簇复制的协同性降低,导致碱基测序质量下降,这严格限制了二代测序的读长(不超过500bp),因此,二代测序具有通量高、读长短的特点。二代测序适合扩增子测序(例如16S、18S、ITS的可变区),而基因组、宏基因组DNA则需要使用鸟枪法(Shotgun method)打断成小片段,测序完毕后再使用生物信息学方法进行拼接。
流程:
①末端修饰:
使用Taq聚合酶补齐不平的末端;
并在两个末端添加突出的碱基A,从而产生粘性末端(若使用Taq酶扩增,则无需末端修饰);
产生粘性末端的片段可以添加接头(Adaptor)。
经过末端修饰后的PCR片段末端具有突出的A尾,而接头具有突出的T尾,可以使用连接酶将接头添加到DNA片段两端。
NEB的接头为特殊的碱基U连接的环状结构(可以增强稳定性),因此连接接头后,还需要将碱基U删除从而形成“Y”形接头。
上一步添加的接头主要是为了后续PCR中作为引物扩增继续添加文库index和与测序平台互补的寡核苷酸序列(此外还作为测序引物Rd1 SP/Rd2 SP)。
之所以为“Y”型开叉结构,是因为每一端接头是两条不互补的序列(每一端都是Rd1 SP与Rd2 SP交错),连接酶没有选择性,每个接头都是只靠突出的T来与DNA连接,“Y”接头保证了每条单序列两端均为不同的测序引物,从而在后续PCR中可以连接不同的寡核苷酸序列(P5/P7)。
②添加接头:
高通量测序技术及原理介绍
高通量测序技术及原理介绍如下:
高通量测序技术(High-throughput sequencing)又称“下一代”测序技术(“Next-generation” sequencing technology),以能一次并行对几十万到几百万条DNA分子进行序列测定和一般读长较短等为标志。
测序技术推进科学研究的发展。随着第二代测序技术的迅猛发展,科学界也开始越来越多地应用第二代测序技术来解决生物学问题。比如在基因组水平上对还没有参考序列的物种进行从头测序(de novo sequencing),获得该物种的参考序列,为后续研究和分子育种奠定基础。
对有参考序列的物种,进行全基因组重测序(resequencing),在全基因组水平上扫描并检测突变位点,发现个体差异的分子基础。在转录组水平上进行全转录组测序,从而开展可变剪接、编码序列单核苷酸多态性(cSNP)等研究。
或者进行小分子RNA测序(small RNA sequencing),通过分离特定大小的RNA分子进行测序,从而发现新的microRNA分子。在转录组水平上,与染色质免疫共沉淀(ChIP)和甲基化DNA免疫共沉淀(MeDIP)技术相结合,从而检测出与特定转录因子结合的DNA区域和基因组上的甲基化位点。