序列中出现N值的常见原因:
通常有以下几种情况将造成测序结果中N值较多:
- PCR产物直接进行测序,在PCR产物长度以后将无反应信号,机器将产生许多N值。通常我们很容易辨别PCR产物结束的位点,PCR产物测序一般末端的一个碱基为A(绿色峰),这是由于Taq酶能够在PCR反应的末端非特异性地加上一个A碱基,我们用T载体克隆PCR产物就是根据该原理的。在最后一个碱基A后,信号会迅速减弱。因此我们要根据序列正确判断出PCR产物的末端序列,在此序列以外就不是我们所要的序列了。
- 在序列的起始端有时会有一些N值。该种情况主要是有未去除的染料单体造成的干扰峰。该干扰峰和正常序列峰重叠在一起,有时机器将无法正确判断出为何碱基。有时,在序列的起始端的小片段容易丢失,导致起始区信号过低,机器有时也无法正确判读。现在公司已采取了有效措施,序列起始区的信号已大为改善,有时几乎第一个碱基就可以正确读出,染料的干扰问题基本解决。但是客户提供的PCR引物用于测序时,有时会产生引物二聚体,对测序的起始区造成干扰。
- 在序列的3’端容易产生N值。一个测序反应一般可以读出900bp以上的碱基,但是,只有550bp以前的碱基是可靠的,理想条件下,多至700bp的碱基都是可以用的。一般在650bp以后的序列,由于测序胶的分辩率问题,会有许多碱基分不开,就会产生N值,这种情况下产生的N值是无法避免的。现在我们只承诺正常情况下每个测序反应至少读出500个碱基的有效序列。
- 测序模板本身含有杂和序列,该种情况主要发生在PCR产物直接测序上。由于PCR产物本身有突变或含有等位基因,就会造成在某些位置上有重叠峰,产生N值。可以很容易判断该种情况,那就是整个测序信号都非常好,只有在个别位置有明显的重叠峰,视杂和度不同N值可能有多有少。该种情况明显是客户的样品问题。通过将PCR产物克隆后进行测序,可以解决该种情况的N值问题。
- 由于模板质量问题或测序不好,所得的序列结果较差,也会产生许多N值。一般情况测序结果不好的,我们都会根据具体原因尽量加以解决。有些实在无法解决的也就没有办法了。
针对有N值的情况,我们一定要根据具体情况具体分析。很多情况下是客户自己的模板原因造成N值,在这种情况下我们没有必要为客户承担测序失败的损失。有许多情况下由于客户的原因造成的测序失败,我们至少要让客户知道是客户本身的原因而不是我们的技术问题。
我为什么找不到我的PCR引物?
以下几种情况,我们将无法找到做PCR时的引物序列:
- 用PCR引物作为测序引物进行测序时,所测序列是从引物3’末端后第一个碱基开始的,所以自然就找不到您的引物序列了。有两种方法可以得到您的引物序列。对于较短的PCR产物(<600bp),可以用另一端的引物进行测序,从另一端测序可以一直测到序列的末端,就可以在序列的末端得到您的引物的反向互补序列。对于较长的序列,一个测序反应测不到头,因此就只能将您的PCR产物片段克隆到适当的载体中,用载体上的通用引物进行测序。由于载体上的通用引物与您的插入序列之间还有一段距离,因此就可以得到您的完整的引物序列。由于在测序的起始端总会有一些碱基无法准确读出,因此,您如果想得到您的PCR产物的完整序列,最好克隆后进行测序。
- PCR产物用T载体克隆后,由于克隆的方向是随机的,因此,当您在一条链上找不到您的引物序列时,试图在互补链上寻找您的引物序列。
- 当测序引物离您的插入片段很近时,有时可能也无法找到您的引物的全序列。这主要是因为有时测序的起始端由于未去除的染料或引物二聚体的干扰,造成起始区的序列不好,可能无法找到您的引物完整序列。
- 有时,质粒做模板进行测序时,由于某些原因,质粒上没有插入外援片段,为空载体,所测的序列完全为载体序列,此时自然也找不到引物序列。
我的基因序列与标准序列为什么有差别?
一段基因序列经扩增后,克隆到载体中进行测序。在两个层次上可能导致序列发生变化。首先在PCR扩增过程中就可能产生错误。将片段克隆到载体中也有可能发生突变。其次,测序的准确率问题。ABI公司承诺其仪器的测序精度在一定范围内可以达到98.5%以上。由于仪器准确率的限制,在一个较长的序列中发生碱基序列错误是难以避免的。在确认克隆无误的情况下,通过双向测序可以最大限度减少测序的错误。您如果想得到您的最准确的序列,进行双向测序是很有必要的。只进行简单的单向测序,我们无法保证所测序列的完全准确性,这是由仪器的精度决定的。
过短的PCR产物为什么不适于直接测序?
首先过短的PCR产物纯化困难,一般的PCR产物纯化试剂盒都要求PCR产物片段大于200bp,过短的PCR产物纯化和准确定量都非常困难。因此我们要求用于测序的PCR产物一般不低于200bp长度。
其次,由于测序本身的限制,以一个100bp的PCR产物用于测序为例,去掉两个引物的序列大约40到50bp,再加上测序起始端的一些读不出的碱基,真正能够得到的有用序列不过30~40碱基。这么少的序列很难向客户收费。上面是在最理想的条件下的假设,稍不顺利,测序就失败了。因此,过短的PCR产物,只能克隆后进行测序。
用测序的方法检测点突变可靠吗?
有的客户想用测序的方法检测点突变体,我认为该方法可靠性不高。主要有以下两个原因。首先,我们并不清楚突变的序列与正常的序列的比例是多少。测序反应的信号强度直接与模板的量有关,如果突变的模板所占的比例很少,将直接作为背景噪音了,很难检测出来。只有当测序反应体系中正常的和突变的模板量比较接近时,才能较可靠地检测到突变体的存在。其次,在同一位置,不同碱基的信号强渡一般是不一样的。这样即使突变的模板所占的比较较高时,也不一定能准确检测到突变的存在。另外,测序仪是设计用来测序正常的碱基序列的,软件在对扫描的结果进行处理时,会尽量提高主峰而将背景信号尽量压低,以得到尽可能好的结果。因此,当某处出现双峰时,测序仪一般会认为信号弱的峰为背景信号,在处理过程中,将弱的峰进一步压低,这样根部不立于突变体的检测。因此认为,用测序的方法检测突变体的存在不是一个好的方法。
与测序引物有关的问题:
对于通用测序引物,只要正确使用,一般不会有太大问题,测序引物问题主要发生在客户自己提供的PCR引物上。应该明确的一点是并不是所用的用于PCR的引物都可以用来作测序,以下几种PCR引物将是不适合用作测序引物的:
简并引物,
简并引物必然要在测序模板上有多个结合位点,直接影响测序结果。
随机引物,如RAPD引物,
随机引物一般都比较短,所用退火温度低,在测序反应的条件下,不能很好地与模板结合。
过长的引物,一般要求测序引物不大于24bp,最长不能超过30bp。
过长的引物在测序反应的较低的条件下容易在测序模板上有多个结合位点,导致测序结果背景增高。另外,较长的引物纯度也将难以保证。通常用于测序的引物纯度要在90%以上,引物纯度低时,测序反应的背景将明显增大,直接影响到测序结果。
有特殊标记的引物,
该情况主要指荧光标记的引物。我们测序反应的四种碱基都是荧光标记的,这样,荧光标记的引物将产生干扰。另外,其他一些有大的标记基团的引物也最好不要用于测序。引物上大的标记基团将直接影响到DNA片段的迁移率,导致测序结果峰型不好或错误。
不纯的引物:
测序引物对纯度的要求很高,合成的引物中非全长的片段可以造成较强的背景。以一个20bp的测序引物为例,直接脱盐纯化的话,纯度至多在70%左右,也就是说将有30%的引物将作为背景噪音,这必将严重影响测序结果。一般经PAGE或OPC法纯化的引物基本能达到测序的要求。
造成测序反应模板量低主要有以下几种原因:
客户提供的PCR产物量太少,经纯化后不足以满足测序需要。
一些低拷贝的质粒按照常规方法提取,所得质粒很少,经浓缩后仍然很少。
客户提供的PCR产物或质粒的量很少是我们测序反应中经常遇到的一个问题。为解决该问题,我们在平时收客户模板的过程中需要注意如下事项:
质粒类型的测序模板尽量让客户提供菌液,不要直接提供质粒。菌液我们可以控制模板提取的量和质量。而且,所提供的质粒类型一般应为高拷贝的。以下几种质粒是我们测序成功率非常高的,包括pGEM-T载体,pUC及其衍生载体等。
对于PCR类型的测序模板,未纯化的PCR产物要保证足够的量,一般我们要求客户提供50~100 uL的PCR扩增产物,并且要求PCR扩增的质量要高。有杂带的PCR扩增产物我们尽量不要收。对于纯化的PCR产物,要保证足够的量,通常要求客户对已纯化的PCR产物用电泳进行检测。一般来说,对于一个1kb长的纯化PCR产物进行测序,客户提供的PCR产物量不应低于200ng。另外,用分光光度法进行的PCR产物定量是极不可靠的。对于未纯化的PCR产物,提供的量应至少为已纯化的PCR产物的量的2倍。
另外,PCR产物测序客户需提供相应的PCR扩增引物用于测序。引物最好稀释成5 uM的浓度,总体积不低于20 uL。
最后一点是,我们应该明确,并不是所有的测序样品都能测出满意的序列。根据我们的统计并参考其他公司的情况,一般会有10%到15%的序列是难以测出的。对于大部分未测出的序列,我们可以找到尽可能的原因,以建议客户下一步如何做 |