单核苷酸多态性主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。SNP是指在基因组内特定核苷酸位置上存在两种不同的碱基,其中最少一种在群体中的频率不小于1 %。 SNP分为两种形式,一是基因编码区的 SNP,称为 cSNP;二是遍布于基因组的大量单碱基变异。SNP作为一种碱基的替换,大多数为转换,即一种嘌呤换为另一种嘌呤或一种嘧啶换为另一种嘧啶,转换与颠换之比为 2∶1。
中文名单核苷酸多态性
Single nucleotide polymorphisms
由碱基的插入或缺失所致
DNA序列多态性
SNP在基因组内的形式
一是遍布于基因组的大量单碱基变异;
二是分布在基因编码区(coding region) , 称其为cSNP,属功能性突变。
SNP在单个基因或整个基因组的分布是不均匀的:
(1)非转录序列要多于转录序列
(2)在转录区非同义突变的频率, 比其他方式突变的频率低得多。
SNP的特点
在遗传学分析中,SNP作为一类遗传标记得以广泛应用, 主要源于这几个特点:
(1)密度高
SNP在人类基因组的平均密度估计为11000 bp , 在整个基因组的分布达3×106个,遗传距离为 2~3cM,密度比微卫星标记更高,可以在任何一个待研究基因的内部或附近提供一系列标记。
(2)富有代表性
某些位于基因内部的SNP有可能直接影响蛋白质结构或表达水平,因此,它们可能代表疾病遗传机理中的某些作用因素。SNP自身的特性决定了它更适合于对复杂性状与疾病的遗传解剖以及基于群体的基因识别等方面的研究。
(3)遗传稳定性
与微卫星等重复序列多态性标记相比,SNP 具有更高的遗传稳定性。
(4)易实现分析的自动化
SNP标记在人群中只有两种等位型(allele) 。这样在检测时只需一个“ + - ”或“全无”的方式,而无须像检测限制性片段长度多态性,微卫星那样对片段的长度作出测量,这使得基于SNP的检测分析方法易实现自动化。
数量分布
据估计,人类基因组中每1000个核苷酸就有一个SNP,人类30亿碱基中共有300万以上的SNPs。SNP 遍布于整个人类基因组中,可位于基因编码区、基因的非编码区以及基因间区(基因和基因之间)。
适于筛查
组成DNA的碱基虽然有4种,但SNP一般只有两种碱基组成,所以它是一种二态的标记,即二等位基因(biallelic)。 由于SNP的二态性,非此即彼,在基因组筛选中SNPs往往只需+/-的分析,而不用分析片段的长度,这就利于发展自动化技术筛选或检测SNPs。
容易估计
采用混和样本估算等位基因的频率是种高效快速的策略。该策略的原理是:首先选择参考样本制作标准曲线,然后将待测的混和样本与标准曲线进行比较,根据所得信号的比例确定混和样本中各种等位基因的频率。
易于基因分型
SNPs 的二态性,也有利于对其进行基因分型。对SNP进行基因分型包括三方面的内容:(1)鉴别基因型所采用的化学反应,常用的技术手段包括:DNA分子杂交、引物延伸、等位基因特异的寡核苷酸连接反应、侧翼探针切割反应以及基于这些方法的变通技术;(2)完成这些化学反应所采用的模式,包括液相反应、固相支持物上进行的反应以及二者皆有的反应。(3)化学反应结束后,需要应用生物技术系统检测反应结果。
参考资料1.单核苷酸多态性分析·医学教育网