摘要:大鳞副泥鳅是鳅科重要经济鱼类,通过Illumina HiSeq 2000测序平台对2个大鳞副泥鳅样本的转录本进行了高通量测序,其中AB2011M-1是群体中生长较快的10尾鱼的混合转录本,AB2011M-2是生长较慢的10尾鱼的混合转录本。通过对以上2个混合转录本的测序,分别获得了65 536和80 786个单核苷酸多态性(single nucleotide polymorphisms,SNP)突变;对2个测序样本进行表达差异的比较,获得了39个表达差异基因。随机选取120个位点设计引物,进行验证分析,共获得16个有效的多态性标记。
关键词:大鳞副泥鳅;高通量测序;SNP;多态性标记;引物设计
中图分类号: S917.4文献标志码: A文章编号:1002-1302(2014)10-0021-07
主要从事鱼类遗传育种与保护生物学研究。E-mail:lingqf@suda.edu.cn。大鳞副泥鳅(Paramisgurnus dabryanus)属鲤形目鳅科花鳅亚科副泥鳅属,别称板鳅、黄板鳅,是一种底栖杂食性淡水鱼类,主要分布于东亚地区。大鳞副泥鳅的肉质鲜美、营养丰富[1],近几年来,其市场需求量不断增大,已成为我国重要的水产养殖物种[2]。
育种是应用各种遗传学方法,改造生物的遗传结构,实现培育出高产优质品种的目标[3]。通过传统育种方法获得一个新品种需要经过5代以上人工选择[4],因此,利用传统的育种方法获得优良品系需要投入大量的时间、人工和资源;且育种操作多凭经验来控制选择手段,影响因素较多,不能快速满足当前渔业发展对水产良种的需要。
随着分子生物学的发展,分子标记辅助育种(molecular assisted selection,MAS)技术已日趋成熟。最早应用于MAS育种的分子标记有限制性片段长度多态性(restriction fragment length polymorphism,RFLP)、随机扩增多态 DNA (random amplified polymorphic DNA,RAPD)[5]、扩增片段长度多态性(amplified fragment length polymorphism,AFLP)[6]等标记方法。近年来,简单重复序列(Simple Sequence Repeat,SSR)和单核苷酸多态性(single nucleotide polymorphism,SNP)也被应用于MAS育种[6-7]。其中,SNP作为新兴的分子标记,拥有数目多、分布广、遗传稳定等优点而广泛受到关注。
筛选未知或已知SNP的方法有等位基因特异寡核苷酸片段分析(allele-specific oligonucleotide,ASO)[8]、基因芯片技术(gene chips)[9]、探针技术(TaqMan)[10]、AFLP[11]、变性梯度凝胶电泳(denatured gradient gel electrophoresis,DGGE)、单链构想多态性(single strand conformation polymorphism,SSCP)[12]、直接测序等方法。这些方法各有所长,在不同的分析领域得到了广泛的应用。其中,最快捷、开发量最大的是高通量测序方法,该方法通过不同个体的同一DNA片段的直接测序以及序列比对,使SNP突变的检出率可达100%,且可以直接得到突变碱基的类型及其准确位置等 SNPs 分型的参数[13-14]。
在水产动物中,鲤[15]、草鱼[16]、大口黑鲈[17]、栉孔扇贝[18]等均已有SNP的研究报道,但迄今为止,尚未见到通过高通量测序批量开发大鳞副泥鳅SNP的研究报道。本研究旨在开发与生长差异相关的多态性SNP标记,为大鳞副泥鳅的分子育种奠定理论基础和实践方法。
1材料与方法
1.1试验材料
2011年,以400组洪泽湖野生大鳞副泥鳅为亲本,进行人工繁殖,获得1个混合选育群体。2012年10月,随机采样200尾子代,测量体宽、体长、全长、周长、体厚和体重等性状指标,然后选取生长显著快速的10尾鱼[体质量(11.02±103) g]和显著缓慢的10尾鱼[体质量(2.25±0.36) g],分别标志为混合样本AB2011M-1和AB2011M-2。分别提取以上2组试验鱼的肌肉组织,于RNA样本保存液 (D311A,TaKaRa) 中4 ℃保存备用。
1.2RNA的提取与转录组文库构建
用TRIzol 试剂对样本肌肉组织提取总RNA,等量混合成快、慢2个转录组测序样本。对cDNA库进行片段长度的筛选,进行PCR扩增(使用Phusion DNA聚合酶,共15个循环),扩增产物由2%琼脂糖电泳检测,回收300~500 bp的cDNA片段。
1.3转录组测序与组装
通过TBS-380微型荧光计的定量化测定,具有双末端的cDNA片段在Illumina HiSeq 2000 (读长长度为2×100 bp)平台上进行测序。
使用SeqPre(https://github.com/jstjohn/SeqPrep) 和condetri_v2.0.pl (http://code.google.com/p/condetri/downloads/detail?name=condetri_v2.0.pl )软件进行序列除杂。用Trinity软件对去杂后片段进行序列组装和拼接(http://trinityrnaseq.sourceforge.net/)。
1.4转录本基因注释
使用蛋白质非冗余数据库(NR数据库)中的的BlastX程序进行转录本的比对,E值的设定为小于1.0×10-5[19]。比对获得的序列使用Blast 2 GO软件进行GO(gene ontology)注释[20],GO分类使用in-house perl scripts[21];然后使用软件blastx/blastp 2.2.24+对序列进行KEGG(kyoto encyclopedia of genes and genomes)分析。
1.5SNP分析
将拼接好的序列作为对比模板,通过软件Samtools (http://samtools.sourceforge.net/)和VarScan v.2.2.7(http://varscan.sourceforge.net/)将从AB2011M-1和AB2011M-2中获得的序列信息分别与模板进行对比,得到候选SNP的信息。根据分析结果,选取差异基因所含的SNP,设计引物进行验证。用Primer 5.0软件设计引物,引物合成由生工生物工程(上海)股份有限公司完成。PCR扩增的反应体系为 20 μL,包含1 μL DNA模板,10 μL 2× PCR Mix(CW2296,世纪康为),上下游引物各1 μL,7μL H2O。PCR反应循环流程为:94 ℃预变性3 min;94 ℃变性30 s,55 ℃退火40 s,72 ℃延伸30 s,25个循环;72 ℃延伸5 min。PCR产物首先通过2%琼脂糖电泳进行初步筛选,具有清晰条带的标记再通过6%聚丙烯凝胶电泳进行基因分型。在进行聚丙烯凝胶电泳前,用SSCP变性剂对产物进行95 ℃变性10 min,并立即冰浴处理。SSCP变性剂配方包括49 mL去离子甲酰胺、1 mL 0.5 mol/L EDTA(pH值8.0)、0.1 g溴酚蓝、0.1 g二甲苯青FF。DNA分子质量标记采用Takara公司的DL-1 000 DNA marker。
2结果与分析
2.1数据的筛选、拼接与注释
3讨论与结论
3.1测序结果注释
在本研究中,58.56%的序列预测到ORFs,60.98%的序列在NR数据库中得到注释,注释到的基因参与了大鳞副泥鳅的代谢和其他生物过程,没有被注释到的基因可能是此物种的特异基因,需要通过进一步的研究将这些特异基因扩充至各个数据库中,以丰富数据库的内容。
3.2SNP的开发
本研究通过第二代测序技术在2个样本中分别获得 65 536 和80 786个SNP。由于是对转录本进行测序,因此,这些SNP又称为cSNP。cSNP在转录区域形成的频率远低于非转录区[22],在生物进化中这是为了保护物种的稳定性,转录区发生的非同义SNP突变可能会在进化过程中被淘汰,达到保护的目的[23]。cSNP与相关性状有重要的联系,因此,cSNP 往往具有重要的研究价值,可以为进一步的相关性状关联、代谢通路、遗传作图研究提供有效的工具,为分子育种奠定基础。
SNP突变形式有转换(C/T,G/A)和颠换(C/A,G/T,C/G,A/T),研究表明转换出现的频率约为颠换频率的2倍[24]。本研究中,转换/颠换为1.39,和Manuel等人对比目鱼 EST-SNP 研究结果相近(1.408)[25],与鲑鱼[26]、乌颊鱼[27]和斑马鱼[28]的EST-SNP研究结果(1.885)有一定差距,表明了不同生物在进化过程中承受着不同的进化压力[22]。
3.3SNP的验证
SNP是单个碱基引起的突变,在检测中可能会造成假阳性,影响试验的准确性[25-26],因此,采取32个个体重复2次SSCP检测,以消除假阳性干扰。本研究SNP验证率(239%)较预期(50%)低,可能是由于使用的扩增模板是DNA,其中的内含子会同时被扩增出来。内含子也可能存在SNP的干扰,造成扩增片段长度过大、扩增条带多而杂,降低了在聚丙烯凝胶电泳中的分辨率[29],由此造成某些具有多态的SNP无法被鉴定。
参考文献:
[1]Cho Y S,Kim B S,Kim D S,et al. Modulation of warm-temperature-acclimation-associated 65-kDa protein genes (Wap65-1 and Wap65-2) in mud loach (Misgurnus mizolepis,Cypriniformes) liver in response to different stimulatory treatments[J]. Fish & Shellfish Immunology,2012,32(5):662-669.
[2]倪勇,伍汉霖. 江苏鱼类志[M]. 北京:中国农业出版社,2006:391.
[3]楼允东. 鱼类育种学[M]. 北京:中国农业出版社,2001.
[4]孙效文. 鱼类分子育种学[M]. 北京:海洋出版社,2010.
[5]Jackson T R,Ferguson M M,Danzmann R G,et al.Identification of two QTL influencing upper temperature tolerance in three rainbowtrout (Oncorhynchus mykiss) half-sib familie[J]. Heredity,1998,80:143-151.
[6]Robison B D,Wheeler P A,Sundin K,et al. Composite interval mapping reveals a major locus influencing embryonic development rate in rainbow trout (Oncorhynchus mykiss)[J]. The Journal of Heredity,2001,92(1):16-22.
[7]Kocher T D,Lee W J,Sobolewska H,et al. A genetic linkage map of a cichlid fish,the tilapia(Oreochromis niloticus)[J]. Genetics,1998,148(3):1225-1232.
[8]Saiki R K,Bugawan T L,Horn G T,et al. Analysis of enzymatically amplified beta-globin and HLA-DQ alpha DNA with allele-specific oligonucleotide probes[J]. Nature,1986,324(6093):163-166.
[9]Marshall A,Hodgson J. DNA chips:An array of possibilities[J]. Nature Biotechnology,1998,16(1):27-31.
[10]Martinsohn J T,Ogden R. FishPopTrace-developing SNP-based population genetic assignment methods to investigate illegal fishing[J]. Forensic Science International:Genetics Supplement Series,2009,2(1):294-296.
[11]Bensch S,Akesson S,Irwin D E. The use of AFLP to find an infor-mative SNP:genetic differences across a migratory divide in willow warblers[J]. Molecular Ecology,2002,11(11):2359-2366.
[12]Tian H J,Jaquins-Gerstl A,Muo N,et al. Single-Strand conformation polymorphism analysis by capillary and microchip electrophoresis:a fast,simple method for detection of common mutations in BRCA1 and BRCA2[J]. Genomics,2002,63(1):25-34.
[13]钟茂春,郑光明,赵建,等. 鲮Myf5基因克隆及其SNPs分析[J]. 中国水产科学,2010,17(4):681-688.
[14]王利红,高勤学,张伟,等. 绵羊LHR基因 PCR‐SSCP多态性与繁殖性状的关联分析[J]. 浙江大学学报:农业与生命科学版,2012,28(4):362-369.
[15]王宣朋,张晓峰,李文升,等. 利用SSR、EST-SSR、SNP标记对鲤食物转化率、体厚、体质量3种性状的分析[J]. 中国水产科学,2011,18(3):565-573.
[16]曹婷婷,白俊杰,于凌云,等. 草鱼醛缩酶B基因部分序列的SNP多态性及其与生长性状的关联分析[J]. 水产学报,2012,36(4):481-488.
[17]Li H X,Bai J J,Ye X,et al. Polymorphisms in the 5′flanking region of the insulin-like growth factor I gene are associated with growth traits in largemouth bass Micropterus salmoides[J]. Fisheries Science,2009,75(2):351-358.
[18]Wang X L,Meng X Y,Song B,et al. SNPs in the myostatin gene of the mollusk Chlamys farreri:association with growth traits[J]. Comparative Biochemistry and Physiology. Part B:Biochemistry & Molecular Biology,2010,155(3):327-330.
[19]Altschul S F,Madden T L,Schffer A A,et al. Gapped BLAST and PSI-BLAST:a new generation of protein database search programs[J]. Nucleic Acids Research,1997,25(17):3389-3402.
[20]Ashburner M,Ball C A,Blake J A,et al. Gene ontology:tool for the unification of biology[J]. Nature Genetics,2000,25(1):25-29.
[21]Kanehisa M,Araki M,Goto S,et al. KEGG for linking genomes to life and the environment[J]. Nucleic Acids Research,2008,36(Database issue):D480-D484.
[22]徐田军,孙悦娜,石戈,等. 鮸鱼EST-cSNP位点发掘及其特征分析[J]. 浙江大学学报:农业与生命科学版,2011,37(3):280-288.
[23]Hubert S,Higgins B,Borza T,et al. Development of a SNP resource and a genetic linkage map for Atlantic cod (Gadus morhua)[J]. BMC Genomics,2010,11:191.
[24]Pardo B G,Fernández C,Millán A,et al. Expressed sequence tags (ESTs) from immune tissues of turbot (Scophthalmus maximus) challenged with pathogens[J]. BMC Veterinary Research,2008,4:37.
[25]Vera M,lvarez-Dios J A,Millán A,et al. Validation of single nucleotide polymorphism(SNP) markers from an immune expressed sequence tag(EST) turbot,Scophthalmus maximus,database[J]. Aquaculture,2011,313(1/4):31-41.
[26]Hayes B,Laerdahl J K,Lien S,et al. An extensive resource of single nucleotide polymorphism markers associated with Atlantic salmon (Salmo salar) expressed sequences[J]. Aquaculture,2007,265(1/2/3/4):82-90.
[27]Cenadelli S,Maran V,Bongioni G,et al. Identification of nuclear SNPs in gilthead seabream[J]. Journal of Fish Biology,2007,70(C):399-405.
[28]Stickney H L,Schmutz J,Woods I G,et al. Rapid mapping of zebrafish mutations with SNPs and oligonucleotide microarrays[J]. Genome Research,2002,12:1929-1934.
[29]王娜,连易水,刘砚星. PCR-SSCP分析方法的优化[J]. 现代生物医学进展,2008,8(10):1841-1844,1825.