钓鱼吗旗下产品: 钓鱼吗

De novo业务线发表文章集锦

原创 2017-04-05

趁着新年的到来,我们也来盘点一下我们的过去,在接下来的2017年里再接再厉,更好的为您的科研服务。


地山雀基因组
Nature Communications  2013.7



地山雀(Parus humilis)主要分布于青藏高原,隶属于雀形目(Passeriformes)地山雀属(Pseudopodoces ),为我国特有。对地山雀基因组进行全面地研究,填补了高原鸟类基因组及分子生物学研究的空白。这些信息将对地山雀的生态、进化和行为方式等研究领域产生深远的影响,也将为地山雀这种独有物种的保护提供科学依据。


研究结果


1. 地山雀基因组图谱构建

基因组全长1.08Gb, Contig N50=88.3Kb,Scaffold N50=1.62Mb。17,520个编码蛋白基因以及830条RNA序列。


2. 进化分析

大山雀、黄颊山雀与地山雀基因组的序列比对率为7880%,黑尾地鸦的比对率仅有9.7%,地山雀与大山雀和黄颊山雀大约在7.79.9百万年前产生了分化,从全基因组水平明确了地山雀的分类问题。

图1  进化分析结果


3. 高原适应性遗传机制

(1)地山雀低氧适应及能量代谢相关的基因发生了快速进化; 

(2)免疫基因,尤其是和MHC相关的基因家族发生了显著收缩或丢失;

(3)地山雀骨骼发育相关的基因发生了快速进化; 

(4)嗅觉相关的基因家族也发生了显著收缩。

表 1  四个物种中不同基因家族的数量对比



藏猪基因组
Nature Genetics  2013.10



藏猪是一种生活在高原低氧恶劣环境的野生型品种,它对恶劣环境具有极强的适应能力;2004年,藏猪列入《中国畜牧品种志》,被正式确定为地方原始猪种。另外,该物种还具有许多重要的经济价值,是我国宝贵的地方品种资源。


研究结果


1. 藏猪基因组图谱绘制

藏猪基因组全长为2.43Gb,Contig N50=20.6Kb,Scaffold N501.06M。

表1  杜洛克猪和藏猪基因组组装结果比较



2. 藏猪和家猪比较基因组学分析

比较基因组学分析发现藏猪和家猪的祖先早在690万年前就开始向不同方向进化,分化时间可能早于牦牛和家牛(490万年前)以及人类和黑猩猩(500700万年前)。

图1  直系同源基因家族的分歧时间及分歧历史


3. 藏猪高原适应性遗传机制解析

对6个藏猪群体和4个四川盆地家猪群体的选择性清除分析,鉴定出低氧适应、能量代谢等共268个适应高原环境的快速进化基因。通过基因的进化速度分析,发现家猪唾液分泌基因受到了强烈的人工选择,快速进化。


图2  各品种猪的地理分布与邻接进化树



图3  直系同源基因家族的分歧时间及分歧历史


4. 群体遗传学分析

野生和驯养群体遗传学分析结果:人工选择可更有效地塑造驯养动物基因组;欧亚猪种存在明显的遗传背景差异,欧亚的地理隔离造成的遗传结构差异甚至超过了野生和驯化的差异。


大豆泛基因组
Nature Biotechnology. 2014.9


近年来,我国乃至世界大豆育种难以取得突破性的进展、单产停滞不前。主要原因是目前大豆品种的遗传基础狭窄,匮乏的基因源成为制约栽培大豆育种研究的关键。野生大豆具有较强的抗逆性和繁殖能力,是栽培大豆重要的基因资源。


研究结果


1. 组装和注释

7株野生大豆基因组为889.33Mb1118.34 Mb,组装指标Contig N50=7.726.6 kb,Scaffold N50=16.362.7 kb,平均每个基因组注释出55,570个基因,其中8590%的基因为全长基因。

表1  7株野生大豆信息及组装注释结果



2. 泛基因组构建

7个野生大豆基因组进行比较,发现它们共有59080个基因家族(pan-genome),48.6%为共享基因(core-genome),51.4%则仅存在于个别样本中。(图1)


图1  7株野生大豆共有和特有基因集


3. 组装变异检测

以栽培大豆基因组为参考, 7株野生大豆分别鉴定出SNP 3.64.7M,其中0.120.15M位于编码区;InDel 0.500.77M,29894181个导致了移码;大量的变异位点(4453%)为重测序手段未能识别出的新位点。


图2  G. soja品种野生大豆特有的变异位点


4. 进化分析

野生大豆与栽培大豆的祖先约在80万年前即发生了分化;正选择分析发现栽培大豆受选择的基因多与抗旱有关,而野生大豆中受选择基因非常多样化。


图3  G. soja野生大豆泛基因组分化分析


5. 农艺性状基因定位

鉴定出大量与抗逆、抗病、花期、产油量和高度等重要农艺性状相关基因和变异,如14号染色体上一段8kb的片段与野生大豆抗逆和植物发育相关,野生大豆和栽培大豆开花时间的差异与开花时间调控基因SNP和InDel变异有关。


图4  野生大豆开花时间调控基因SNP和InDel变异


金丝猴基因组
Nature Genetics .2014.11


金丝猴(Rhinopithecus spp )隶属于灵长目(Primates)仰鼻猴属(Rhinopithecus ),目前有川、滇、黔、缅甸和越南金丝猴5种。通过对金丝猴基因组以及肠道基因组进行全面系统的研究,解析了金丝猴的植食性分子遗传机制,为了解疣猴亚科的系统进化、功能适应性奠定了遗传基础,同时开展了仰鼻猴属的进化历史和遗传多态性分析。


研究结果


1. 金丝猴基因组图谱绘制

金丝猴基因组大小为3.05G,组装指标Contig N50=25.5Kb,Scaffold N50=1.55Mb。蛋白编码基因为21,813个,转座元件比例为44.17%。

表1  金丝猴基因组测序结果



2. 金丝猴植食性适应的分子机制解析

比较基因组学分析发现:与外源物质降解相关基因和唾液分泌蛋白编码基因发生显著扩张;与牛的趋同进化分析鉴定出33个快速进化嗅觉基因,其中69.7%的基因可能与水果、植物等气味相关;此外分析发现金丝猴的肠道微生物群落与牛的相似,其群落与前肠发酵相关。

图1  转座元件比对分析与金丝猴和牛嗅觉受体基因邻接进化树分析


3. 进化分析

对与植食性紧密相关的 RNASE1 基因进行研究,结果支持“一次复制假说”,同时结果也支持“平行进化假说”。进化分析发现北部物种(川金丝猴和黔金丝猴)与喜马拉雅物种(滇金丝猴和缅甸金丝猴)约在160万年以前发生了分化;北部物种形成时间约在62万年前,喜马拉雅物种形成时间约在15万年前。


图2  不同品种金丝猴系统进化树


4. 群体遗传学分析

结合重测序对来自云南的滇金丝猴、贵州的黔金丝猴和云南怒江的缅甸金丝猴进行群体遗传分析,黔、滇和缅甸金丝猴的群体趋势则与川金丝猴分歧较大,其中黔金丝猴在末次盛冰期的时候有一个小的上升,可能与其基因组的较高杂合度有关。


图3  金丝猴进化历史重建模型

 

陆地棉基因组
Nature Biotecnology.2015.4



陆地棉(Gossypium hirsutum L)隶属锦葵目(Malvales),棉属(Gossypium)。因最早在美洲大陆种植而得名,是世界上最重要的棉花栽培品种,由于其为异源四倍体,相关的全基因组测序工作一直难以开展。本研究构建高质量的陆地棉全基因组图谱,为进一步改良棉花的农艺性状提供了基础,同时也为多倍体植物的形成和演化机制提供了新的启示。


研究结果


1. 陆地棉基因图谱绘制

基因组大小为2.5 G,组装指标Contig N50=34 Kb,Scaffold N50=1.6 Mb。


2. A亚组和D亚组非对称进化

通过比较陆地棉(AADD)、雷蒙德氏棉(DD)和亚洲棉(AA)的基因组序列,估算出陆地棉形成于一百万至一百五十万年前。在陆地棉形成后的一百多万年内,A亚组不仅有更高的蛋白质进化速率,其染色体重排发生频率与及基因丢失和失活的频率均显著高于D亚组。

图1  异源多倍体棉花基因组共线性分析与非对称进化


3. A亚组和D亚组对陆地棉性状的互补性贡献

选择分析发现811个正选择基因(470个在A亚组,341个在D亚组),在A亚组中,正选择基因与纤维长度的发育有重要关系;而在D亚组中,正选择基因多与抗性有关。该结果表明陆地棉继承了两个祖先种中各自的优良性状,因此具有良好的纤维品质及广泛的适应性。


4. 棉纤维关键基因的表达及进化分析

MYBCESA等纤维发育相关的重要基因开展了表达及进化分析。MYB基因家族中的一个分支在纤维发育中起重要的作用;陆地棉中多个CESA基因在驯化过程中受到了显著的正选择作用,可能与棉纤维品质的改良有直接关系。


图2  MYB基因家族成员表达模式分析与比较


九只猪基因组
Genome Research .2016.9



为了进一步分析猪的遗传多样性,选自欧亚大陆不同地理位置和不同形态的9种猪进行泛基因组测序,并结合藏猪基因组分别进行de novo组装,挖掘出大量的参考基因组中不存在SNP、结构变异以及新基因,为农业生产和生物医学研究提供了珍贵的遗传资源。


研究结果


1. 9个猪品种基因组的de novo组装

9个猪基因组大小2.452.49G,组装指标Contig N50=28.9942.66Kb,Scaffold N50=1.262.45Mb。对之前发表的藏猪基因组进行了完善,Contig N50提升至22.54Kb,基因组大小由2.43Gb变为2.44Gb。鉴定到8.86-15.95百万个SNPs。


图1  利用组装的方法和重测组read mapping方法鉴定到的SNP比较


2. 结构变异的鉴定

每个猪检测到16.14527.998万个插入变异和13.78926.955万个缺失变异(图2B),80%的InDel为110bp,大多数位于基因间隔区。在947个基因中鉴定到了1,152个移码突变,主要和细胞功能相关。


图2  中国和欧洲起源的猪遗传变异检测


3. 不同猪品种的多样性选择标记

鉴定到493个20150bp长的独立遗传区域(共20.10Mb,包括308个基因)受到了选择作用的影响(图3A),这些区域也表现出了显著的连锁不平。对于一个特定的品种,选择区域中大多数的纯合SNP(88.60%)是唯一的,这些SNP是高度集中在离散的基因组区域(占基因组的0.79%),也许与品种的不同表型相关。

 

4. 猪参考基因组中丢失序列的鉴定

8.38万个序列(137.02Mb)在参考基因组中出现丢失,分析表明,这些参考基因组中缺失的序列可能与猪的多样性相关,并且包含重要的生物学信息。

在10个基因组中,每个基因组平均20,782个编码蛋白基因。其中1,096个基因被鉴定为参考基因组中的丢失基因,分析表明这些基因在功能和生物学上有重要意义。

在7个起源于中国的猪群体中, 328个丢失基因中的605个SNP受到了定向选择,这些基因主要富集在肌动蛋白、钙离子和细胞骨架蛋白方面。ALPK3 基因在家猪中的正选择解释了家猪处于“糖尿病高致病”环境中依然健康的保护机制;PKD1L2 基因在家猪中的正选择可能与家猪生活在有限空间内缺乏运动有关。


图3  品种特异性的选择性清除的鉴定


枣树基因组
PLOS Genetics .2016.12



枣(Ziziphusjujuba Mill)鼠李科。栽培枣糖含量高(超过干重的72%),从基因组水平分析栽培枣和野生枣的糖酸代谢机制能够更好的阐明水果的甜度和酸度在进化过程中的遗传机制。为果实风味调控提供了重要的理论支撑,不仅对枣,也对苹果、桃、梨、猕猴桃等果树育种方向的确定和方案的制定都具有现实指导意义。


研究结果


1. 骏枣自然二倍体高质量基因组图谱绘制

基因组大小351Mb,组装指标Contig N50=34kb,Scaffold N50=754kb。GC含量达32.6%,蛋白编码基因有27,443个。


2. 解释果树甜酸风味驯化机制

与野生枣相比,栽培枣糖含量更高,有机酸含量低。枣基因组的选择性清除区域有很多与糖和酸代谢相关基因。在栽培枣中,催化蔗糖水解为葡萄糖和果糖的 VAINV 基因表达水平低,有助于栽培枣中蔗糖的积累。而参与酸代谢的基因,如 NADP-MEPKPEPCMDHSD 和 CS 基因在野生枣中表达较高。


图1 枣中糖和酸代谢与驯化相关


3. 染色体及基因组的进化过程

基于枣基因组、桃子基因组和苹果基因组序列推断出鼠李科和蔷薇科共同的8个祖先染色体。在枣、桃和苹果的基因组间存在大的染色体共线性。与桃子和苹果基因组相比,枣的染色体的重排、断裂和融合事件很少,基因组中保留着大量的保守区域。


4. 阐述制干枣和鲜食枣的分化

冬枣(鲜食枣)和骏枣(干枣)基因组比对发现,骏枣中有136Mb的TEs,占总基因组的38.8%,而冬枣基因组中有204Mb。并且在冬枣中有更多的TEs积累。在骏枣中与细胞壁修复相关的几个基因家族大量扩张。


5. 探明自交/异交不亲和的分子机制

在骏枣基因组中鉴定了一个S-RNase(S1)候选基因。转录组数据分析 S1 基因在花中特异表达。推测枣的S位点可能在1号染色体的3.84.3Mb区间内,枣的S位点结构与梨的相似。


想要了解更多的信息请随时与我们联系,我们在这里等您来……



参考文献

[1] Qu Y, Zhao H, Han N, et al. Ground tit genome reveals avian adaptation to living at high altitudes in the Tibetan plateau[J]. Nature communications, 2013, 4(4): 2071.

[2] Li M, Tian S, Jin L, et al. Genomic analyses identify distinct patterns of selection in domesticated pigs and Tibetan wild boars[J]. Nature genetics, 2013, 45(12): 1431-1438.

[3] Li Y H, Zhou G, Ma J, et al. De novo assembly of soybean wild relatives for pan-genome analysis of diversity and agronomic traits[J]. Nature biotechnology, 2014, 32(10): 1045-1052.

[4] Zhou X, Wang B, Pan Q, Li R, Li M. Whole-genome sequencing of the nub-nosed monkey provides insights into folivory and evolutionary history [J]. Nature Genetics, 2014, 46(12):1303-1310.

[5] Zhang T, Hu Y, Jiang W, et al. Sequencing of allotetraploid cotton(Gossypium hirsutum L. acc. TM-1) provides a resource for fiber improvement[J]. Nature Biotechnology, 2015, 33(5): 531-537.

[6] Li M, Chen L, Tian S, et al. comprehensive variation discovery and recovery of missing sequence in the pig genome usingmultiple de novo assemblies[J]. Genome Research, 2016.

[7] Huang J, Zhang CM, Zhao X, et. al. The Jujube Genome Provides Insights into Genome Evolution and the Domestication of Sweetness/Acidity Taste in Fruit Trees[J]. PLOS Genotics, 2016.



De novo业务线  王翠红丨文案

李宝薇丨编辑

配图来源于网络,侵删





为你读文献

为你分享资源

为你分析研究思路

为你提供最前沿的科研动态

学霸,逗逼,科学家,文艺青年同在!

诺禾致源丨提供领先的基因组学解决方案

长按识别二维码,关注诺禾致源


分享到:

24小时热门文章更多文章...