产品介绍
指利用高通量测序技术进行cDNA测序,全面快速地获取某一种特定器官或组织在某一状态下的几乎所有转录本。目前转录组测序产品有真核有参转录组测序、真核无参转录组测序和原核转录组测序。
转录组测序的研究对象为特定细胞在某一功能状态下所能转录出来的所有mRNA。针对无参考基因组的物种,将小片段拼接出unigene,构建参考序列,以便后续分析,是研究无参物种分子机制与调控网络的有效手段。目前已广泛应用于基础研究、临床诊断、药物研发和分子育种等领域。
产品路线
样本要求
福尔马林固定石蜡包埋。
送样要求:新鲜FFPE组织切片,厚度不超过10um(过厚会导致RNA得率低),每次用量大约8片,表面积不超过250mm2。
常温运输保存。
分析内容
序号 | 分析项目 | 类别 | 分析 | 备注 |
1 | 原始数据整理 | A | √ | |
2 | 数据质控 | A | √ | |
3 | 高质量序列获取 | A | √ | |
4 | 转录本拼装及分析 | A | √ | |
5 | Unigene 聚类 | A | √ | |
6 | Unigene 功能注释 | A | √ | |
7 | Unigene GO 分类注释 | A | √ | |
8 | Unigene eggNOG分类注释 | A | √ | |
9 | Unigene KEGG分类注释 | A | √ | |
10 | Unigene 表达量计算 | A | √ | |
11 | Unigene表达量密度分布 | A | √ | |
12 | Unigene测序饱和度分析 | A | √ | |
13 | Unigene覆盖均一度分析 | A | √ | |
14 | 样品相关性检测 | A | √ | 需要有生物学重复 |
15 | 表达差异 Unigene 检测(两两样品间) | A | √ | 提供分组信息 |
16 | 表达差异 Unigene GO富集分析 | A | √ | |
17 | 表达差异 Unigene GOSlim富集分析 | A | √ | |
18 | 表达差异 Unigene KEGG富集分析 | A | √ | |
19 | 表达差异 Unigene 聚类分析 | A | √ | 样品数 ≥ 3 |
20 | 主成分分析 | A | √ | |
21 | cSNP 分析 | A | √ | |
22 | InDel 分析 | A | √ | |
23 | SSR 分析 | A | √ | |
24 | ORF 分析 | A | √ | |
25 | 组间共有特有差异基因可视化 | B | 实验分组 ≥ 3 | |
26 | 蛋白网络互作分析 | B | √ | |
27 | 转录因子分析 | B | 默认做植物物种 | |
28 | 共表达网络分析 | B | 样品数 ≥ 20 | |
29 | 共有、特有差异表达基因分析 | B | √ | 提供分组信息 |
分析结果展示
图1 NR注释统计
图2 KEGG注释
图3 差异表达基因聚类
图4 SNP 和 InDel 统计
数据质控
为确保Reads有足够高的质量,将下机原始测序数据(raw reads)去掉含有带接头的、低质量的reads,得到clean reads,保证后续分析的准确性。测序因受测序仪本身、测序试剂、样品等因素影响,存在一定的错误率。碱基测序错误率分布图可以反映测序数据的质量。

测序数据组装
过滤得到的高质量clean reads需通过Trinity软件进行组装得到转录本序列。转录本测序深度除了受测序数据量等影响,还与该转录本的表达丰度有关。为了使各样品中表达丰度较低的转录本组装得更完整,对于同物种的测序样品推荐合并组装可以间接增加测序深度,从而使转录结果更完整,同时也有利于后续的数据分析;而对于不同物种的样品,由于基因组间存在差异,推荐采用分别组装或分开分析。
基因表达水平分析
利用转录组数据检测基因表达具有较高的灵敏度。通过FPKM密度图和箱线图不仅可以反映单个样品基因表达水平分布和离散程度,还可以直观的比较不同样品的整体基因表达水平差异。

重复相关性评估
生物学重复的相关性不仅可以检验生物学实验操作的可重复性,还可以评估差异表达基因的可靠性和辅助异常样品的筛查。
差异表达基因分析
差异表达基因以火山图、MA图、韦恩图、聚类热图、蛋白互作图等形式呈现,通过火山图(Volcano Plot)可以快速地查看基因在两个(组)样品中表达水平的差异,以及差异的统计学显著性。对于有生物学重复的样本,我们采用DEseq进行样品组间的差异表达分析,获得两个生物学条件之间的差异表达基因集;对于没有生物学重复的样本,使用EBseq进行差异分析。筛选差异基因标准一般为:Fold Change≥2,FDR<0.01。
差异表达基因注释及富集分析
差异表达基因GO注释分类统计图,直观的反映出在生物过程(biological process)、细胞组分(cellular component)
和分子功能(molecular function),所有基因和差异基因注释GO term的个数分布。可深入挖掘差异基因的功能及所在的信号通路,筛选关注差异基因注释情况。
差异表达基因蛋白互作网络
STRING收录多个物种预测的和实验验证的蛋白质-蛋白质互作的数据库,包括直接的物理互作和间接的功能相关。结合差异表达分析结果和数据库收录的互作关系对,构建差异表达基因互作网络。
常见问题
- 针对无参考基因组物种的转录组测序你们可以提供哪些分析内容?
常规信息分析内容如下:
1、序列拼接及拼装统计;
2、Unigene功能注释;
3、Unigene功能聚类分析;
4、Unigene的代谢途径分析;
5、Unigene的表达差异分析(两个或者两个以上的样本);
6、样品间差异表达Unigene的富集分析(GO、KEGG);
7、样品间差异Unigene的表达模式聚类分析(3个样本及以上);
8、SNP鉴定;
9、SSR分析。
除了常规信息分析外,还可根据客户需求,进行可选性信息分析,例如:基因共表达网络分析、PCA分析、差异mRNA蛋白互作网络分析、转录因子分析(适用于植物物种)、样本特异表达及共有表达基因分析、样品间相关性分析、mRNA与miRNA互作分析、mRNA与LncRNA互作分析、DEU分析(适用于有生物学重复)。