江苏绿叶生物科技有限公司

RNA-Seq数据分析的新工具

时间:2015-3-20阅读:223
分享:


RNA-Seq的数据分析方法就如雨后春笋般涌现。在基因组组装上经验丰富,曾参与人类基因组计划。

HISAT全称为Hierarchical Indexing for Spliced Alignment of Transcripts。它取代Bowtie/TopHat程序,能够将RNA-Seq的读取与基因组进行快速比对。

HISAT利用大量FM索引,以覆盖整个基因组。以人类基因组为例,它需要48,000个索引,每个索引代表~64,000 bp的基因组区域。这些小的索引结合几种比对策略,实现了RNA-Seq读取的比对,特别是那些跨越多个外显子的读取。尽管它利用大量索引,但HISAT只需要4.3 GB的内存。这种应用程序支持任何规模的基因组,包括那些超过40亿个碱基的。

StringTie能够组装转录本并预计表达水平。它应用网络流算法和可选的de novo组装,将复杂的数据集组装成转录本。在分析模拟和真实的数据集时,StringTie实现了更完整、更准确的基因重建,并更好地预测了表达水平。

对于从人类血液中获得的9000万个读取,StringTie正确组装了10,990个转录本,而第二名的组装程序Cufflinks只组装了7,187个,提高了53%。对于模拟的数据集,StringTie正确组装了7,559个转录本,比Cufflinks6,310个提高了20%。此外,它的运行速度也比其他组装软件更快。

开展差异表达分析的工具。它能利用RNA-Seq实验的数据,预测基因、转录本或外显子的差异表达。

会员登录

×

请输入账号

请输入密码

=

请输验证码

收藏该商铺

X
该信息已收藏!
标签:
保存成功

(空格分隔,最多3个,单个标签最多10个字符)

常用:

提示

X
您的留言已提交成功!我们将在第一时间回复您~

以上信息由企业自行提供,信息内容的真实性、准确性和合法性由相关企业负责,环保在线对此不承担任何保证责任。

温馨提示:为规避购买风险,建议您在购买产品前务必确认供应商资质及产品质量。

在线留言