Alamut-基因变异处理软件方案
在NGS分析过程中,前期GATK/BWA、Sentieon等基因变异检测软件获取变异文件后,需要标记每个变异的临床影像,再结合表型探索并寻找致病变异,最终出具相关报告。Alamut软件提供的模块主要负责对变异文件出来后的变异注释、筛选、探索和出具报告的过程。
Alamut软件套件分为三个模块:Alamut BATCH、Alamut FOCUS、Alamut VISUAL,此三个软件模块完成从变异注释、变异筛选、变异探索的整个流程。
Alamut Batch 变异注释软件
Alamut Batch模块丰富了原始的NGS变异,并进行了附加注释,包括对人类基因的影响、等位基因频率(Allele Frequency)、错义突变和剪接位点的预测。
Alamut Batch模块作为高效的高通量人类变异注释引擎,为NGS变异检测提供了众多功能和数十个注释能力。
主要特点
特点列表
- 注释引擎支持人类基因(包括蛋白质编码、非蛋白质编码、伪基因);
- 对原始NGS变异的数据富集,主要通过集成精心设计Alamut软件套件数据库和高效的外部预测工具实现 ;
- 可轻易集成到任何相关分析的Pipeline中(Linux、Windows);
- 所涉及文件格式均遵照行业标准格式,兼容性强(例如tab-delimited、VCF等);
- 可以根据用户需求,将注释严格限制在用户指定的区域 ;
- 将注释文件中引入的外部注释集中输出到结果文件中 ;
- 为Windows用户提供可视化的前端界面 ;
- 提供两种工作架构形式:客户端-服务端分离版本、独立版(包含Alamut数据库)。
注释功能
基础注释
- 基因:symbol, HGNC id, OMIM® id
- 转录本:RefSeq id, strand, length
- 蛋白:RefSeq id, Uniprot id, domains
- 变异类型:substitution, deletion, insertion, duplication, delins
- 编码影响:synonymous, missense, nonsense, in-frame, frameshift, start loss, stop loss
- 变异位置:upstream, 5’UTR, exon, intron, 3’UTR, downstream
- HFGVS命名:gDNA-level, cDNA-level, protein-level
- 外显子、内含子编码
变异数据库注释
- dbSNP, ExAC, ESP/EVS
- ClinVar, SwissProt
- COSMIC (此数据库为免费数据库)
基因剪接预测
- MaxEntScan, NNSPLICE, SpliceSiteFinder, GeneSplicer预测
- 对最邻近原始剪接位点的影响
- 对变异邻近的剪接影响(例如:新剪接位点,邻近隐藏剪接位点的激活)
- 分支剪接位点预测
错义突变注释&预测
- phastCons与phyloP核酸保守分数
- 编码细节预测
- BLOSUM分数,Grantham距离与氨基酸物化特性
- 越来越多的错义突变预测工具:SIFT,Align GVGD,MAPP
软件试用:Sentieon基因数据分析加速软件 -官方试用下载 (insvast.com)