重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
这篇文章给大家介绍seq2HLA如何利用RNA_seq数据进行HLA分型,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。
创新互联公司-专业网站定制、快速模板网站建设、高性价比永定网站开发、企业建站全套包干低至880元,成熟完善的模板库,直接使用。一站式永定网站制作公司更省心,省钱,快速模板网站建设找我们,业务覆盖永定地区。费用合理售后完善,10年实体公司更值得信赖。
对于不同的HLA Allel来说,exon2和exon3 序列的差异性尤为明显,很多的HLA 分型软件都会根据这部分序列,整理出HLA Allel序列参考数据库。
seq2HLA也采用了类似的策略,通过HLA不同Allel的exon2和exon3的序列,整理了一份HLA参考数据库,通过将RNA_seq的reads与该数据库比对,确定HLA分型结果,原理示意图如下
迭代两次,每次挑选出覆盖度最高的Allel 作为分型结果。
seq2HLA采用python和R进行开发,安装过程较为简单,直接下载源代码即可,安装过程如下
git clone https://github.com/TRON-Bioinformatics/seq2HLA cd seq2HLA/
用法如下:
python seq2HLA.py -1 R1.fastq -2 R2.fastq -r test -p 10
-1
和-2
参数分别指定输入的R1和R2端的fastq格式的序列; -r
参数指定输出文件名称的前缀,-p
指定线程数,主要是bowtie比对时的线程。
输出文件非常多,详细列表如下
test.ambiguity test-ClassI-class.bowtielog test-ClassI-class.expression test-ClassI-class.HLAgenotype2digits test-ClassI-class.HLAgenotype4digits test-ClassII.bowtielog test-ClassII.expression test-ClassII.HLAgenotype2digits test-ClassII.HLAgenotype4digits test-ClassI-nonclass.bowtielog test-ClassI-nonclass.expression test-ClassI-nonclass.HLAgenotype2digits test-ClassI-nonclass.HLAgenotype4digits
我们主要关注后缀为HLAgenotype4digits
的结果文件,可以看到,同时体用了HLA Clas I 和 Class II 两种类型基因的分型结果。以HLA I型基因的4位分型结果为例,文件内容如下
#Locus Allele 1 Confidence Allele 2 Confidence A A*02:65 0.008687167 A*02:65 NA B B*39:05' 0.3821314 B*13:48 0.09848174 C C*08:02' NA C*08:02 NA
对于HlA I型基因,给出了A, B, C 三个基因的分型结果,每个基因给出了两个Allel, 对于每个Allel, 会给出对应的打分值。
关于seq2HLA如何利用RNA_seq数据进行HLA分型就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。