重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
分组柱状图,又叫聚合柱状图。当需要在同一个轴上显示各个分类下不同的分组时,需要用到分组柱状图,是学术论文中常用的图。每个分组中的柱子使用不同的颜色或者相同颜色不同透明的方式区别各个分类,各个分组之间需要保持间隔。
创新互联公司是一家专业从事网站建设、成都网站设计、网页设计的品牌网络公司。如今是成都地区具影响力的网站设计公司,作为专业的成都网站建设公司,创新互联公司依托强大的技术实力、以及多年的网站运营经验,为您提供专业的成都网站建设、营销型网站建设及网站设计开发服务!
利用ggplot2包进行绘制,这里不赘述。
[1]
[2]
前面给大家讲了☞ 【R语言】百分比表格删除两行重新计算百分比 ,有小伙伴对文中的两个堆积柱形图比较感兴趣。那么今天我们就来聊聊这两张图是如何绘制出来了。
我们还是以☞ 【R语言】百分比表格删除两行重新计算百分比 中的数据为例
就可以得到如下两张突击柱形图
删除行之前
删除行之后
参考 R绘制堆积柱形图 获取“all_pool_species_sample.txt” 文件
前面我给大家详细介绍过
☞GO简介及GO富集结果解读
☞四种GO富集柱形图、气泡图解读
☞GO富集分析四种风格展示结果—柱形图,气泡图
☞KEGG富集分析—柱形图,气泡图,通路图
☞ DAVID GO和KEGG富集分析及结果可视化
也用视频给大家介绍过
☞ GO和KEGG富集分析视频讲解
最近有粉丝反映说,利用clusterProfiler这个包绘制GO富集分析气泡图和柱形图的时候,发现GO条目的名字都重叠在一起了。
气泡图
柱形图
这个图别说美观了,简直不忍直视。经过我的认真研究,发现跟R版本有关。前面我给大家展示的基本都是R 3.6.3做出来的图。很多粉丝可能用的都是最新版本的R 4.1.2。
我们知道R的版本在不停的更新,相应的R包也在不停的更新。我把绘制气泡图和柱形图相关的函数拿出来认真的研究了一下,终于发现的症结所在。
dotplot这个函数,多了个 label_format 参数
我们来看看这个参数究竟是干什么用的,看看参数说明
label_format :
a numeric value sets wrap length, alternatively a custom function to format axis labels. by default wraps names longer that 30 characters
原来这个参数默认值是30,当标签的长度大于30个字符就会被折叠,用多行来展示。既然问题找到了,我们就来调节一下这个参数,把他设置成100,让我们的标签可以一行展示。
是不是还是原来的配方,还是熟悉的味道
同样的柱形图,我们也能让他恢复原来的容貌。
关于如何使用R做GO和KEGG富集分析,可参考下文
GO和KEGG富集分析视频讲解
原始数据存储在一个excel文件里,这个excel文件里有三个子表格,每一个子表格的数据如下:
总的数据格式
现在的需要是做如下的图
比如这里我新建了一个子表格sheet4,数据最终的格式如下
这里用到的是标准误
这里新学到一个知识点是,柱子默认是不贴底的,如果要贴底使用函数 scale_y_continuous(expand = expansion(mult = c(0,0.1)))
mult对应的两个值一个是控制下面,一个是控制上面,贴底就设置为0 就可以了
小明的数据分析笔记本
在这个过程中,我们会用到 ggplot2 包。
我们生成了24个特征,每个特征值从1到24降序排列,并生成一列标识变量id,将该数据命名为df。
其中,最关键的就是将ggplot画的条形图,改变成极坐标形式。,如图所示:
当然,我们可以通过将值按照特定顺序排列,所得到的环状柱形图更具有美观性,对于中间的圆,我们利用ylim函数进行调整,当下限减小时,对应的圆就会变大,读者可以根据自己的需求与数据来调整。
附录:
直方图又称柱状图/条形图,用来展示连续数据分布的常用工具,用来估计数据的概率分布。
使用格式:hist(x,breaks=n,main="name",labels=FASLE,col="blue",border="red",freq=TRUE)
x 向量,直方图的数据;
breaks 描直方图的断点,例如breaks=20表示画出20个柱子;
labels 逻辑变量,TRUE标出频数
main 标题
col 颜色
border外框颜色
freq 逻辑变量,TRUE为数据频数,默认为TRUE;FALSE则为密度
我们可以用lines画出数据的密度曲线
还可以画正态分布的密度曲线
使用格式 ggplot(data,aes(x=class))+geom_bar()
x 绘制的数据
或者 ggplot(data,aes(y=class))+geom_bar(),则类型分布在y轴
当想看在该因素中其他因素的情况,可以利用fill进行绘制,得出叠堆条形图
横向的柱状
大多数时候我们想比较多个组直接某些因素的情况,例如有时候我们要画几个样本中各个细胞比例的情况
这是我们可以画堆叠条形图
此时不好比较,我们可以把同类型细胞放在一块比较,即横坐标变为细胞类型
在实验过程中可以采用容易分析的形式进行比较
以上是基本绘制的参数,此外还有美化的一些参数
labs 横纵坐标轴的名称
ggttitle 标题名称
geom_bar(width= )设置条形大小,默认情况下,设置为数据分辨率的90%。
theme_bw() 改变背景颜色
scale_fill_manual 自定义颜色
更多参数见 R语言绘图——数据可视化ggplot2 介绍和主要的参数