R语言汇总统计中怎么批量计算不同因素不同水平的平均值
R语言汇总统计中怎么批量计算不同因素不同水平的平均值
这篇文章将为大家详细讲解有关R语言汇总统计中怎么批量计算不同因素不同水平的平均值,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
实际工作中,我们需要对数据进行平均值计算,这里我比较了aggregate
和data.table
的方法,测试主要包括:
1,对数据yield计算平均值
2,计算N不同水平的平均值
3, 计算N和P不同水平的平均值
1. 常规方法aggregate
代码:
data(npk)
head(npk)
aggregate(yield~N,data=npk,FUN = mean)
aggregate(yield~N+P,data=npk,FUN = mean)
结果
> aggregate(yield~N,data=npk,FUN = mean)
N yield
1 0 52.06667
2 1 57.68333
> aggregate(yield~N+P,data=npk,FUN = mean)
N P yield
1 0 0 51.71667
2 1 0 59.21667
3 0 1 52.41667
4 1 1 56.15000
2. 使用data.table方法
代码:
data(npk)
head(npk)
library(data.table)
setDT(npk)
# 单个变量
npk[,mean(yield),by=N]
# 两个变量
npk[,mean(yield),by=c("N","P")]
# 两个变量的另一种写法
npk[,mean(yield),by=list(N,P)]
npk[,mean(yield),by=.(N,P)]
结果:
> # 单个变量
> npk[,mean(yield),by=N]
N V1
1: 0 52.06667
2: 1 57.68333
>
> # 两个变量
> npk[,mean(yield),by=c("N","P")]
N P V1
1: 0 1 52.41667
2: 1 1 56.15000
3: 0 0 51.71667
4: 1 0 59.21667
>
>
> # 两个变量的另一种写法
> npk[,mean(yield),by=list(N,P)]
N P V1
1: 0 1 52.41667
2: 1 1 56.15000
3: 0 0 51.71667
4: 1 0 59.21667
> npk[,mean(yield),by=.(N,P)]
N P V1
1: 0 1 52.41667
2: 1 1 56.15000
3: 0 0 51.71667
4: 1 0 59.21667
关于“R语言汇总统计中怎么批量计算不同因素不同水平的平均值”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。
推荐阅读
-
R语言标签平滑是什么
R语言标签平滑是什么这篇文章主要介绍“R语言标签平滑是什么”,在日...
-
R语言怎么批量读取某路径下文件内容
R语言怎么批量读取某路径下文件内容今天小编给大家分享一下R语言怎么...
-
R语言怎么安装芯片原始数据标准化的包
R语言怎么安装芯片原始数据标准化的包这篇“R语言怎么安装芯片原始数...
-
TPM,FPKM(R语言怎么计算转录组中Count)
R语言怎么计算转录组中Count,TPM,FPKM本文小编为大家...
-
r语言如何绘制蛋白质组和转录组相关性图
r语言如何绘制蛋白质组和转录组相关性图这篇“r语言如何绘制蛋白质组...
-
怎么用R语言的limma方法进行芯片数据差异表达分析
怎么用R语言的limma方法进行芯片数据差异表达分析这篇文章主要介...
-
r语言中如何使用reshape2包将宽型数据转换成长型数据
r语言中如何使用reshape2包将宽型数据转换成长型数据这篇文章...
-
怎么用R语言的rgb函数获取颜色
怎么用R语言的rgb函数获取颜色今天小编给大家分享一下怎么用R语言...
-
怎么使用R语言筛选基因
怎么使用R语言筛选基因这篇文章给大家分享的是有关怎么使用R语言筛选...
-
在R语言中如何利用split划分数据
在R语言中如何利用split划分数据这篇文章给大家分享的是有关在R...