R语言汇总统计中怎么批量计算不同因素不同水平的平均值

魁首哥

作者

R语言汇总统计中怎么批量计算不同因素不同水平的平均值

这篇文章将为大家详细讲解有关R语言汇总统计中怎么批量计算不同因素不同水平的平均值，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。

实际工作中，我们需要对数据进行平均值计算，这里我比较了aggregate和data.table的方法，测试主要包括：

1，对数据yield计算平均值
2，计算N不同水平的平均值
3，计算N和P不同水平的平均值

1. 常规方法aggregate

代码：

data(npk) head(npk) aggregate(yield~N,data=npk,FUN = mean) aggregate(yield~N+P,data=npk,FUN = mean)

结果

> aggregate(yield~N,data=npk,FUN = mean) N yield 1 0 52.06667 2 1 57.68333 > aggregate(yield~N+P,data=npk,FUN = mean) N P yield 1 0 0 51.71667 2 1 0 59.21667 3 0 1 52.41667 4 1 1 56.15000

2. 使用data.table方法

代码：

data(npk) head(npk) library(data.table) setDT(npk) # 单个变量 npk[,mean(yield),by=N] # 两个变量 npk[,mean(yield),by=c("N","P")] # 两个变量的另一种写法 npk[,mean(yield),by=list(N,P)] npk[,mean(yield),by=.(N,P)]

结果：

> # 单个变量 > npk[,mean(yield),by=N] N V1 1: 0 52.06667 2: 1 57.68333 > > # 两个变量 > npk[,mean(yield),by=c("N","P")] N P V1 1: 0 1 52.41667 2: 1 1 56.15000 3: 0 0 51.71667 4: 1 0 59.21667 > > > # 两个变量的另一种写法 > npk[,mean(yield),by=list(N,P)] N P V1 1: 0 1 52.41667 2: 1 1 56.15000 3: 0 0 51.71667 4: 1 0 59.21667 > npk[,mean(yield),by=.(N,P)] N P V1 1: 0 1 52.41667 2: 1 1 56.15000 3: 0 0 51.71667 4: 1 0 59.21667

关于“R语言汇总统计中怎么批量计算不同因素不同水平的平均值”这篇文章就分享到这里了，希望以上内容可以对大家有一定的帮助，使各位可以学到更多知识，如果觉得文章不错，请把它分享出去让更多的人看到。

阅读全文

发布于 2022-01-14 22:32:24

r语言

分享空间
分享微博
手机扫一扫

海报

上一篇：ERP的Account group和CRM partner group的映射关系是什么下一篇：如何实现ERP基础知识问答

R语言汇总统计中怎么批量计算不同因素不同水平的平均值

推荐阅读