Pandas主要统计特征函数:
方法名 | 函数功能 |
---|---|
sum() | 计算数据样本的总和(按列计算) |
mean() | 计算数据样本的算术平均数 |
var() | 计算数据样本的方差 |
std() | 计算数据样本的标准差 |
corr() | 计算数据样本的Spearman(Pearman)相关系数矩阵 |
cov() | 计算数据样本的协方差矩阵 |
skew() | 样本值的偏度(三阶矩) |
kurt() | 样本值的峰度(四阶矩) |
describe() | 给出样本的基本描述(基本统计量如均值、标准差等) |
cum累积计算函数
cum系列函数是作为DataFrame或Series对象的方法出现的,因此命令格式为D.cumsum()
方法名 | 函数功能 |
---|---|
cumsum() | 依次给出前1、2、… 、n个数的和 |
cumprod() | 依次给出前1、2、… 、n个数的积 |
cummax() | 依次给出前1、2、… 、n个数的最大值 |
cummin() | 依次给出前1、2、… 、n个数的最小值 |
计算出前n项和:
D=pd.Series(range(0,20)) D.cumsum() 0 0 1 1 2 3 3 6 .... 19 190 dtype: int64
rolling滚动计算函数
rolling_系列是pandas的函数,不是DataFrame或Series对象的方法,其格式为pd.rolling_mean(D,k),其中每k列计算一次平均值,滚动计算。
方法名 | 函数功能 |
---|---|
rolling_sum() | 计算数据样本的总和(按列计算) |
rolling_mean() | 数据样本的算术平均数 |
rolling_var() | 计算数据样本的方差 |
rolling_std() | 计算数据样本的标准差 |
rolling_corr() | 计算数据样本的Spearman(Pearman)相关系数矩阵 |
rolling_cov() | 计算数据样本的协方差矩阵 |
rolling_skew() | 样本值的偏度(三阶矩) |
rolling_kurt() | 样本值的峰度(四阶矩) |
依次对相邻两项求和:
pd.rolling_sum(D,2) 0 NaN 1 1.0 2 3.0 3 5.0 4 7.0 .... 19 37.0 dtype: float64
以上这篇Pandas_cum累积计算和rolling滚动计算的用法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持菜鸟教程(cainiaojc.com)。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:notice#cainiaojc.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。