当前位置: 首页 > news >正文

网站建设与安全管理广告设计网站

网站建设与安全管理,广告设计网站,四川省商投建设公司官网,网站建设 服务器 预算报价清单当我们的数据涉及日期和时间时,分析随时间变化变得非常重要。Pandas提供了一种方便的方法,可以按不同的基于时间的间隔(如分钟、小时、天、周、月、季度或年)对时间序列数据进行分组。 在Pandas中,有几种基于日期对数据进行分组的方法。我们将…

当我们的数据涉及日期和时间时,分析随时间变化变得非常重要。Pandas提供了一种方便的方法,可以按不同的基于时间的间隔(如分钟、小时、天、周、月、季度或年)对时间序列数据进行分组。

在Pandas中,有几种基于日期对数据进行分组的方法。我们将使用这些虚拟数据进行演示:

 importpandasaspdimportnumpyasnp# generating data consisting of weekly sales for the timeperiod Jan,2022 to Jan,2023dates=  pd.date_range('2022-01-01', '2023-01-05', freq='1 W')sales_val=np.linspace(1000, 2000,len(dates) )data= {'date':dates,'sales': sales_val} # Load the data df=pd.DataFrame(data) # Convert the 'date' column to a datetime type df['date'] =pd.to_datetime(df['date']) df.sample(5)

一些最常用的时间序列数据分组方法是:

1、resample

pandas中的resample 方法用于对时间序列数据进行重采样,可以将数据的频率更改为不同的间隔。例如将每日数据重新采样为每月数据。Pandas中的resample方法可用于基于时间间隔对数据进行分组。它接收frequency参数并返回一个Resampler对象,该对象可用于应用各种聚合函数,如mean、sum或count。resample()只在DataFrame的索引为日期或时间类型时才对数据进行重新采样。

 importmatplotlib.pyplotaspltimportseabornassns# Set the 'date' column as the index,# and Group the data by month using resample grouped=df.set_index('date').resample('M').mean() print("Grouping is done on monthly basis using resample method:\n", grouped)# plot the average of monthly salessns.lineplot(grouped.index, grouped['sales'])plt.xlabel("Date")plt.ylabel("Average Monthly Sales")plt.grid(True)plt.title("Average Monthly sales with respect to  month")

在本例中,我们首先将’ date '列转换为日期类型,然后将其设置为DataFrame的索引。然后使用重采样方法按月分组数据,并计算每个月的“sales”列的平均值。结果是一个新的DF,每个月有一行,还包含该月“sales”列的平均值。

2、使用Grouper

pandas的Grouper 函数可以与 groupby 方法一起使用,以根据不同的时间间隔(例如分钟、小时、天、周、月、季度或年)对数据进行分组。Grouper 包含了key (包含日期的列)、frequency (分组依据的间隔)、closed (关闭间隔的一侧)和label (标记间隔)等参数。Pandas 中的 Grouper 函数提供了一种按不同时间间隔(例如分钟、小时、天、周、月、季度或年)对时间序列数据进行分组的便捷方法。通过与Pandas 中的 groupby 方法 一起使用,可以根据不同的时间间隔对时间序列数据进行分组和汇总。

Grouper函数接受以下参数:

key:时间序列数据的列名。

freq:时间间隔的频率,如“D”表示日,“W”表示周,“M”表示月,等等。

closed:间隔是否应该在右侧(右)、左侧(左)或两侧(两个)闭合。

label :用它的结束(右)或开始(左)日期标记间隔。

Grouper函数和groupby一起按月间隔对数据进行分组:

 importmatplotlib.pyplotaspltimportseabornassns# Group the data by month using pd.Grouper and calculate monthly averagegrouped=df.groupby(pd.Grouper(key='date', freq='M')).mean()print("Grouping is done on monthly basis using pandas.Grouper and groupby method:\n", grouped)# plot the average of monthly salessns.lineplot(grouped.index, grouped['sales'])plt.xlabel("Date")plt.ylabel("Average Monthly Sales")plt.grid(True)plt.title("Average Monthly sales with respect to month using pd.Grouper and groupby ")3.Usingdtaccessorwithgroupby:

3、dt 访问器和 groupby

Pandas中的dt访问器可以从日期和时间类列中提取各种属性,例如年、月、日等。所以我们可以使用提取的属性根据与日期相关的信息对数据进行分组。

在Pandas中,使用dt访问器从DataFrame中的date和time对象中提取属性,然后使用groupby方法将数据分组为间隔。

 importmatplotlib.pyplotaspltimportseabornassns# Group the data by month using dt and calculate monthly averagegrouped=df.groupby(df['date'].dt.to_period("M")).mean()print("Grouping is done on monthly basis using dt and groupby method:\n", grouped)

总结

这三种常用的方法可以汇总时间序列数据,所有方法都相对容易使用。在时间复杂度方面,所有方法对于中小型数据集都是有效的。对于较大的数据集,resample的性能更好,因为它针对时间索引进行了优化。而,Grouper和dt提供了更大的灵活性,可以进行更复杂的分组操作。可以根据自己喜欢的语法或者特定的需求选择一种方法使用。

https://avoid.overfit.cn/post/9a7eac8d7fcb40709fae990f933609cf

作者:R. Gupta

http://www.zhongyajixie.com/news/37548.html

相关文章:

  • 网站报备流程福州百度快速优化排名
  • 自媒体平台怎么赚钱北京seo收费
  • 县工商局 网站建设我国的网络营销公司
  • 新闻网站建设源码seo排名策略
  • 公司网站制作苏州网站设计与开发
  • 宝鸡商城网站开发seo代码优化
  • 商城网站建设开发web软件网站优化+山东
  • redis做网站优化游戏性能的软件
  • 买网站服务器黄金网站app大全
  • 做网站效果怎么样1688精品货源网站入口
  • 3有免费建网站使用最佳搜索引擎优化工具
  • 网站制作视频教程seo网站页面优化包含
  • 如何开网店详细教程seo线下培训班
  • 贵阳网页设计seo排名优化是什么
  • 建设网站采用的网络技术淘宝怎么设置关键词搜索
  • 做化工哪个网站好专业网站优化
  • 能不能自己做网站推广吉林seo排名公司
  • java做的网站有哪些网站品牌推广公司
  • 为了爱我可以做任何事俄剧网站个人微信管理系统
  • ps如何做切片网站按钮山东网络推广优化排名
  • 如何做好一个网站运营网络公关公司联系方式
  • 建设企业网站官网企业网银seo关键词排名优化是什么
  • wordpress出站链接网站开发公司
  • 游戏网页版南京网络优化公司有哪些
  • 婚纱网站设计目标美国搜索引擎浏览器
  • 黔西南州建设银行网站广州百度首页优化
  • wordpress去除顶部广告广州专门做seo的公司
  • web网站开发考试题库答案百度平台客服怎么联系
  • 子网站域名ip地址查询网站维护
  • 做系统网站河南网站优化公司哪家好