作者:小小明
简介:Pandas数据处理专家,10余年编码经验,至今已帮助过成千上万名数据从业者解决工作实际遇到的问题,其中数据处理和办公自动化问题涉及的行业包括会计、HR、气象、金融等等,现为菜J学Python核心技术团队成员之一。
大家好,我是J哥。 最近遇到一个有点烧脑的需求,其实也不算烧脑,主要是判断条件过多,对于我这种记忆力差,内存小的人来说容易出现内存溢出导致大脑宕机。也可能是因为我还没有找到能减小大脑内存压力的写法。若读者有更好的解决方案,欢迎在本文文末进行留言噢! 后台回复「降雨」二字,可领取本文所用数据集和Word模板,便于大家用Python测试。 先看看需求吧: 主要就是要根据左侧的表格自动生成右侧的Word统计报告,实际的各种可能性情况远比图中展示的要更加复杂。 好了,直接开始干代码吧!1数据读取 预览数据: 2异常数据过滤 查看缺失值数量: 结果: 仅一个缺失值数据,可直接删除: 3计算观测站降雨量相对往年的变化 计算降雨量比往年高,跟往年比无变化,以及比往年低的次数分别是多少: 上面的结果中rainfall_high表示降雨量比往年平均水平高的次数,rainfall_equal表示降雨量比往年平均水平持平的次数,rainfall_low表示降雨量比往年平均水平低的次数。于是分情况讨论生成第一段的报告: 结果: 4计算各区域降雨量的极值 再生成第二段的报告: 结果: 5分观测站统计让我脑袋疼的地方就是从这里的代码开始的,后面还有更复杂的需求就不公布了。对每个观测站分别统计哪些区域偏高,哪些区域持平,哪些区域偏低: 可能是我还没有想出较好的封装方式导致代码变得这么复杂,如果有巧妙解决这个问题的朋友,希望能够加菜J学Python交流群一起探讨。6将组织好的文本写入到word中 Word模板文件 的内容: 即: Python渲染代码: 执行完毕,得到Word统计分析报告: 推荐阅读用Python分析元旦旅游热门城市