Q-Logo 我的学习笔记分享

Entries for tag "pandas"

Pandas DataFrame的round函数详解及小坑

df.round(decimals=0, *args, **kwargs)

输入参数

decimals : int, dict, Series,每一列舍入到的小数位数。如果是整数,每一列都被舍入到这个位数;如果是字典或序列,各列舍入到指定的精度。列的名字应该作为decimals 字典的键,或者decimals 序列的index。未在decimals 中指定精度的列将保留原样。如果decimals 中有不是列名的键或index,会被忽略。

返回:

DataFrame: 舍入到指定精度的DataFrame。

decimals=0时,返回的是浮点数而非整数。

round 并非四舍五入,对浮点数执行round 须谨慎。

Pandas数据整理实战 - 合并+填充+丢弃缺失

在进行数据处理时,有时会需要将这样的两个表整理成一个表,如下图所示

pandas-merge-fillna-dropna.jpg

第一个表中为每日测量值,第二个表中是标准生效日期,第一个表中每日的测量值,是依据当日之前最新的标准进行测量得到的值。按照这个规则可以整理得到第三个表,这个表综合显示每日测量值所依据的标准和标准生效日期。

使用pandas , 可以综合运用合并、填充和丢弃缺失等方法,来从表1和表2得到表3:

pdm = pd.merge(df1,df2,how='outer',left_on='date',right_on='effective date',sort=True).fillna(method='ffill').dropna()

用Python绘制海外新冠肺炎疫情的南丁格尔玫瑰图

新冠疫情数据玫瑰图.JPG

2020不太平,新冠病毒来汹汹。

新冠起,通衢止,大街小巷无人迹。

全国人民战疫情,神州大地按暂停。

春分至,黄经赤,众志成城终见日。

奈何国内波未平,海外诸国澜又兴。

本文在参考各位前辈文章的基础上,用南丁格尔玫瑰图来展示海外新冠肺炎疫情情况。