Pandas数据整理实战 - 合并+填充+丢弃缺失
在进行数据处理时,有时会需要将这样的两个表整理成一个表,如下图所示
第一个表中为每日测量值,第二个表中是标准生效日期,第一个表中每日的测量值,是依据当日之前最新的标准进行测量得到的值。按照这个规则可以整理得到第三个表,这个表综合显示每日测量值所依据的标准和标准生效日期。
使用pandas , 可以综合运用合并、填充和丢弃缺失等方法,来从表1和表2得到表3:
pdm = pd.merge(df1,df2,how='outer',left_on='date',right_on='effective date',sort=True).fillna(method='ffill').dropna()