Pandas: Groupby an ID variable and filter out datetime rows

Question

How can I groupby an ID variable while just retaining the last row entered at the daily level?

# toy data
df = pd.DataFrame({'id': [1, 1, 1],
                   'time': ['2011/10/10 10:00',
                            '2011/10/10 10:05',
                            '2011/10/11 14:00'],
                   'vals1': [3, 3, 1],
                   'vals2': [2, 3, 1]})

# set datetime
df['time'] = pd.to_datetime(df['time'])

# try to aggregate by day; getting the last value
df.groupby('id')['time'].dt.floor('d').tail(1)  # fails

# expected result
df = pd.DataFrame({'id': [1, 1],
                   'time': [
                            '2011/10/10 10:05',
                            '2011/10/11 14:00'],
                   'vals1': [3, 1],
                   'vals2': [3, 1]})

Pandas: Groupby an ID variable and filter out datetime rows

Answers (1)

Related Questions