Convert negative datetime to NaT

Question

I have two columns: "asked" and "answered", but "answered' is an object while "asked" is a datetime64[ns]. So I convert 'answered' to Datetime:

df['answered'] = pd.to_datetime(df['answered'])

index,  asked,    answered
0     2016-07-04  07/07/2016
1     2016-07-03  07/01/2016
2     2016-07-05  07/09/2016
3     NaT         NaN

Then, I made a 3rd column that gives me the difference in time between the two:

df['Days']= df['answered'] - df['asked']

 index,     asked,    answered,    Days     
    0     2016-07-04  07/07/2016   3 days
    1     2016-07-03  07/01/2016   -2 days
    2     2016-07-05  07/09/2016   4
    3     NaT         NaN          NaT

With the help of @piRSquared, I was trying to turn the negative Days into a NaT, but nothing happened when I did this:

df.update(df[['Days']].mask(df < 0))

How can I turn the negative days to a NaT?

jezrael · Accepted Answer

For me works comapre Series (columns) by 0 Timedelta, then create NaT by Series.mask or loc:

mask = df['Days'] < pd.Timedelta(0)
df['Days'] = df['Days'].mask(mask)
print (df)
       asked   answered   Days
0 2016-07-04 2016-07-07 3 days
1 2016-07-03 2016-07-01    NaT
2 2016-07-05 2016-07-09 4 days
3        NaT        NaT    NaT

Or:

mask = df['Days'] < pd.Timedelta(0)
df.loc[mask, 'Days'] = np.nan
print (df)
       asked   answered   Days
0 2016-07-04 2016-07-07 3 days
1 2016-07-03 2016-07-01    NaT
2 2016-07-05 2016-07-09 4 days
3        NaT        NaT    NaT

But if compare 0 Timedelta with DataFrame it is buggy:

print (df)
       asked   answered    Days   Days2
0 2016-07-04 2016-07-07  3 days  3 days
1 2016-07-03 2016-07-01 -2 days -2 days
2 2016-07-05 2016-07-09  4 days  4 days
3        NaT        NaT     NaT     NaT

df1 = df.select_dtypes([np.timedelta64])

#return wrong mask
m1 = df1 < pd.Timedelta(0)
print (m1)
    Days  Days2
0  False  False
1  False  False
2  False  False
3   True   True

#if comapre with apply by Series it works
m2 = df1.apply(lambda x: x < pd.Timedelta(0))
print (m2)
    Days  Days2
0  False  False
1   True   True
2  False  False
3  False  False

#compare numpy array works but warning 
m3 = df1.values < np.array(0, dtype=np.timedelta64)
print (m3)
[[False False]
 [ True  True]
 [False False]
 [ True  True]]

FutureWarning: In the future, 'NAT < x' and 'x < NAT' will always be False.

df[df1.columns] = df1.mask(m2)
print (df)
       asked   answered   Days  Days2
0 2016-07-04 2016-07-07 3 days 3 days
1 2016-07-03 2016-07-01    NaT    NaT
2 2016-07-05 2016-07-09 4 days 4 days
3        NaT        NaT    NaT    NaT

Convert negative datetime to NaT

Answers (2)

Related Questions