Datetime from two different columns in a DataFrame

Question

I am trying to create a new datetime column in my dataframe from existing separate date and time columns. My function works when I test it by just giving it two strings, but when I try it on a dataframe it doesn't. The code is as follows:

import pandas as pd

def datetime_row(date,time):
    if len(time) == 2:
        datetime = date[-2:]+"-"+date[-4:-2]+"-"+date[0:4]+" 00:00:"+time
    else:
        datetime = date[2:]
    return datetime

df = pandas.read_csv('test.csv',dtype=str)

df['datetime'] = datetime_row(df['date'],df['time'])

when I look at the dataframe altered by the function, this is what it looks like:

    date       time     datetime
0   20161213    07           NaN
1   20161213    08           NaN
2   20161213    09      20161213
3   20161213    010     20161213

if I call the datetime_row function on two strings:

datetime_row("20161312","01")

it works fine, outputting:

'12-13-2016 00:00:01'

I'm wondering what I'm doing wrong here. Just to provide full details, the csv I'm reading from looks as follows:

date,time
20161213,07
20161213,08
20161213,09
20161213,010

valkyrie · Accepted Answer

You can use pandas apply function for this:

df['datetime'] = df.apply(lambda row: datetime_row(row["date"], row["time"]), axis=1)

Datetime from two different columns in a DataFrame

Answers (2)

Using `pd.to_datetime`

Performance vs `apply`

Related Questions

Datetime from two different columns in a DataFrame

Answers (2)

Using pd.to_datetime

Performance vs apply

Related Questions

Using `pd.to_datetime`

Performance vs `apply`