Vectorizing a multiplication and dict mapping on a Pandas DataFrame without iterating?

Question

I have a Pandas DataFrame, df:

import pandas as pd
import numpy as np
import math

df = pd.DataFrame({'A':[1,2,2,4,np.nan],'B':[1,2,3,4,5]})

and a dict, mask:

mask = {1:32,2:64,3:100,4:200}

I want my end result to be a DataFrame like this:

A    B    C
1    1    32
2    2    64
2    3    96
4    4    400
nan  nan  nan

Right now I am doing this, which seems innefficient:

for idx, row in df.iterrows():
    if not math.isnan(row['A']):
        if row['A'] != 1:
            df.loc[idx, 'C'] = row['B'] * mask[row['A'] - 1]
        else:
            df.loc[idx, 'C'] = row['B'] * mask[row['A']]

Is there an easy way to vectorize this?

piRSquared · Accepted Answer

This should work:

df['C'] = df.B * (df.A - (df.A != 1)).map(mask)

Timing

10,000 rows

# Initialize each run with
df = pd.DataFrame({'A':[1,2,2,4,np.nan],'B':[1,2,3,4,5]})
df = pd.concat([df for _ in range(2000)])

100,000 rows

# Initialize each run with
df = pd.DataFrame({'A':[1,2,2,4,np.nan],'B':[1,2,3,4,5]})
df = pd.concat([df for _ in range(20000)])

Vectorizing a multiplication and dict mapping on a Pandas DataFrame without iterating?

Answers (2)

Timing

Related Questions