Adding Calculated Field in DataFrame

Question

I would like to create a column called str_bos in a existing DataFrame called result. I have the following columns - 'str_nbr', 'ZIP Sales', 'str_Sales', 'ZIP_Distinct #', 'ZIP_Share_of_Str_Sales', 'Counter', 'Str_BOS_Cum%', 'Str_Sales_Rank'.

Here is what I've come up with. But, it takes 2 hours to complete. However, other operations (like sort, merge etc.) take a few seconds. What I'm missing here?

def str_bos(row):
    if row['str_sales_rank'] == 1 or row['str_bos_cum%'] <= 0.1:
        return 1
    elif row['str_bos_cum%'] <= 0.2:
        return 2
    elif row['str_bos_cum%'] <= 0.3:
        return 3
    elif row['str_bos_cum%'] <= 0.4:
        return 4
    elif row['str_bos_cum%'] <= 0.5:
        return 5
    elif row['str_bos_cum%'] <= 0.6:
        return 6
    elif row['str_bos_cum%'] <= 0.7:
        return 7
    elif row['str_bos_cum%'] <= 0.8:
        return 8
    elif row['str_bos_cum%'] <= 0.9:
        return 9
    else:
        return 10

result['str_bos'] = result.apply(lambda row: str_bos(row), axis=1)

Adding Calculated Field in DataFrame

Answers (1)

Related Questions