Replace pandas dataframe values within a particular column based on values within a different column

Question

Given the following dataframe:

x = pd.DataFrame(
    {"a": [1, 2, 3, 2], "b_1": [0, 0, 0, 0], "b_2": [0, 0, 0, 0], "b_3": [0, 0, 0, 0]}
)

Which looks as:

   a  b_1  b_2  b_3
0  1    0    0    0
1  2    0    0    0
2  3    0    0    0
3  2    0    0    0

How can it be coverted to:

y = pd.DataFrame(
    {
        "a": [1, 2, 3, 2],
        "b_1": [-1, 0, 0, 0],
        "b_2": [0, -1, 0, -1],
        "b_3": [0, 0, -1, 0],
    }
)

which looks as:

   a  b_1  b_2  b_3
0  1   -1    0    0
1  2    0   -1    0
2  3    0    0   -1
3  2    0   -1    0

edit 2

Here's a solution:

x1 = x.melt(id_vars="a", ignore_index=False)
x1["value_2"] = x1["variable"].str.split("_").str[1].astype(int)
x1.loc[x1["a"].eq(x1["value_2"]), "value"] = -1
x1 = x1.drop("value_2", axis=1)
x1.set_index(["a", "variable"], append=True)["value"].unstack().reset_index(level=1)
x1 = x1.set_index(["a", "variable"], append=True)["value"].unstack().reset_index(level=1)

I feel as though it's quite messy though.

Replace pandas dataframe values within a particular column based on values within a different column

edit 2

Answers (1)

Related Questions