Group duplicate rows with different column values then send to csv

Question

I have this csv file favsites.csv:

Emails                          Favorite Site                                                                                       
batman@email.com                something.com          
batman@email.com                hamburgers.com         
poisonivy@email.com             yonder.com             
superman@email.com              cookies.com            
catgirl@email.com               cattreats.com           
catgirl@email.com               fishcaviar.com          
catgirl@email.com               elegantfashion.com             
joker@email.com                 cards.com            
supergirl@email.com             nailart.com

I want to group the duplicates, then merge the columns, and then send to a csv.

So once grouped and merged it should look like this:

Emails                          Favorite Site                                                                                       
batman@email.com                something.com          
                                hamburgers.com         
poisonivy@email.com             yonder.com             
superman@email.com              cookies.com            
catgirl@email.com               cattreats.com           
                                fishcaviar.com          
                                elegantfashion.com             
joker@email.com                 cards.com            
supergirl@email.com             nailart.com

How would I send this to a csv file and have it look like this? But something.com and hamburgers.com are in one cell for batman; and cattreats.com, fishcaviar.com, and elegantfashion.com are in one cell for catgirl. OR, have them in the same row but different columns like this.

Emails                          Favorite Site                                                                                       
batman@email.com                something.com    hamburgers.com                                
poisonivy@email.com             yonder.com             
superman@email.com              cookies.com            
catgirl@email.com               cattreats.com    fishcaviar.com   elegantfashion.com             
joker@email.com                 cards.com            
supergirl@email.com             nailart.com

Here is my code so far:

import pandas as pd

Dir='favsites.csv'
sendcsv='mergednames.csv'

df = pd.read_csv(Dir)
df = pd.DataFrame(df)
df_sort = df.sort_values('Emails')
grouped = df_sort.groupby(['Emails', 'Favorite Site']).agg('sum')

When I print grouped it shows:

Empty DataFrame
Columns: []
Index: [(batman@email.com, hamburgers.com), (batman@email.com, something.com), (catgirl@email.com, cattreats.com), (catgirl@email.com, elegantfashion.com), (catgirl@email.com, fishcaviar.com), (joker@email.com, cards.com), (poisonivy@email.com, yonder.com), (supergirl@email.com, nailart.com), (superman@email.com, cookies.com)]

Guru Stron · Accepted Answer

You can replace duplicated values with empty strings:

emails = ['batman@email.com', 'poisonivy@email.com','superman@email.com', 'batman@email.com']
favs =['something.com', 'hamburgers.com', 'yonder.com', 'cookies.com' ]
df = pd.DataFrame({'Emails': emails, 'Favorite Site': favs})

df_sorted = df.sort_values('Emails')
df_sorted.loc[df['Emails'].duplicated(), 'Emails'] = ''

Output:

Emails	Favorite Site
batman@email.com	something.com
	cookies.com
poisonivy@email.com	hamburgers.com
superman@email.com	yonder.com

Group duplicate rows with different column values then send to csv

Answers (2)

Related Questions

Emails	Favorite Site
[email protected]	something.com
	cookies.com
[email protected]	hamburgers.com
[email protected]	yonder.com