I want to compare word pair in panda data frame

Question

Names
['abc aa','bdc sc','abc aa','bdc sp','bdc sc','pp sc','bdc sc',]
['lp aa','bd sc','bdc sc','bd sc','lp aa','bd sc']

['nn aa','bb sc','bb sc','nn aa','bd sc']

I tried as

def drop_dupli(text):
    #seen = set()
    result = []
    
    for item in text.split(): 
        if item not in seen:
            seen.add(item)
            result. Append(item)
    return " ".join(result)
df['newame'] = df['Names'].apply(lambda x: drop_dupli(x))

The result came as follows:

Names
['abc aa','bdc sc','abc ','bdc sp','bdc ','pp sc','bdc ',]
['lp aa','bd sc','bdc sc','bd ','lp ','bd ']

['nn aa','bb sc','bb ','nn ','bd ']

But , I want to get the result should come as follows:

Names
['abc aa','bdc sc','bdc sp','pp sc']
['lp aa','bd sc','bdc sc']

['nn aa','bb sc','bd sc']

I want to compare word pair in panda data frame

Answers (1)

Related Questions