lemmatization inside array using nltk python

Question

i'm new using python and i dont know how to lemmatize an array. what i do is

from nltk.stem import WordNetLemmatizer
lmtzr = WordNetLemmatizer()
data = 'data/new 1.txt'
file_tagged = open(data)
verses_tagged = file_tagged.readlines()
num_lines = sum(1 for line in open(data))
i = 0
dataPair = []
tokenP1 = []
tokenP2 = []

def tokenPhrasebase(verse):
    return verse.split('}')

for i in range(0, num_lines):
    dataPair.append(verses_tagged[i].split('	'))

    tokenP1.append(tokenPhrasebase(dataPair[i][0]))
    tokenP2.append(tokenPhrasebase(dataPair[i][1]))

    for j in range(len(tokenP1[i])):
        tokenP1[i][j] = tagRemoval(tokenP1[i][j])
    for j in range(len(tokenP2[i])):
        tokenP2[i][j] = tagRemoval(tokenP2[i][j])

    for y in range(0, num_lines):
        tokenP1[y] = lmtzr.lemmatize(tokenP1[y])
        tokenP2[y] = lmtzr.lemmatize(tokenP2[y])

what i want to do is lemmatize all string inside array without changing the array formation. but i get an error like this TypeError: unhashable type: 'list' anyone can help?

lemmatization inside array using nltk python

Answers (1)

Related Questions