keyerror while implementing the word2vec model in natural language processing

Question

i=0
list_of_sent=[]
for sent in df["Heading"]:
    filtered_sentence=[]
    for w in sent.split():
        
        if len(w)==0:
            continue
        print(w)    
        for cleaned_words in clean_punc(w).split():
            if(cleaned_words.isalpha()):
                filtered_sentence.append(cleaned_words.lower())
            else:
                continue
    list_of_sent.append(filtered_sentence)

I want to apply word2vec model for which i am first converting my data column values into list of sentences and the cleanpunc is the following function:-

import re
def clean_punc(sentence):
    cleaned=re.sub(r'[?|!| \'|"|#]',r'',sentence)
    cleaned=re.sub(r'[.|,)|(|\|/]',r' ',cleaned)
    return cleaned

and i am applying word2vec model:

w2v_model=gensim.models.Word2Vec(list_of_sent,min_count=1,vector_size=50,workers=4)

and when i run the following code:-

words=list(w2v_model.wv)
print(len(words))

I am getting the error:-

KeyError                                  Traceback (most recent call last)
/tmp/ipykernel_38/1883829707.py in 
----> 1 words=list(w2v_model.wv)
      2 print(len(words))

/opt/conda/lib/python3.7/site-packages/gensim/models/keyedvectors.py in __getitem__(self, key_or_keys)
    377         """
    378         if isinstance(key_or_keys, KEY_TYPES):
--> 379             return self.get_vector(key_or_keys)
    380 
    381         return vstack([self.get_vector(key) for key in key_or_keys])

/opt/conda/lib/python3.7/site-packages/gensim/models/keyedvectors.py in get_vector(self, key, norm)
    420 
    421         """
--> 422         index = self.get_index(key)
    423         if norm:
    424             self.fill_norms()

/opt/conda/lib/python3.7/site-packages/gensim/models/keyedvectors.py in get_index(self, key, default)
    394             return default
    395         else:
--> 396             raise KeyError(f"Key '{key}' not present")
    397 
    398     def get_vector(self, key, norm=False):

KeyError: "Key '141101' not present"

please help me in resolving the error

keyerror while implementing the word2vec model in natural language processing

Answers (1)

Related Questions