Error in prediction of sentiment in Scikit LogisticRegression

Question

from sklearn.feature_extraction.text import CountVectorizer

vectorizer = CountVectorizer()

train_matrix = vectorizer.fit_transform(train_data['review'])

test_matrix = vectorizer.fit_transform(test_data['review'])

Training LogisticRegressor

from sklearn.linear_model import LogisticRegression

sentiment_model = LogisticRegression()

sentiment_model = sentiment_model.fit(train_matrix,train_data['sentiment'])

Examin sample data

sample_test_data = test_data[10:13]

sample_test_matrix = vectorizer.fit_transform(sample_test_data['review'])

predict = sentiment_model.predict(sample_test_matrix)

Error:

X has 85 features per sample; expecting 121676

ValueErrorTraceback (most recent call last)

in ()

----> 1 predict = model.predict(sample_test_matrix)

~\Anaconda3\lib\site-packages\sklearn\linear_model\base.py in predict(self, X)
            Predicted class label per sample.
----------> scores = self.decision_function(X)
       if len(scores.shape) == 1:

         indices = (scores > 0).astype(np.int)
decision_function(self, X)
      if X.shape[1] != n_features:

          raise ValueError("X has %d features per sample; expecting %d"
        ------------>   % (X.shape[1], n_features))

    scores = safe_sparse_dot(X, self.coef_.T,
ValueError: X has 85 features per sample; expecting 121676

Error in prediction of sentiment in Scikit LogisticRegression

Training LogisticRegressor

Examin sample data

Answers (1)

Related Questions