word frequency counter in r using n-gram

Question

I would like to perform a certain operation which will transform the data in the provided format.

Input

colA                             colB
textA textB textC textD           m
textA textB                       n
textB textC                       p
textB textC textD                 q

Output

type    col_a              col_b(frequency)           col_c
unigram textA                        2                  m+n
unigram textB                        4                m+n+p+q
unigram textC                        3                 m+p+q
unigram textD                        2                  m+q
bigram  textA textB                  2                  m+n
bigram  textB textC                  3                 m+p+q
bigram  textC textD                  2                  m+q
trigram textA textB textC            1                   m
trigram textB textC textD            2                   m+q
fourgram textA textB textC textD     1                   m

Need to do this separately for unigram,bigram,trigram and fourgram and then rbind the results.

word frequency counter in r using n-gram

Input

Output

Answers (1)

Related Questions