Я пишу сценарий R и использую библиотеку (ngram).Почему функция ngrams() дает отдельные биграммы?
Пусть я строка,
«хорошо qualiti корм для собак купил Sever Витал может корм для собак продукт найден хороший qualiti продукт выглядеть процесс тушеное мясо пахнет лучше лабрадор finicki appreci продукт лучше»
и хотите найти bi-grams.
Библиотека Ngram дает мне би-граммы следующим образом:
«appreci продукт» «процесс мясо» «пищевой продукт» «еда купил» «qualiti собака» «продукт найден» «продукт взгляд» «смотреть как «тушеная» «хорошая квалификация» «лабрадор финики» «купил рацион» «качественный продукт» «лучший лабрадор» «корм для собак» «пахнет лучше» «витал может» «запах мяса» «нашел хорошо» " разорвать жизненно важный «процесс тушения» «может собака» «finicki appreci» «продукт лучше»
Как предложение содержит «корм для собак» два раза, я хочу эту двуграмму два раза. Но я получаю это один раз!
Есть ли опция в библиотеке thengram или в любой другой библиотеке, которая дает все биграммы моего предложения в R?