Я пытаюсь извлечь полярность настроений для просмотра фильма, поэтому для этого из помеченного текста (используя treetagger) я хотел бы извлечь все биграммы, которые имеют теги (ADV-VER: pper) или (VER: pres - ADJ). Например, в приведенном ниже примере список извлеченных фраз: bien suivi, est efficace.фразы извлечения с помощью R
Не могли бы вы помочь?
спасибо заранее
Database <- read.table("exp.txt", header = FALSE)
Database
V1 V2 V3
1 Toujours ADV toujours
2 bien ADV bien
3 suivi VER:pper suivre
4 par PRP par
5 mon DET:POS mon
6 conseiller NOM conseiller
7 Bon NAM <unknown>
8 accueil NOM accueil
9 , PUN ,
10 ma DET:POS mon
11 conseillère NOM conseiller
12 est VER:pres être
13 efficace ADJ efficace
14 et KON et
15 à PRP à
16 l' DET:ART le
17 écoute NOM écoute
18 .
Я думаю, что у вас есть что-то вроде следующего. 'df <- data.frame (a = rep (c (" a "," b "," c "), 3), b = 1: 9)', 'df [df $ a% в% c (" б», "в"),]'. Я предлагаю вам потратить некоторое время, чтобы узнать R. – DJJ
@ DJJ Хорошо спасибо, конечно, я сделаю :) – Poisson