2015-10-14 3 views
0

Я использую функцию Corpus для чтения файла, который я создал в указанном ниже каталоге.Доступ к элементам в корпусе

chk <- Corpus(DirSource("C:\\Users\\TCS Profile\\Documents\\R\\Machine Learning Text\\Naive Bayes")) 

После того, как корпус создается, когда я проверить переменную CHK создан, я считаю, что содержание было прочитано:

str(chk) 
List of 1 
$ Test.txt:List of 2 
    ..$ content: chr [1:7] "Hi Wassup" "How are You" "Hope it Works!!!" "" ... 
    ..$ meta :List of 7 
    .. ..$ author  : chr(0) 
    .. ..$ datetimestamp: POSIXlt[1:1], format: "2015-10-14 16:15:17" 
    .. ..$ description : chr(0) 
    .. ..$ heading  : chr(0) 
    .. ..$ id   : chr "Test.txt" 
    .. ..$ language  : chr "en" 
    .. ..$ origin  : chr(0) 
    .. ..- attr(*, "class")= chr "TextDocumentMeta" 
    ..- attr(*, "class")= chr [1:2] "PlainTextDocument" "TextDocument" 
- attr(*, "class")= chr [1:2] "VCorpus" "Corpus" 

Проблема в том, я не могу получить доступ к определенному значению в контента, скажем, третьего элемента. (Надеюсь, что это работает !!) Я попытался, используя следующий код:

chk[[1]][1,3] 

Ошибка в ЧК [[1]] [1, 3]: неправильное число измерений

Может кто-нибудь скажет мне, как я могу получить доступ к соответствующему элементу и почему такая ошибка подходит для вышеуказанного типа доступа?

+0

'CHK $ Test.txt $ содержание [3]' является ярчайшим образом. Изменение вашего пути: 'chk [[1]] [[1]] [3]'. Запустите его по частям, чтобы вы могли выяснить, как это сделать в следующий раз, например, 'chk $ Test.txt' и' chk $ Test.txt $ content' – Frank

+0

@ Frank- Я тоже пробовал эту опцию: –

+0

Ну, он должен работать. Не видя своего фактического примера, никто, кроме вас, не может понять, почему это не так. – Frank

ответ

1

Это должно работать:

> chk[[1]][1]$content[3] 
#[1] "Hope it Works!!!" 

Я использовал эти данные, чтобы воспроизвести ваш пример:

chk <-structure(list(content = list(structure(list(content = c("Hi Wassup ", "How are You ", "Hope it Works!!!", "", "long time no see ", "Howdy", "Yo"), 
meta = structure(list(author = character(0), datetimestamp = structure(list(sec = 12.238600730896, min = 17L, hour = 19L, mday = 14L, mon = 9L, year = 115L, wday = 3L, yday = 286L, isdst = 0L), 
.Names = c("sec", "min", "hour", "mday", "mon", "year", "wday", "yday", "isdst"), 
class = c("POSIXlt", "POSIXt"), tzone = "GMT"), description = character(0), heading = character(0), id = "Test.txt", language = "en", 
origin = character(0)), .Names = c("author", "datetimestamp", "description", "heading", "id", "language", "origin"), 
class = "TextDocumentMeta")), .Names = c("content", "meta"), class = c("PlainTextDocument", "TextDocument"))), meta = structure(list(), class = "CorpusMeta"), 
dmeta = structure(list(), .Names = character(0), row.names = 1L, class = "data.frame")), 
.Names = c("content", "meta", "dmeta"), class = c("VCorpus", "Corpus")) 
+0

Спасибо @ RHertel. Оно работает. .. :) –

Смежные вопросы