Я всегда использую «с» вместо «внутри» в контексте моих исследований, но изначально я думал, что они одинаковы. Только сейчас я ошибаюсь «с» для «внутри», и полученные результаты совершенно разные. Мне интересно, почему?В чем разница между и внутри R?
Я использую данные бейсбол в plyr
пакет, поэтому я сначала загрузить библиотеку
require(plyr)
Затем я хочу, чтобы выбрать все строки с идентификатором «ansonca01». Во-первых, как я уже сказал, я использовал «в», и запустить функцию следующим образом:
within(baseball, baseball[id=="ansonca01", ])
Я получил очень странные результаты, которые в основном включает в себя все:
id year stint team lg g ab r h X2b X3b hr rbi sb cs bb so ibb hbp sh sf gidp
4 ansonca01 1871 1 RC1 25 120 29 39 11 3 0 16 6 2 2 1 NA NA NA NA NA
44 forceda01 1871 1 WS3 32 162 45 45 9 4 0 29 8 0 4 0 NA NA NA NA NA
68 mathebo01 1871 1 FW1 19 89 15 24 3 1 0 10 2 1 2 0 NA NA NA NA NA
99 startjo01 1871 1 NY2 33 161 35 58 5 1 1 34 4 2 3 0 NA NA NA NA NA
102 suttoez01 1871 1 CL1 29 128 35 45 3 7 3 23 3 1 1 0 NA NA NA NA NA
106 whitede01 1871 1 CL1 29 146 40 47 6 5 1 21 2 2 4 1 NA NA NA NA NA
113 yorkto01 1871 1 TRO 29 145 36 37 5 7 2 23 2 2 9 1 NA NA NA NA NA
.........
Затем я использую " с "вместо" в»,
with(baseball, baseball[id=="ansonca01",])
и получили результаты, которые я ожидал
id year stint team lg g ab r h X2b X3b hr rbi sb cs bb so ibb hbp sh sf gidp
4 ansonca01 1871 1 RC1 25 120 29 39 11 3 0 16 6 2 2 1 NA NA NA NA NA
121 ansonca01 1872 1 PH1 46 217 60 90 10 7 0 50 6 6 16 3 NA NA NA NA NA
276 ansonca01 1873 1 PH1 52 254 53 101 9 2 0 36 0 2 5 1 NA NA NA NA NA
398 ansonca01 1874 1 PH1 55 259 51 87 8 3 0 37 6 0 4 1 NA NA NA NA NA
525 ansonca01 1875 1 PH1 69 326 84 106 15 3 0 58 11 6 4 2 NA NA NA NA NA
Я проверил документацию с и в набрав help(with)
в среде R, и получил следующее:
с является общей функцией, которая оценивает выраж в локальная среда, построенная из данных. Окружающая среда имеет окружение вызывающего абонента в качестве родителя. Это полезно для упрощения вызовов функций моделирования. (Примечание: если данные уже являются средой, то это используется с существующим родителем.)
Обратите внимание, что назначения в expr выполняются в сконструированной среде, а не в рабочей области пользователя.
Внутри аналогично, за исключением того, что он исследует среду после оценки expr и вносит соответствующие изменения в данные (это может привести к сбою в случае фрейма данных, если объекты созданы, которые не могут быть сохранены в кадре данных) и возвращает его. внутри может быть использовано в качестве альтернативы преобразованию.
Из этого объяснения различий я не понимаю, почему я получил разные результаты при такой простой операции. У кого-нибудь есть идеи?
Почему вы используете 'with' вообще в инструкции вроде:' с (бейсбол, бейсбол [id == "ansonca01",]) '? Вам просто нужно «бейсбол [бейсбол $ id ==» ansonca01 »,]'. – Thomas
'in' возвращает полный фрейм данных. Выполнение извлечения внутри 'inside' на самом деле не имеет никакого смысла. Попробуйте создать новую переменную внутри 'с' и внутри' внутри', и вы увидите разницу более четко. – Thomas
@Thomas Привет, конечно, я знаю, что могу делать подмножество с бейсболом [baseball $ id == "ansonca01",], и на самом деле я всегда делал это таким образом. Сегодня я просто хотел попробовать что-то другое, и я нашел с ними и в результате разные результаты для такой простой операции. Я хочу понять, почему !!! Я узнал, что «внутри» предназначен для создания новых переменных, но это не отвечает на мой вопрос, размещенный здесь, поэтому эти две функции приводят к различным результатам в подмножестве? – nan