2013-12-16 2 views
5

Ответ на this question использует переменную PANEL, которая, как представляется, является внутренней для ggplot. Но поиск ggplot documentation, а также Hadley Wickham's book, я не могу найти ссылки на него вообще. Является ли это документированным где угодно?Документация по внутренним переменным в ggplot, особенно. PANEL

Также, глядя на код для stat_bin(...), очевидно, что создан вектор count (который содержит количество у для каждого уникального x ??). Это также доступно в aes(...), но, опять же, я не могу найти документацию.

Итак, мой вопрос: есть ли место, где все эти внутренние переменные документированы или нужно просто перейти к коду?

+1

Я действительно не советую использовать внутренние переменные таким образом - некоторые вещи не документированы по какой-либо причине! (И может измениться в будущем) – hadley

+1

@hadley - Спасибо за ваш комментарий. Причина, по которой я спросил о PANEL, заключается в том, что ее использование, по-видимому, решает серьезную проблему с 'ggplot', а именно, что агрегирующие функции не учитывают группировку, подразумеваемую в гране (см. [Этот вопрос] (http://www.stackoverflow.com/ вопросы/20058902 /)).Обычным ответом является создание вспомогательных таблиц, которые сгруппированы по фасетным переменным, но связанный с ним вопрос касается этого! – jlhoward

+1

Я бы просил не советовать. Просто выполните агрегацию вне ggplot. – hadley

ответ

5

На страницах справки для ggplot2 есть некоторые неожиданные пробелы (и я хотел бы указать также на страницу справки для? Слоя, на которую многие другие страницы ссылаются на пользователей как особенно вопиющий пробел.) Эти «переменные» были вокруг лет и, как и вы, я не могу найти много в онлайн-справке или в пакете NEWS. Функция поиска SO не очень помогает, поскольку она удаляет ведущие и конечные точки и показывает все с помощью «count». Только примеры их использования можно найти в файле cran.r-project.org/web/packages/ggplot2/ggplot2.pdf. Google несколько более полезен, и строка поиска: ggplot2 ..counts .. содержит множество информационных хитов. Из контекста видно, что это не столько специальные переменные, сколько комбинированные функции и программные элементы управления. Эти аргументы неявно преобразуют именованные аргументы. Они, кажется, неявно упоминаются в ?stat_bin {ggplot2}, хотя и без точек, и кажется, что все четыре из этих переменных-переменных вычисляются одновременно.

Когда я выполнил поиск в pdf-файле, который вы связали, я нашел на страницах 57-58 таблиц (№ 4.3.4.4) «статистики» и «эстетики», которые вы просили, но, к моему удивлению, включают count. Эти таблицы приведены в разделе 4.7, который описывает «статистику».

(я заметил улучшение или последние пару лет в некоторых из страниц, на которые были направлены эти жалобы.)

+0

Спасибо. Я рассмотрю pp 57-58 книги. Чтобы быть ясным, «count», о котором я говорю, не «..count..' (который документирован в разных местах), а фактический вектор' count [] ', который используется в ответе на связанный вопрос выше. – jlhoward

+0

Это, вероятно, локальная ссылка на dataframe, созданная 'stat_bin'. Сначала я подумал, что это вызов функции 'count' в' plyr '. (Плохой дизайн, ИМО.) –

2

Я думаю, что панель представляет собой столбец в данных составляющие сюжете. Вы получаете список имен столбцов:

names(ggplot_build(x)$data) 

Для подсчета и частоты переменных, вы можете обратиться к Hadley книге, стр 69:

И гистограмма и частоты многоугольник использование геого stat_bin , Эта статистика производит два значения выходных переменных и плотность. Счет по умолчанию является наиболее интерпретируемым. Плотность - это в основном счет, деленный на общее количество, и полезен, когда вы хотите сравнить форму распределений, а не общий размер. Вы будете часто предпочитаете это при сравнении распределения подмножеств, которые имеют разных размеров.

Смежные вопросы