2015-05-19 8 views
25

Я пытаюсь получить сгруппированных boxplot работать, используя Сиборн согласно exampleSeaborn load_dataset

я могу получить приведенный выше пример работает, однако линия:

tips = sns.load_dataset("tips") 

не объяснена вообще. Я нашел файл tips.csv, но я не могу найти адекватную документацию о том, что конкретно делает load_dataset. Я попытался создать свой собственный csv и загрузить это, но безрезультатно. Я также переименовал файл советы и он все еще работал ...

Мой вопрос таким образом:

Где load_dataset на самом деле ищет файлы? Могу ли я использовать это для своих собственных ящиков?

EDIT: Мне удалось получить мои собственные ящики, используя мой собственный DataFrame, но мне все еще интересно, используется ли load_dataset для чего-то большего, чем таинственные примеры учебников.

+2

'load_dataset' - это просто удобная функция для документации на море. – mwaskom

ответ

36

load_dataset ищет онлайн-файлы csv на https://github.com/mwaskom/seaborn-data. Вот ссылка на документ:

Загрузить набор данных из онлайн-хранилища (требуется интернет).

Параметры


Имя: ул Имя набора данных (name .csv на https://github.com/mwaskom/seaborn-data). Вы можете получить список доступных наборов данных с помощью: FUNC: get_dataset_names

KWS: ДИКТ, дополнительный Передаваемого в pandas.read_csv

Если вы хотите изменить этот набор данных онлайн или ввести свои собственные данные, вы вероятно, придется использовать pandas. load_dataset фактически возвращает pandas DataFrame объект, который вы можете подтвердить type(tips).

Если вы уже создали свои собственные данные в файл CSV называется, скажем, tips2.csv и сохранили его в том же месте, как ваш сценарий, использовать это (после установки панд), чтобы загрузить его в:

import pandas as pd 

tips2 = pd.read_csv('tips2.csv')