Я пытаюсь читать CSV файл, расположенный в ведре AWS S3 в память как панды dataframe, используя следующий код:Как прочитать файл CSV из s3 ведра с использованием панд в Python
import pandas as pd
import boto
data = pd.read_csv('s3:/example_bucket.s3-website-ap-southeast-2.amazonaws.com/data_1.csv')
В для того, чтобы дать полный доступ я установить политику ведро на ведро S3 следующим образом:
{
"Version": "2012-10-17",
"Id": "statement1",
"Statement": [
{
"Sid": "statement1",
"Effect": "Allow",
"Principal": "*",
"Action": "s3:*",
"Resource": "arn:aws:s3:::example_bucket"
}
]
}
к сожалению, я все еще получаю следующее сообщение об ошибке в Python:
boto.exception.S3ResponseError: S3ResponseError: 405 Method Not Allowed
Если вы хотите объяснить, как правильно установить разрешения в AWS S3 или правильно настроить pandas для импорта файла. Благодаря!
не должны там быть двойной слэш после s3? –
Да, вы правы, должно быть. Мне также пришлось изменить местоположение ведра и файла: tripData = pd.read_csv ('htps: //s3-ap-southeast-2.amazonaws.com/example_bucket/data.csv'). и мне пришлось обновлять разрешения для отдельного файла. но он работает сейчас. веселит. –
Пожалуйста, добавьте свое решение в качестве ответа, чтобы помочь другим пользователям Stackoverflow. –