2016-03-02 2 views
1

Я пытаюсь интегрировать кинезис в искровой потоковой передаче, и для этого я использую python и KCL. Я получаю это исключение в большинстве случаев при чтении из кинезисаИсключение, когда python KCL подключается к потоку kinesis

кодек «utf8» не может декодировать байт 0xf1 в положении 940: недопустимый продолжение байт

Может кто-то пожалуйста, дайте мне знать, как я могу решить эту проблему Вот как я создаю поток

kinesisStream = KinesisUtils.createStream(ssc, APPLICATION_NAME, STREAM_NAME, ENDPOINT, REGION_NAME, INITIAL_POS, CHECKPOINT_INTERVAL, awsAccessKeyId =AWSACCESSID, awsSecretKey=AWSSECRETKEY) 
+0

Вы уверены, что данные, которые вы отправляете в Kinesis, являются UTF-8? Похоже, что вы можете получить какой-то латинский-1 (ISO-8859-1) вход, который может быть одной из причин такого типа ошибок. – devonlazarus

+1

Да, вы обряд, я не отправлял правильный формат utf-8. Я буду отмечать этот вопрос так же, как это сделано. Пожалуйста, сделайте свой комментарий как ответ, и я отметю это как ответ – Nipun

ответ

1

Вы должны проверить, чтобы данные, поступающие в поток, были UTF-8.

Попытка декодирования латинского-1 (ISO-8859-1) в качестве UTF-8 может быть одной из причин такого типа ошибок.

Смежные вопросы