Мне нужно получить сообщение буферов протокола на моем сервере python-torornado и получить материал из двоичного сообщения.Буферы протокола python - ошибка декодирования unicode
postContent = self.request.body
message = prototemp.ReqMessage()
message.ParseFromString(postContent)
Он отлично работает с помощью испытательного инструмента. Когда я запустить его в песочнице среды и моделировать 1000 запросов от моего клиента, он работает в некоторых случаях, но в большинстве запросов, он бросает исключение -
File "server1.py", line 21, in post
message.ParseFromString(postContent)
File "/usr/lib/python2.6/site-packages/protobuf-2.4.1-py2.6.egg/google/protobuf/message.py", line 179, in ParseFromString
self.MergeFromString(serialized)
File "/usr/lib/python2.6/site-packages/protobuf-2.4.1-py2.6.egg/google/protobuf/internal/python_message.py", line 755, in MergeFromString
if self._InternalParse(serialized, 0, length) != length:
File "/usr/lib/python2.6/site-packages/protobuf-2.4.1-py2.6.egg/google/protobuf/internal/python_message.py", line 782, in InternalParse
pos = field_decoder(buffer, new_pos, end, self, field_dict)
File "/usr/lib/python2.6/site-packages/protobuf-2.4.1-py2.6.egg/google/protobuf/internal/decoder.py", line 544, in DecodeField
if value._InternalParse(buffer, pos, new_pos) != new_pos:
File "/usr/lib/python2.6/site-packages/protobuf-2.4.1-py2.6.egg/google/protobuf/internal/python_message.py", line 782, in InternalParse
pos = field_decoder(buffer, new_pos, end, self, field_dict)
File "/usr/lib/python2.6/site-packages/protobuf-2.4.1-py2.6.egg/google/protobuf/internal/decoder.py", line 410, in DecodeField
field_dict[key] = local_unicode(buffer[pos:new_pos], 'utf-8')
UnicodeDecodeError: 'utf8' codec can't decode byte 0xce in position 1: invalid continuation byte
В некоторых других случаях он дает эти ошибки -
UnicodeDecodeError: 'utf8' codec can't decode byte 0xbf in position 3: invalid start byte
UnicodeDecodeError: 'utf8' codec can't decode byte 0xe7 in position 3: unexpected end of data
В чем может быть причина?
вы пытались с помощью Try/за исключением пункта, чтобы напечатать строку, которая генерирующий исключение? или использовать 'pdb', чтобы посмотреть, какие переменные находятся в этой точке? Потому что это говорит вам о проблеме: в строке указано какой-то символ, который не может быть закодирован с помощью utf-8. Таким образом, вам нужно обработать этот персонаж. (и если вы можете понять, что это такое и с этим вам придется справиться в целом, вы сможете справиться с этим) –
Мое первое предположение заключается в том, что тестовый клиент использовал UTF-16, поскольку эти байты не похоже, соответствует UTF-8 или любому значащему западному набору карт –
Похоже, что он получает сообщение, для которого ему не хватает определения протокола. Есть один или несколько излучателей, использующих другую спецификацию? – MarkHu