В настоящее время я работаю над программой шифрования/дешифрования в python 3 и отлично работает со строками; однако у меня возникают проблемы с преобразованием его в байтовые строки, как в UTF-8, символ может быть выражен в любом месте от 1 до 4 байтов.Кодирование с фиксированной длиной в Python 3
>>>'\u0123'.encode('utf-8')
b'\xc4\xa3'
>>>'\uffff'.encode('utf-8')
b'\xef\xbf\xbf'
После некоторых исследований я обнаружил, что в настоящее время нет кодирования в Python 3, который имеет фиксированную длину для каждого байта и имеет все символы в кодировке UTF-8 - есть ли модуль/функция, что я могу использовать, чтобы обойти эту проблему (например, добавив пустые байты, чтобы каждый чарт кодировал байтовую строку длиной 4)?
Вы имеете UTF-16, он кодирует в '2 * LEN (текст) + 2' байт. –
UTF-8 - кодирование переменной длины. Таким образом, нет, нет кодировки * в любой точке мира *, которая является фиксированной длиной и UTF-8. –
Мне просто нужно иметь все charcters в utf-8 –