Из моего понимания и того, что я читал по сети, UTF-8 может использовать 1-4 кодовых блока (каждый побайтно в длину) для кодирования всех символов из набора символов Юникода. Мне интересно, так как все кодовые точки в Юникоде могут быть представлены в 21 бит, когда вы используете 4 блока кода, а не 3?В каких обстоятельствах в кодировке UTF-8 потребуется 32 бита?
Вам нужно всего лишь 24 бита для представления любого символа Юникода, поэтому, когда вы будете использовать 32 бита в кодировке UTF-8 и почему? Нужны ли дополнительные бит для хранения дополнительных данных?