У меня есть строка, содержащая символы UTF-8, и у меня есть метод, который должен преобразовать каждый символ в верхний или нижний регистр, это легко сделать с символами которые перекрываются с ASCII, и, очевидно, некоторые символы не могут быть преобразованы, например любой китайский характер. Однако есть хороший способ обнаружить и преобразовать другие символы, которые могут быть верхними/нижними, например. все греческие персонажи? Также обратите внимание, что мне нужно сделать это как на Windows, так и на Linux.Преобразование символов UTF-8 в верхний/нижний регистр C++
Спасибо,
Важно получить правильную терминологию здесь, чтобы получить полезный ответ. UTF-8 - кодировка символов, указанная в RFC 3629 (и в другом месте); он содержит алгоритмы для отображения между символами Unicode и октетными последовательностями, которые представляют эти символы переносимо. Пожалуйста, будьте точны с типами; еще лучше, покажите код, включающий объявления и типы. –
Грег ваш комментарий не имеет для меня никакого смысла, извините, но у меня пока нет кода. Я пытаюсь выяснить, как что-то сделать, не пытаться отладить что-то, что неправильно работает, так что это не имеет смысла для меня, также Я знаю, что UTF-8 - это кодирование, но это действительно не меняет того, что я пытаюсь достичь, который развивает средство, с помощью которого можно перейти от «a» -> «A» или от «Ω» -> «ω», – NSA
Какова цель? Вы собираетесь использовать его для сравнения таких обработанных строк? Я предполагаю, что вы хотите использовать его для такого сравнения. Вы понимаете, что это не будет обрабатывать такие вещи, как «ß» и «ss», эквивалентные на немецком языке? – wilx