Я ищу эффективный способ преобразования индексов в строку с одной кодировкой (например, UTF-16) в другую строку с использованием другой кодировки (например, UTF-8). Преобразование строки из одной кодировки в другую тривиально. Вопрос касается только индексов в строках.Как преобразовать индексы строк между различными кодировками?
использования:
У меня есть библиотека бэкенд работает исключительно с UTF-8, который делает некоторый синтаксический анализ, между прочим. Это должно использоваться из библиотеки C#. Я хочу вернуть позиции синтаксической ошибки относительно исходной строки.
Я не думаю, что есть какой-либо прямой путь, помимо прохождения символа по символу и подсчета количества байтов в одной кодировке по сравнению с другой. – deceze
Да, это тоже моя идея, но я надеюсь на какой-то умный способ сделать это. –