2015-07-06 4 views
0

Я делаю простой блог android-приложение, в котором пользователи смогут добавлять/просматривать blogs.Now для добавления блога, есть простой текстовый вид, где пользователи могут добавлять контент в блоге (текст блога). Содержимое этого блога затем передается в php-скрипт через HttpPost, который затем хранит его в базе данных MySQL.Возможные проблемы с кодировкой символов?

Теперь моя проблема заключается в том, что пользователи могут копировать-вставлять текст для содержимого блога в текстовое представление. Источник для этой копии-вставки может быть где угодно - от интернет-страниц до учебников. Кроме того, текст может быть любого шрифта, цвета и т. Д. Это, возможно, приводит к проблемам с кодировкой символов, когда всякий раз, когда я пытаюсь скопировать текст в блоге блога, сообщение в блоге терпит неудачу ... в противном случае он отлично работает. является UTF-8.

Мой вопрос: Как преобразовать текст из любого источника с любой кодировкой в ​​utf-8?

+0

нет надежной 100% защиты способ выяснить, что кодирующий фрагмент текста имеет , например 'cat' может быть iso8859, или utf8 - нет абсолютно никакого способа узнать, потому что для базового текста ascii он идентичен в кодировках ascii и utf. –

+0

У вас есть '' на странице? –

ответ

0

Посмотрите на

С их документы:

Вам не нужно знать, что кодирование ваших струн. Это может быть Latin1 (iso 8859-1), Windows-1252 или UTF8, или строка может содержать их. \ ForceUTF8 \ Encoding :: toUTF8() преобразует все в UTF8.

Иногда приходится иметь дело с услугами, которые являются ненадежными с точки зрения кодирования, возможно, смесительных UTF8 и Latin1 в той же строке

Смежные вопросы