2010-07-29 4 views
1

Кто-нибудь знает, как быстро и легко найти специальные символы, которые не были правильно преобразованы, когда данные были импортированы в MySQL.Поиск специальных символов в базе данных MySQL

Я думаю, что это проблема из-за кодирования данных (например, Latin-1 vs. UTF-8). Независимо от того, где проблема впервые возникла, я застрял в своих данных, что мне нужно удалить.

+0

Как вы * импортировали * данные в MySQL? – pascal

ответ

0

Для этого маловероятно, потому что, например, сломанный специальный символ UTF-8 будет состоять из двух допустимых символов ISO-8859-1. Таким образом, хотя существуют модели того, как выглядят эти сломанные персонажи, нет однозначного способа их идентификации.

Вы можете создать функцию поиска и замены, чтобы заменить наиболее распространенные вхождения на вашем языке (например, Ãœ для Ü, если они импортированы из UTF-8 в ISO-8859-1).

Было сказано, что было бы лучше перезапустить импорт с правильными настройками, если это вообще возможно.

+0

К сожалению, реимпорт данных на данный момент не является вариантом. И не так много этих специальных символов, посыпленных во всех данных. Но даже написав скрипт search-n-replace, вам нужно иметь стартовый список специальных символов для замены. Это список, который я пытаюсь создать. – gurun8