У меня есть файл со списком слов, не слишком похожим на это, который я хочу импортировать в мою базу данных MSSQL;преобразовать в символы ASCII VB.net ssis
Świętochłowice
Chełmiec
Wałcz
...
Я хочу сделать элементарное преобразование польских символов в ASCII, так что они могут быть разобраны через мою БД. Я использую SSIS для импорта данных, и поэтому я использую скрипт vb.net для изменения текста в/перед импортом.
Я пробовал;
Public Overrides Sub Input0_ProcessInputRow(ByVal Row As Input0Buffer)
Row.unsanitised1.Replace("Ą", "A")
Row.unsanitised1.Replace("ą", "a")
Row.unsanitised1.Replace("Ć", "C")
Row.unsanitised1.Replace("ć", "c")
Row.unsanitised1.Replace("Ę", "E")
Row.unsanitised1.Replace("ę", "e")
Row.unsanitised1.Replace("Ł", "L")
Row.unsanitised1.Replace("ł", "l")
Row.unsanitised1.Replace("Ń", "N")
Row.unsanitised1.Replace("ń", "n")
Row.unsanitised1.Replace("Ó", "O")
Row.unsanitised1.Replace("ó", "o")
Row.unsanitised1.Replace("Ś", "S")
Row.unsanitised1.Replace("ś", "s")
Row.unsanitised1.Replace("Ź", "Z")
Row.unsanitised1.Replace("ź", "z")
Row.unsanitised1.Replace("Ż", "Z")
Row.unsanitised1.Replace("ż", "z")
Row.sanitised = Row.unsanitised
Row.sanitised1 = Row.unsanitised1
End Sub
Однако, когда файл считывается, символы не читаются должным образом, они приходят в более как «lx,» что я делаю не так? Нужно ли читать их в формате unicode?
Файл и vbscript сохраняются в кодировке 1200 для сохранения польских символов.
Использование кодовой страницы Юникода 65001 –
@sandeeprawat thanks unicode code page 65001, похоже, работает по большей части. По какой-то причине он пропускает Ó & ó, хотя, когда данные анализируются, он выглядит идентично мне. – Intern87
Я бы предложил попробовать вашу идею с помощью юникода. У меня была аналогичная проблема (с небольшими разными символами для замены), и она отлично работала после проверки и замены кодов Юникода вместо самих символов. – Tyron78