2016-06-29 2 views
0

У меня есть файл CSV, закодированный как UTF-8, который я скачал с IMDb.com. Я хотел бы импортировать эти данные в SSMS 2016 (или 2014) с помощью мастера импорта. Вот пример того, что CSV выглядит (обратите внимание, директор Dallas Buyers Club является Jean-Marc Vall é е):Диакритические символы в CSV, но превратились в странные символы в Мастер импорта SQL Server

"position","const","created","modified","description","Title","Title type","Directors","You rated","IMDb Rating","Runtime (mins)","Year","Genres","Num. Votes","Release Date (month/day/year)","URL" 
"38","tt1636826","Tue Feb 16 00:00:00 2016","","","Project X","Feature Film","Nima Nourizadeh","6","6.7","88","2012","comedy, crime","155628","2012-03-01","http://www.imdb.com/title/tt1636826/" 
"39","tt0119528","Tue Feb 16 00:00:00 2016","","","Liar Liar","Feature Film","Tom Shadyac","6","6.8","86","1997","comedy, fantasy, romance","217817","1997-03-18","http://www.imdb.com/title/tt0119528/" 
"40","tt0790636","Tue Feb 16 00:00:00 2016","","","Dallas Buyers Club","Feature Film","Jean-Marc Vallée","7","8.0","117","2013","biography, drama","321602","2013-09-07","http://www.imdb.com/title/tt0790636/" 

Я выбираю Flat File Source в мастере импорта выберите свой файл, и используйте опции по умолчанию (при добавлении «в качестве спецификатора текста»). Однако это пример того, что я вижу: http://imgur.com/a/i53hB

Диакритический символ é превращается в Ã ©. Я попытался выбрать Unicode рядом с «Locale» в Мастере импорта, но он преобразует все в китайские символы и помещает все в одну ячейку.

Любая идея, что здесь происходит?

+0

Какой формат является инструментом SSIS, возвращающим его? Проведите некоторое исследование стиля UTF-8. Например, 1252 является LATIN ANSI в DT_String –

+1

, ваш источник плоского файла на изображении указывает, что он ожидает кодовой страницы 1252. Но вы говорите, что плоский файл UTF-8, выбранная кодовая страница должна соответствовать файлу. Я не пробовал, но я видел в других ответах, что UTF-8 должен быть доступен в SQL 2016. так что, поскольку это приводит меня в бешенство, вы можете предоставить ссылку на то, что вы загрузили с IMDB.com, я хотел бы настроить тестовый сценарий с теми же данными для моих собственных знаний ..... – Matt

+1

также FYI вы должны размещать свои изображения непосредственно в вопросе, а не ссылаться на свой собственный сайт. – Matt

ответ

1

Измените кодировку на подключении плоского файла на кодовую страницу 65001 (UTF-8) и убедитесь, что тип данных является строкой Unicode DT_WTSR.

Эта ссылка содержит, скорее, шаг за шагом инструкции. https://www.mssqltips.com/sqlservertip/3119/import-utf8-unicode-special-characters-with-sql-server-integration-services/

Смежные вопросы