У меня есть строка, которая содержит данные в Юникоде.Преобразование строки Юникода в правильную строку
Я хочу записать его в файл. Когда данные записываются в файл, это дает мне простое значение unicode вместо языков, отличных от английского.
string originalString = ((char)(buffer[index])).ToString();
//sb.Append(DecodeEncodedNonAsciiCharacters(originalString.ToString()));
foreach (char c1 in originalString)
{
// test if char is ascii, otherwise convert to Unicode Code Point
int cint = Convert.ToInt32(c1);
if (cint <= 127 && cint >= 0)
asAscii.Append(c1.ToString());
else
{
//String s = Char.ConvertFromUtf32(cint);
asAscii.Append(String.Format("\\u{0:x4} ", cint).Trim());
// asAscii.Append(s);
}
}
sb.Append((asAscii));
Console.WriteLine();
, когда я вижу выходной файл данных показывает, как это
1 00: 00: 27709 -> 00: 00: 32959 1,2 \ u00e0 \ u00a4 \ u0085 \ u00e0 \ u00a4 \ u00b0 \ u00a0 \ u00a4 \ u00a0 \ u00a4 \ u00b2 \ u00e0 \ u00a5 \ u008b \ u00e0 \ u00a4 \ u0097 28 \ u00e0 \ u00a4 \ u00b0 \ u00a0 \ u00a4 \ u00e0 \ u00a4 \ u009c \ u00e0 \ u00a0 \ u00a4 \ u009c \ u00e0 \ u00a0 \ u00a4 \ u009c \ u00e0 \ u00a5 \ u004b \ u004 \ \ u008d \ u00e0 \ u00a4 \ u00af \ u00e0 \ u00a4 \ u0094 \ u00e0 \ u00a4 \ u00b0 \ u00e0 \ u00a4 \ u00b8 \ u00e0 \ u00a4 \ u00be \ u00e0 \ u00a4 \ u00a4 \ u00e0 \ u00a4 \ u0095 \ u00e0 \ u00a5 \ u0087 \ u00e0 \ u00a4 \ u0082 \ u00e0 \ u0 0a4 \ u00a6 \ u00e0 \ u00a5 \ u008d \ u00e0 \ u00a4 \ u00b0 \ u00e0 \ u00a4 \ u00b6 \ u00e0 \ u00a4 \ u00be \ u00e0 \ u00a4 \ u00b8 \ u00e0 \ u00a4 \ u00bf \ u00e0 \ u00a4 \ u00a4 \ u00e0 \ u00a4 \ u00aa \ u00e0 \ u00a5 \ u008d \ u00e0 \ u00a4 \ u00b0 \ u00e0 \ u00a4 \ u00a6 \ u00e0 \ u00a5 \ u0087 \ u00e0 \ u00a4 \ u00b6
но он должен выглядеть следующим образом
1 00: 00: 27,400 -> 00: 00: 32,760 1.2 अरब लोग 28 राज्य और सात केंद्र शासित
Я пробовал много вещей, но никто не выполнил мою работу.
[MSDN: Как: Преобразование между шестнадцатеричных строк и числовых типов] (https://msdn.microsoft.com/en-us/library/bb311038.aspx), Вы должны показать, что вы пробовали. – Sayse
Unicode Является правильной кодировкой для строк. просто говоря ... –
@PradnyaBolli: Ссылка на google считается «не конструктивной». –