Я использую этот код C# для чтения из keywords.txt. где я сохранил некоторые ключевые слова и фразы на 4-5 языках (греческих, шведский, турецкий и т.д.)Чтение ключевых слов из файла и поиск их без результатов
StreamReader sr = new StreamReader("keywords.txt", System.Text.Encoding.Unicode);
ArrayList keywords = new ArrayList();
while (!sr.EndOfStream)
{
keywords.Add(sr.ReadLine());
}
sr.Close();
Затем я использую этот один
string comment = getText(rev, "comment="", """, out rev);
if (comment.Contains(keywords[i].ToString()))
{
blah blah blah
}
Она может читать английские слова, но не греческие, турецкие со специальными символами и т. д. Я использовал кодировку по умолчанию UTF8 без результата. Я изменил кодировку streamread в unicode без результата. У вас есть идеи? спасибо: D
UPDATE: Я обнаружил, что проблема, когда GetText получает комментарий, а не когда я сравнить ключевые слова с комментарием .. Я сохранил комментарии к файлу
string comment = getText(rev, "comment="", """, out rev);
using (System.IO.StreamWriter file = new System.IO.StreamWriter("WriteText.txt", true))
{
file.WriteLine(comment);
}
и я получил этот вид символов вместо греческих букв
ΑναίΟεση Ξκδοσης 4232870 Ξ±Ο€Ο Ο„ΞΏΞ½
с небольшим исследованием и тестированием я обнаружил, что это тот же самый греческий контент с кодировкой установлены в ОС Windows 1253 .. есть ли способ контролировать кодировку по GetText использует?
Какая часть не работает? –
Входит в игру! [Турецкая проблема] (http://thinkingcsharp.blogspot.com/2009/01/turkish-i-problem-why-my-application.html) – Jonesopolis
Несмотря на то, что ключевые слова, которые я ищу, существуют, программа не как представляется, в состоянии понять это ... Это не только с турецкими словами, но и с греческими, frence, чехи, hugarian и т. д. Если есть специальный символ (αβω, t, á, í, ř, ğ, ş), который не существует на английском языке, тогда у нас есть проблема ... –