У меня есть следующий код:Чтение слов из строки Unicode вместо Char
for line in contentText:
print type(line), #-> o/p is unicode
word = line.strip().split()
print word, #-> o/p is <type 'list'>
print type(word),
когда я line.strip().split()
, становится отображается каждый символ.
Например, если моя строка «Чтение слов из строки Unicode вместо Char», то о/р: Р е д
ш о г д
a . . так далее
Я хочу прочитать его как «Read», «слово», от как слова, а не полукокса для дальнейшей обработки ..
Как я могу добиться этого?
Также как можно удалить пробелы для дальнейшей обработки?
это 'для г in line.strip(). split(): print i' работает для меня. –