Я читаю текстовый файл в моей программе, который содержит некоторые символы спецификации Юникода \ufeff
/65279
в местах. Это приводит к ряду вопросов при дальнейшем анализе.Правильный способ работы с спецификацией Unicode в текстовом файле
Прямо сейчас я сам определяю и фильтрую эти символы, но хотел бы знать, есть ли в стандартной библиотеке Java или в Guava способ сделать это более чисто.
В _places_? Спецификация должна быть первым байтом файла; в противном случае это не спецификация. –
Предполагая, что спецификация находится в начале файла, тогда [это] (http://code.google.com/p/guava-libraries/issues/detail?id=345&colspec=ID%20Type%20Status%20Milestone%20Summary) отчет об ошибке на веб-сайте Guava объясняет, что Guava не обрабатывает спецификацию и [это] (http://stackoverflow.com/questions/9736999/how-to-remove-bom-from-an-xml-file-in- java) дает представление о том, как пропустить его в простой Java. –
@ bmorris591, да, в начале. Благодарю. Если вы опубликуете свой второй комментарий в качестве ответа, я отмечу его принятым. – missingfaktor