2015-08-20 4 views
-1

мне нужно разобрать HTML-файл и преобразовать символ 'A' взаменить специальные символы HTML

'à'

входного файла Мое:

<html> 
<head></head> 
<body> 
    à 
</body> 
</html> 

Мой Java-код:

String content = new String(Files.readAllBytes(path), StandardCharsets.UTF_8); 
System.out.println(content); 
content=content.replace("à","&agrave;"); 
System.out.println(content); 
Files.write(path, content.getBytes(StandardCharsets.UTF_8)); 

Этот код печатает:

<html> 
<head></head> 
<body> 
    à 
</body> 
</html> 
<html> 
<head></head> 
<body> 
    &agrave; 
</body> 
</html> 

Я перезаписываю входной файл, но он остается тем же самым началом. Как я могу решить эту проблему?

Благодаря

+0

Я маркировки, как "неясно", потому что он неоднозначен, что вы означает «он остается тем же самым началом». Файл, действительно, изменен заменой, которую вы имеете (конечно, вы должны использовать 'replaceAll()' вместо 'replace()'). Таким образом, входной файл не «остается прежним». – apnorton

ответ

0

Поместите это в голову раздел:

<meta http-equiv="Content-Type" content="text/html; charset=utf-8"> 

для использования html5 это:

<meta charset="utf-8"> 
Смежные вопросы