Ниже мой код:Как изменить кодировку из обычного текста в Юникод, чтобы я мог читать специальные символы из HTML?
<?php
// example of how to use basic selector to retrieve HTML contents
include('/Library/WebServer/Documents/simple_html_dom.php'); //this is the api for the simplehtmldom
// get DOM from URL or file
$html = file_get_html('http:/www.google.hk');
// extract text from table
echo $html->find('td[align="top"]', 1)->innertext.'<br><hr>';
// extract text from HTML
echo $html->innertext;
?>
Я использую simplephphtmldon
API. Когда я выполняю мою программу php на моем локальном сервере, вместо этого я получаю так много нераспознанных символов из-за того, что простой текст не может действительно кодировать их, чтобы они отображались так, как они предполагали. Может кто-нибудь сказать мне, что мне нужно изменить на inner text
, чтобы показать все персонажи? PS Я также попробовал plaintext
без везения. textContent
кажется сломанным для меня. Возможно, мне нужно сначала попробовать другой элемент (?). Благодаря
Пожалуйста, разместите образец ввода, неправильный выход и нужный выход. –
попробуйте сейчас. я изменил, и вместо файла он открывает веб-страницу в Интернете. – Korpel
** include ('http://google.hk'); ** что вы пытаетесь достичь с этим? –