编程语言
首页 > 编程语言> > php:每当我尝试编写UTF-8时都使用DomDocument,它会写入十六进制表示法

php:每当我尝试编写UTF-8时都使用DomDocument,它会写入十六进制表示法

作者:互联网

当我尝试使用DomDocument将UTF-8字符串写入XML文件时,它实际上写入字符串的十六进制表示法而不是字符串本身.

例如:

ירושלים

而不是:ירושלים

任何想法如何解决问题?

解决方法:

好的,你走了:

$dom = new DOMDocument('1.0', 'utf-8');
$dom->appendChild($dom->createElement('root'));
$dom->documentElement->appendChild(new DOMText('ירושלים'));
echo $dom->saveXml();

将正常工作,因为在这种情况下,您构造的文档将保留指定为第二个参数的编码:

<?xml version="1.0" encoding="utf-8"?>
<root>ירושלים</root>

但是,一旦将XML加载到未指定编码的Document中,您将丢失在构造函数中声明的任何内容,这意味着:

$dom = new DOMDocument('1.0', 'utf-8');
$dom->loadXml('<root/>'); // missing prolog
$dom->documentElement->appendChild(new DOMText('ירושלים'));
echo $dom->saveXml();

将不具有utf-8的编码:

<?xml version="1.0"?>
<root>&#x5D9;&#x5E8;&#x5D5;&#x5E9;&#x5DC;&#x5D9;&#x5DD;</root>

因此,如果你加载XML,确保它是

$dom = new DOMDocument();
$dom->loadXml('<?xml version="1.0" encoding="utf-8"?><root/>');
$dom->documentElement->appendChild(new DOMText('ירושלים'));
echo $dom->saveXml();

它将按预期工作.

作为替代方案,您还可以在加载文档后使用specify the encoding.

标签:hebrew,php,utf-8,domdocument
来源: https://codeday.me/bug/20190917/1810198.html