在PHP中操作泰语字符
作者:互联网
我正在努力让泰语字符和PHP一起工作.这是我想做的:
<?php
mb_internal_encoding('UTF-8');
$string = "ทาง";
echo $string[0];
?>
但是我没有给我$string(ท)的第一个字符,而是得到了一些混乱的输出.但是,显示$string本身可以正常工作.
文件本身当然也是UTF-8.标头中的内容类型也设置为UTF-8.我根据this site更改了php.ini中的必要行.
utf8_encoding()和utf8_decoding()也无济于事.也许你们有个主意吗?
解决方法:
在PHP中,当您使用$string [0]访问字符串时,它不返回第一个字符,而是第一个字节.
您应该改用mb_substr.例如:
mb_substr($string, 0, 1, 'UTF-8');
注意:由于您使用的是mb_internal_encoding(‘UTF-8’);您也可以忽略最后一个参数.
发生这种情况是因为PHP无法识别字符串所使用的编码(即:编码未存储在字符串对象中).因此,默认情况下会将其视为ANSI / ASCII.如果您不希望这样做,则必须使用Multibyte String Function(mb_ *).
当您设置mb_internal_encoding(‘UTF-8’);您告诉它对所有的多字节字符串函数都使用UTF-8,但不要对其他任何东西使用.
标签:encoding,multibyte,thai,php,southeast-asian-languages 来源: https://codeday.me/bug/20191030/1965326.html