编程语言
首页 > 编程语言> > 在PHP中操作泰语字符

在PHP中操作泰语字符

作者:互联网

我正在努力让泰语字符和PHP一起工作.这是我想做的:

<?php
   mb_internal_encoding('UTF-8');
   $string = "ทาง";
   echo $string[0];
?>

但是我没有给我$string(ท)的第一个字符,而是得到了一些混乱的输出.但是,显示$string本身可以正常工作.

文件本身当然也是UTF-8.标头中的内容类型也设置为UTF-8.我根据this site更改了php.ini中的必要行.

utf8_encoding()和utf8_decoding()也无济于事.也许你们有个主意吗?

解决方法:

在PHP中,当您使用$string [0]访问字符串时,它不返回第一个字符,而是第一个字节.

您应该改用mb_substr.例如:

mb_substr($string, 0, 1, 'UTF-8');

注意:由于您使用的是mb_internal_encoding(‘UTF-8’);您也可以忽略最后一个参数.

发生这种情况是因为PHP无法识别字符串所使用的编码(即:编码未存储在字符串对象中).因此,默认情况下会将其视为ANSI / ASCII.如果您不希望这样做,则必须使用Multibyte String Function(mb_ *).

当您设置mb_internal_encoding(‘UTF-8’);您告诉它对所有的多字节字符串函数都使用UTF-8,但不要对其他任何东西使用.

标签:encoding,multibyte,thai,php,southeast-asian-languages
来源: https://codeday.me/bug/20191030/1965326.html