ABAP 里文件操作涉及到中文字符集的问题和解决方案试读版
作者:互联网
我们在实际项目特别是一些系统集成项目中,经常遇到需要接收远端发送过来的二进制流,并进行解析的场景。这个二进制流的内容,可能是一些二进制文件,比如 PDF,JPG 等格式的文件,也可能是文本文件。对于文本文件来说,我们需要将二进制流,重新还原成用户可读的文本。这就是本文要着重讨论的话题。
在开始本步骤的学习之前,请大家务必先完成前置章节的学习:
这个前置章节,将文本文件,以二进制的方式上传到 ABAP 服务器上,来模拟一个来自远端的内容提供者(Content Provider) 提供的二进制流,类型为 xstring
. 这些二进制流的实际内容,是一些包含中文字符的文本,本文我们的任务就是,把这些二进制流,重新转换回用户可读的文本,然后打印出来。
我们新建一个文本文件,输入一个汉字 汪
,文件名另存为 汪-utf8.txt
, encoding 选择 UTF-8.
这个文件的大小显示为 3 个字节。这是符合我们期望的行为,因为 UTF-8 是 Unicode 的一种实现方式,而一个汉字的 Unicode 值的范围是 0X4E00 到 0x9FA5,如果采取 UTF-8 编码,需要 3 个字节。
下面我们将会在 ABAP 代码里,针对包含了这个中文字符的文本文件,进行各种操作。
详细介绍请看这篇文章。
总结
在使用 ABAP 进行包含到中文字符的文件操作时,首先一定要明确当前中文字符,是根据哪一个字符集进行编码,然后从 ABAP 数据库表 TCP00 里找到该字符集在 ABAP 系统中的编号,确保包含中文内容的二进制流,同传入的 ABAP Encoding 值相匹配,这样就一定能得到正确的处理结果。
标签:文件,中文,UTF,试读,二进制,字符集,ABAP,文本文件 来源: https://www.cnblogs.com/sap-jerry/p/16581406.html