编程语言
首页 > 编程语言> > java-Apache通用CSV格式程序:IOException:封装的令牌和定界符之间的无效字符

java-Apache通用CSV格式程序:IOException:封装的令牌和定界符之间的无效字符

作者:互联网

我正在尝试使用JakartaCommons-csv解析CSV文件

样本输入文件

Field1,Field2,Field3,Field4,Field5
"Ryan, R"u"bianes","  dummy@gmail.com","29445","626","South delhi, Rohini 122001"

格式化程序:CSVFormat.newFormat(‘,’).withIgnoreEmptyLines().withQuote(‘“’)
CSV_DELIMITER为,

输出量

> CSV解析后的Field1值应为:Ryan,R“ u” bianes
> CSV解析后的Field5值应为:South delhi,Rohini 122001

异常:由以下原因引起:java.io.IOException:(第2行)封装的令牌和定界符之间的无效char

解决方法:

问题是您的文件未遵循CSV文件中引用的可接受标准.表示带引号的字符串中的引号的正确方法是重复引号.例如.

Field1,Field2,Field3,Field4,Field5
"Ryan, R""u""bianes","  dummy@gmail.com","29445","626","South delhi, Rohini 122001"

如果将自己限制为CSV引用的标准形式,则Apache Commons CSV解析器应该可以工作.

不幸的是,为您的变体格式编写一致的解析器是不可行的,因为如果需要表示包含“ Ryan R”,“ baines”的字段,则无法消除嵌入式逗号和字段分隔符的歧义.

CSV文件中的引用规则在包括RFC 4180在内的许多地方都有列出.

标签:opencsv,csv,apache-commons,java,apache-commons-csv
来源: https://codeday.me/bug/20191109/2010923.html