java-Apache通用CSV格式程序:IOException:封装的令牌和定界符之间的无效字符
作者:互联网
我正在尝试使用JakartaCommons-csv解析CSV文件
样本输入文件
Field1,Field2,Field3,Field4,Field5
"Ryan, R"u"bianes"," dummy@gmail.com","29445","626","South delhi, Rohini 122001"
格式化程序:CSVFormat.newFormat(‘,’).withIgnoreEmptyLines().withQuote(‘“’)
CSV_DELIMITER为,
输出量
> CSV解析后的Field1值应为:Ryan,R“ u” bianes
> CSV解析后的Field5值应为:South delhi,Rohini 122001
异常:由以下原因引起:java.io.IOException:(第2行)封装的令牌和定界符之间的无效char
解决方法:
问题是您的文件未遵循CSV文件中引用的可接受标准.表示带引号的字符串中的引号的正确方法是重复引号.例如.
Field1,Field2,Field3,Field4,Field5
"Ryan, R""u""bianes"," dummy@gmail.com","29445","626","South delhi, Rohini 122001"
如果将自己限制为CSV引用的标准形式,则Apache Commons CSV解析器应该可以工作.
不幸的是,为您的变体格式编写一致的解析器是不可行的,因为如果需要表示包含“ Ryan R”,“ baines”的字段,则无法消除嵌入式逗号和字段分隔符的歧义.
CSV文件中的引用规则在包括RFC 4180在内的许多地方都有列出.
标签:opencsv,csv,apache-commons,java,apache-commons-csv 来源: https://codeday.me/bug/20191109/2010923.html