java – 连字预处理
作者:互联网
我需要一些用于PHP和/或java(当前是Spring Hibernate)的工具的引导来用于连接内容.我在包含的文件中有一些文本内容,有些在数据库中.所有文本都是utf-8编码,我需要软连字符,因为在大多数浏览器中都支持它.
所以这个存储原件:
<p> These words need hyphenation</p>
会发现这样的事情
<p> The­se wor­ds need hyp­he­na­tion</p>
在最终加载的网页的源中.
任何想法如何实现这一目标?
对于没有使用任何服务器端代码且只有纯HTML源文件的情况,也欢迎在HTML标记中包含连字符的文本编辑工具的建议.
此外,我还没有找到连字词列表的好来源.
解决方法:
CSS3定义了client-side hyphenation.
这意味着在支持浏览器¹时,您只需要指定文本的语言和自动连字的愿望,它将自动连字,无需您做任何工作.显然,这意味着连字点由浏览器的语言资源控制.
对于手动控制,您可以在要使用的每个连字点处放置自由连字符,并指示浏览器仅使用这些连字符.
在实践中,为了找到连字点并插入自由连字符,最好的方法可能是使用古老的TeX-style hyphenation method,其中指定分层连字符或无连字点的子字模式与单词连字符相匹配.这些模式现在被广泛使用(包括OpenOffice,LibreOffice和Adobe InDesign),并且可用于大多数语言.
实现该算法只需几行代码.更重要的是,有许多语言的现成实现:像phpHyphenator这样的PHP实现,像TeXHyphenator-J或Hyphenation这样的Java实现,以及像jhyphen这样的libhyphen的C实现的Java绑定.
¹目前,Firefox,Safari和IE都支持自动连接,而Chrome和Opera则没有.
标签:preprocessor,java,php,hyphenation 来源: https://codeday.me/bug/20190826/1725390.html