编程语言
首页 > 编程语言> > java – 连字预处理

java – 连字预处理

作者:互联网

我需要一些用于PHP和/或java(当前是Spring Hibernate)的工具的引导来用于连接内容.我在包含的文件中有一些文本内容,有些在数据库中.所有文本都是utf-8编码,我需要软连字符,因为在大多数浏览器中都支持它.

所以这个存储原件:

<p> These words need hyphenation</p>

会发现这样的事情

<p> The&shy;se wor&shy;ds need hyp&shy;he&shy;na&shy;tion</p>

在最终加载的网页的源中.

任何想法如何实现这一目标?

对于没有使用任何服务器端代码且只有纯HTML源文件的情况,也欢迎在HTML标记中包含连字符的文本编辑工具的建议.

此外,我还没有找到连字词列表的好来源.

解决方法:

CSS3定义了client-side hyphenation.

这意味着在支持浏览器¹时,您只需要指定文本的语言和自动连字的愿望,它将自动连字,无需您做任何工作.显然,这意味着连字点由浏览器的语言资源控制.

对于手动控制,您可以在要使用的每个连字点处放置自由连字符,并指示浏览器仅使用这些连字符.

在实践中,为了找到连字点并插入自由连字符,最好的方法可能是使用古老的TeX-style hyphenation method,其中指定分层连字符或无连字点的子字模式与单词连字符相匹配.这些模式现在被广泛使用(包括OpenOffice,LibreOffice和Adobe InDesign),并且可用于大多数语言.

实现该算法只需几行代码.更重要的是,有许多语言的现成实现:像phpHyphenator这样的PHP实现,像TeXHyphenator-JHyphenation这样的Java实现,以及像jhyphen这样的libhyphen的C实现的Java绑定.

¹目前,Firefox,Safari和IE都支持自动连接,而Chrome和Opera则没有.

标签:preprocessor,java,php,hyphenation
来源: https://codeday.me/bug/20190826/1725390.html