PHP来清理粘贴的Microsoft输入
作者:互联网
我有一个网站,用户可以使用TinyMCE的自定义实现发布内容(如论坛,评论等).很多人都喜欢复制和放弃从Word粘贴,这意味着他们的输入通常伴随着大量相关的MS内联格式.
我不能只是摆脱< span whatever>因为TinyMCE依赖于span标签的某些格式,我不能(也不想)强迫所述用户使用TinyMCE的“从Word粘贴”功能(这似乎不太好用) .
有人知道图书馆/班级/功能会为我照顾这个吗?它必定是一个常见的问题,尽管我找不到任何确定的东西.我最近一直在想,一系列寻找特定于MS的模式的暴力正则表达式可能会成功,但我不想重新编写可能已经可用的东西,除非我必须这样做.
此外,固定卷曲引号,em-dashes等也会很好.我现在有自己的东西,但我真的只想找到一个MS转换过滤器来统治它们.
解决方法:
HTML Purifier将创建符合标准的标记并过滤掉许多可能的攻击(例如XSS).
对于不需要XSS过滤的更快清理,我使用PECL扩展Tidy,它是Tidy HTML实用程序的绑定.
如果那些没有帮助你,我建议你切换到具有此功能built-in的FCKEditor.
标签:php,tinymce,user-input,ms-word 来源: https://codeday.me/bug/20190919/1812374.html