PHP读取Word文档仅获取电子邮件地址
作者:互联网
好的,这就是我想要的PHP脚本打开并读取用户上载的Word文档,并获取将在文档中存储的电子邮件地址并将其存储到数据库中的东西.
只有电子邮件地址!它会像
电子邮件:某人@ example.com或类似“电子邮件为某人@ example.com”
任何格式..可以肯定的是,将有空格分隔电子邮件ID和其他单词.有人能帮我吗 ? :D
解决方法:
这确实有点宽泛.从根本上讲,您需要执行以下步骤:
上载Word文件
您需要让用户上传文件.有一个tutorial at w3schools应该可以帮助您入门
解析内容
Office文件非常复杂-从技术上讲,每个文件都是一个完整的文件系统,您可以嵌入图像,其他文档等…新的.docx实际上只是具有某些XML的zip文件-尝试将其中一个重命名为.zip并打开它.旧式的.doc是专有的MS格式,而同样复杂的文件则更加模糊. This library似乎可以将Word文件转换为html,这可能会使阅读它们容易得多.
查找电子邮件地址
我怀疑您最好的机会是使用正则表达式从正文中提取电子邮件地址.如果有多个电子邮件地址怎么办?这是introduction to email regexes,可能会有帮助. This answer是同一件事
要获得更详细的答案,您将不得不提供一个更具体的问题.
标签:docx,doc-2,php,ms-word 来源: https://codeday.me/bug/20191201/2077692.html