java – Tweet值预测:什么样的分析(贝叶斯?)可以预测Twitter用户对推文的重视程度?
作者:互联网
我正在考虑向TalkingPuffin Twitter客户端添加一项功能,在与用户进行一些培训后,它可以根据预测值对传入的推文进行排名. Java虚拟机(Scala或Java首选)有哪些解决方案来执行此类操作?
解决方法:
做好这件事并不容易.谷歌希望能够做到这样的事情(“用户会有什么样的联系价值”),Netflix(“他们会重视什么电影”)和其他许多人.事实上,你可能会阅读有关winning entry for the Netflix Prize的说明.
然后你需要提取一堆功能,正如@hmason所说.然后你需要一个合适的机器学习算法;你需要一个函数近似器(你试图使用你的功能来预测0和1之间的值,其中1是“最好的推文”,0是“omg who cares”)或分类器(你使用的地方)你的功能,试图预测它是一个“好”或“坏”的推文).
如果你选择后者 – 这使得用户培训变得容易,因为他们只需要用“喜欢”(混合社交网络隐喻)来获得推文 – 那么你通常最好使用支持向量机,其中存在一个fairly comprehensive Java library.
在前一种情况下,有许多技术可能值得尝试;如果您决定使用LIBSVM库,它们也有回归变量(即参数估计).
标签:java,scala,twitter,bayesian 来源: https://codeday.me/bug/20190716/1483334.html