编程语言
首页 > 编程语言> > 第一次算法作业

第一次算法作业

作者:互联网

一、编码规范

  华为公司编码规范:https://blog.csdn.net/sdfgh2046/article/details/12424287。

二、数学之美观后感

  观看了一些数学之美的篇章,发现吴军博士对于编码和数学这一块有着详细的见解,他将我们常见的一些数学模型,基本算法,可以很好的解释出来,并对生活中的例子也可以很好的用算法之类的来解决,我主要观看了吴军博士对于“不要把所有的鸡蛋放在 一个篮子里-最大熵模型 ”以及“ 闪光的不一定是金子 -- 谈谈搜索引擎作弊问题(Search Engine Anti-SPAM)”两篇文章。

  最原始的最大熵模型的训练方法是一种称为通用迭代算法 GIS(generalized iterative scaling) 的迭代 算法。GIS 的原理并不复杂,大致可以概括为以下几个步骤: 1. 假定第零次迭代的初始模型为等概率的均匀分布。 2. 用第 N 次迭代的模型来估算每种信息特征在训练数据中的分布,如果超过了实际的,就把相应的模型参数变小;否则,将它们便大。 3. 重复步骤 2 直到收敛。吴军博士将最大熵模型简化算法推导出来,并对此有深入了解,当年最早改进的达拉皮垂兄弟通过用于最大熵模型和其他一些先进的数学工具对股票预测,获得了巨大的成功。由此可见信息处理在很多方面都很有用。

  闪光的不一定是金子这篇文章讲的时搜索引擎作弊的问题,吴军博士通过自己的理解给我们讲述搜索引擎最常见的作弊方法就是重复关键词,而搜索出来的信息越前面不一定质量越高,很多可能时作弊上去的,抓作弊的方法很像信号处理中的去噪音的办法。我们如果在发动机很吵的汽车里用手机打电话,对方可能听不清;但是如果我们知道了汽车发动机的频率,我们可以加上一个和发动机噪音相反的信号,很容易地消除发动机的噪音,这样,收话人可以完全听不到汽车的噪音。而抓作弊的方法就像消除噪音的方法一样,作弊者所做的事就是像在手机中加入杂音一样,所以消除方法也是对应来消除,一些靠作弊上去的网站,可能不是不会被抓,只是抓取需要时间,终究还是会被抓出来的。

  数学之美这本书可能最大的厉害之处就是将很多我们熟知的东西解释为生活中的例子来让我们理解数学算法一些厉害美丽的地方,有时间的时候多看看可以多增长一些自我的知识。

标签:吴军,迭代,作业,第一次,噪音,算法,数学,作弊
来源: https://www.cnblogs.com/ydh52/p/11440439.html