其他分享
首页 > 其他分享> > [机器学习][熵]有关熵的记录

[机器学习][熵]有关熵的记录

作者:互联网

熵的本质是一个系统“内在的混乱程度”,是物理学的概念。

在信息论中,信息熵可以有以下两种理解方式

事件与概率

先来举个例子,理解事件与概率之间的关系

猜小球事件

现在,拿出一个小球,事件\(P\{拿出一个小球\}=1\),该事件中,有四个子事件分别为

可以理解为“拿出小球”事件是一开始的规定,是一定发生的,所以概率为1,而“拿出某一个小球”事件的概率为\(\frac{1}{4}\),我们可以近似得将概率理解为事件的权重,在此例中也就是\(\frac{1}{4}\)。

现在,我们还是拿出一个小球,现在只关注与这个拿出的小球是不是A小球,事件\(P\{拿出一个小球\}=1\),该事件中,有两个子事件分别为

直观上讲,这两个事件的不确定性是不同的,因为,第一个事件,有4个等概率的子事件,但是第二个事件,只有两个子事件。
:其实,事件的不确定性不仅和事件中的子事件个数有关,还和每个事件的概率有关,掷出一个质地均匀的硬币和掷出一个容易出现正面的硬币,这两个事件的不确定性也是不同的,直观上讲,后者的不确定性要低一些,因为硬币更容易出现正面。

事件的不确定性——信息熵

信息熵这个概念就是用来衡量事件不确定性的物理量,那,我们怎么衡量不确定性呢,毕竟“不确定性”都不确定了,还怎么衡量呢。
再来设想一个场景——寻找石子。

可能的解:1.你会认为这个石子和别的石子有质地上的区别,然后找一个天平,不停的分堆然后去度量
2.遍历这个石头堆,去查每一个石子是不是符合目标的要求

对于上面两种解题方式
第一种方法假设了“石子质地是不同的”,这就是一个削减事件不确定性的方式,题设没说,你以为就是你以为了,通过这种削减不确定性的方式,你的度量次数降低到了指数的级别。
第二种方法没有做任何先行的假设,直接进行比对,查找,这相当于要查找N次,没有任何削减不确定性的方式

设想一下以下几种情况

事物的不确定性,不是指做了什么(用那一堆去找考官),而是指能做什么({对,错},分两堆;{N个里哪个是对的},分N堆)

找石子的过程,就是信息从不确定到确定的过程,事物的不确定性的大小,就是能做的事的次数。

信息熵的定义

未完待续

标签:不确定性,概率,机器,记录,石子,小球,学习,事件,frac
来源: https://www.cnblogs.com/riaris/p/15442911.html