其他分享
首页 > 其他分享> > 【李宏毅2020 ML/DL】P43-44 More about Adversarial Attack | Images & Audio

【李宏毅2020 ML/DL】P43-44 More about Adversarial Attack | Images & Audio

作者:互联网

我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的、自己不知道的东西。

已经有人记了笔记(很用心,强烈推荐):https://github.com/Sakura-gh/ML-notes

本节内容综述
  1. 本节课由助教黄冠博讲解。将分为影像与语音两部分讲解。
  2. One Pixel Attack,仅仅改变一个像素,就进行了***。着重讲了 Differential Evolution 。
  3. 接下来是 Adversarial Attack Outline 部分。
  4. 第一小节是 Attacks on ASR。Automatic Speech Recognition,自动语音识别技术。
  5. 第二小节是 Attacks on ASV。Automatic Speaker Verification,自动演讲人识别技术。
  6. 稍微提及了 Wake Up Words 。
  7. 第三节是重点,Hidden Voice Attack。比如,制作一段噪音,人类听不出,但是可能是某个机器指令,如Hey, Siri。

 

文章目录

 

小细节

One Pixel Attack


如上,为两种***所产生的噪音。两者优化目标一样。

如上,都是One Pixel Attack的例子。


如上,与上节所讲的内容相同,分为 untargeted attack 与 target attack 。One Pixel Attack的特点是,只能有一个 x x x 与之前不同。

如果遍历每一个像素,则耗时太长。因此,我们使用 Differential Evolution 。或者说,我们无需找到最好的像素。

Differential Evolution

During each iteration another set of candidate solutions(children)is generated according to the current population (parents). Then the children are compared with their corresponding parents, surviving if they are more fitted(possess higher fitness value) than their parents. In such a way, only comparing the parent and his child, the goal of keeping diversity and improving fitness values can be simultaneously achieved.

有些类似保留精英的遗传算法,其优势在于:

整体来说就是:

后两步不断重复。

DE 并非将一个图片的一个数值当成一个“个体”,而是将一个像素的全部信息作为***目标: ( x , y , R , G , B ) (x, y, R, G, B) (x,y,R,G,B)。

由此可推测,图片越大,则***成功率越低。

Attacks on ASR

可参考:https://nicholas.carlini.com/code/audio_adversarial_examples

如上,与图片***类似,加上一段杂音,让神经网络错误判断。

Attacks on ASV


如上,语音识别的分类问题同理,也可通过加噪音***。

Wake Up Words

Hidden Voice Attack


如上,助教播放了一段杂音,实际上代表的是"turn on the computer"。

Psychoacoustics

心理声学,研究人对于声音的感知程度跟反应。

Signal Preprocessing


对于声音信号的处理,我们进行了:

Perturbation


如图,将介绍四种方式,进行***。

Time Domain Inversion (TDI)

意义是什么呢?

Random Phase Generation


如图,调整 a a a 与 b b b ,但是仍保证 a 2 + b 2 \sqrt{a^2 + b^2} a2+b2 ​ 不变。

High Frequency Addition(HFA)

Time Scaling (TS)

什么是 sample rate ?波由好多点组成,simple rate 就是每秒有几个 data point 。

 

标签:DL,Attacks,李宏毅,44,Evolution,Attack,Time,audio,Pixel
来源: https://blog.51cto.com/u_15279775/2938535