其他分享
首页 > 其他分享> > [文献阅读]——Exploring Human Gender Stereotypes with Word Association Test

[文献阅读]——Exploring Human Gender Stereotypes with Word Association Test

作者:互联网

preliminary

#bootstrap sampling
#GCN(Random walk)

对于对称拉普拉斯中使用的度矩阵D的逆平方根,我的理解:
首先,直接用D的逆去乘邻接矩阵,肯定是可以的,就是做了行归一化。而原文中使用的D的逆平方根的话…实际算下来,可能是要让对称位置的值尽可能相似吧(至少分母上是完全一致的)。而作者给出的解释是:

dynamics get more interesting when we use a symmetric normalization

(动力学上更有趣???)

#概率统计(皮尔逊系数、显著性检验、置信区间)

#KNN
度量:
L0范数:向量中非0的元素的个数
L1范数:向量中各个元素绝对值之和(曼哈顿距离)
L2范数:欧式距离

#word2vec

#glove

#random walk

前言

低维的word embedding被用作“性别刻板印象(gender stereotypes)”的研究,比如:比起"she",“engineer"更加接近于"he”。该方法有两大问题:

本文的贡献:

word association

数据集

使用了SWOWEN数据集:首先创建一个cue池,对于每一个参加者,随机抽取cue池中的单词w1,参加者展开联想得w2,得到cue-response pair:w1-w2。如果w2不在cue池,则加入cue池。

经过预处理之后,得到12217cues,3665100responses(1个cue对应多个responses,多个responses还有可能是相同的单词),83863participants。

图的初始化

邻接矩阵:12217个nodes,1283047条边,边的权重=cue-response pair出现的次数。得到邻接矩阵 S ∈ R ∣ V ∣ × ∣ V ∣ S∈R^{|V|×|V|} S∈R∣V∣×∣V∣。对邻接矩阵做拉普拉斯对称归一化:
T = D − 1 / 2 S D − 1 / 2 T=D^{-1/2}SD^{-1/2} T=D−1/2SD−1/2
D = d i a g i ( ∑ j = 1 N S i j ) D=diag_i(\sum_{j=1}^{N}S_{ij}) D=diagi​(j=1∑N​Sij​)

特征矩阵:特征矩阵 P ∈ R ∣ V ∣ × 2 P∈R^{|V|×2} P∈R∣V∣×2, P ( i , ) = ( b m i , b f i ) P_{(i,)}=(b_{m_{i}}, b_{f_{i}}) P(i,)​=(bmi​​,bfi​​),表示第i个单词分别带有的男性(masculine)和女性(feminine)的信息量。两两选择一些男性特征词-女性特征词的pair(如boy-girl),对男性特征词对应的向量置为(1,0),女性特征词对应所对应的向量置为(0,1),其它单词初始化为(0,0)。

图的迭代(stereotypes propagation)

P t + 1 = α T P t + ( 1 − α ) P 0 P_{t+1}=αTP_t+(1-α)P_0 Pt+1​=αTPt​+(1−α)P0​

其中,α控制了初始信息和新信息的比例,没有迭代,直接根据 P t + 1 = P t P_{t+1}=P_t Pt+1​=Pt​近似求解:
P ∗ = ( 1 − α ) ( I − α T ) − 1 P 0 P^*=(1-α)(I-αT)^{-1}P_0 P∗=(1−α)(I−αT)−1P0​

计算gender bias score(法1)

在这里插入图片描述
b就等于bm-bf?

下文还引用了两种不同的计算score的方法:
在这里插入图片描述
这两种方法(法2、法3)不仅仅是计算score的方式不同,它们采用的word embedding不是简单的(1,0)或(0,0),而是用了word2vec。

各种实验分析

与真实数据的比较

几种指标:

使用了法2、法3、法1,进行了两个实验:

得到的结论:

男女性特征词选择的影响

一个指标:

也计算了法1和census data 和 human judgements的皮尔逊系数的置信区间。

得到的结论:

stereotypes propagation变种的影响

变种一:采用random walk的变种
变种二:采用不同的α值

得到的结论:

不同的图初始化策略的影响

假设本文“图的初始化”部分中为策略1,策略2、3如下:

使用word2vec的词向量,使用词的相似度作为图中边的度量:

得到的结论:

进一步探索为什么:
首先介绍了一种图,叫做small world graph,主要有三个性质:

而分析策略1、策略2和策略3,得到的结论:

策略1、2、3的图中体现出的不同特性的连边

主要有四种特性的连边:

结论:

使用提出的方法作为benchmark,分析一些“de-bias”的方法的效果

主要的分析思路:首先引入两个de-bias的方法,分别是Hard-Debias(后处理)和Gn-Glove(训练),这两种方法应该都用了预训练的词向量,只知道后者用的是Glove。
由于是使用了pretrained word embedding,所以采用了"计算gender bias score(法1)"中的法2、法3,来计算的bias score。分别计算两个de-bias的方法使用前后,得到的bias score,和本文提出的方法得到的bias score的皮尔逊系数。
如果:

得到的结论:

标签:Exploring,结点,Word,score,Gender,单词,cue,bias,策略
来源: https://blog.csdn.net/jokerxsy/article/details/118659300