图灵指数——学术大数据下的跨领域跨年代学者影响力评估
作者:互联网
图灵指数——学术大数据下的跨领域跨年代学者影响力评估
姚宇航, 欧俊杰, 李洋, 傅洛伊, 王新兵, 陈贵海
上海交通大学电子信息与电气工程学院,上海 200240
摘要:随着学术界规模的扩大,面对领域和年代的巨大差异,现有的衡量学者影响力的量化指标很难消除偏差,从而进行准确衡量。通过观察1865—2016年、310个领域、14 223 183位学者、126 438 664篇论文和533 556 856次引用的数据集,得出不同领域、不同年代的新增引用量分布均遵循幂律分布,因此提出图灵指数,通过归一化消除指数膨胀的影响,衡量学者的绝对影响力。通过对诺贝尔奖、菲尔兹奖、图灵奖等获得者的图灵指数的比较发现,尽管他们在领域和年代上存在很大差异,但是在各自领域却有着相似的影响力。图灵指数为跨领域、跨年代学者影响力评估提供了全新的思路,也为国内外学者影响力评估和基金审理提供了参考。
关键词: 影响力评估 ; 图灵指数 ; 大数据挖掘 ; 学术网络
论文引用格式:
姚宇航, 欧俊杰, 李洋, 傅洛伊, 王新兵, 陈贵海. 图灵指数——学术大数据下的跨领域跨年代学者影响力评估. 大数据[J], 2019, 5(5):25-37
YAO Y H, OU J J, LI Y, FU L Y, WANG X B, CHEN G H.Turing index:cross-domain and cross-generation metric of unraveling scholars’impact in academic big data. Big Data Research[J], 2019, 5(5):25-37
1 引言
目前,越来越多的人投身于学术界,并在众多研究领域取得成就。如何量化众多学者的影响力已引起了全世界的关注,对学者影响力进行评估,对基金项目进行评审和学术奖项评选等都有很重要的意义,可以推动学术界进一步的发展。目前,最广泛使用的评价指标是引用量,即学者发表论文的总被引用次数。另一个广泛使用的指标是H指数,它根据研究者被引用最多的论文数目和被引用次数来衡量学者的产出和影响力。上述两种方法均未考虑领域和年代的影响,研究人员基于引用量和H指数提出了一些变体,用于衡量学者的个人水平。
随着时间的推移,出现了很多解决学术影响力量化问题的方法。由于领域本身的迅速发展和不同领域的不平衡发展,一些工作分别考虑了不同年代、不同领域对影响力量化的影响,并且基于引用量和H指数的归一化来平衡不同年代、不同领域学者的相对位置。在消除年代和领域的影响时,这些指标都没有合理考虑学术界规模迅速扩大造成的影响,导致评估结果并不理想。
2 学术界的指数膨胀
为了对不同领域、不同年代的学者进行影响力评估,笔者对学者和论文数据进行了统计和收集,数据来源于Acemap和微软学术。微软学术利用论文发表期刊、标题和正文等信息对论文所在领域进行层次划分,划分结果得到了学术界和工业界的广泛认可。本文利用Acemap整合微软学术从1865年到2016年的310个领域、14 223 183位学者、126 438 664篇论文和533 556 856次引用的数据集,进行学者影响力评估的探索。主要领域的学者、论文和引用量等统计结果见表1。
如图1所示,历年新增论文、引用量和学者数目均呈指数级增长,可以看出学术界在飞速发展。从图1可以看到两个明显的凹陷,分别在1917年和1941年左右。笔者认为这是由两次世界大战造成的,可见军事对科学研究 也会产生很大影响。
图1 历年新增论文、引用量和学者数目统计
本文对各个主要领域内部的发展情况进行了统计,如图2所示,不同领域由于发展情况不同,线条的斜率和截距不同,但均呈指数增长。其中c为引用量。图3显示了指数膨胀的学术网络,图3中红线表示每年活跃学者的数量,网络中的彩色节点表示不同领域的活跃学者,每个簇代表一个领域,可见领域的膨胀是非常迅速的。图4为从1950—2014年16个物理子领域的历年引用量增长情况,该领域内部的子领域发展也是不均衡的。
图2 主要领域历年引用量
图3 学术网络指数膨胀可视化
图4 物理子领域历年引用量增长
3 指数膨胀效应对学者影响力评估的影响
随着学术界的指数膨胀,发表更多的文章、获得更多的引用量变得更加容易,在这种情况下,以往的文献引用和H指数等指标无法很好地描述学者在以下3种指数膨胀效应下的影响。
一是时间的膨胀效应。学者在不同时期的相同引用量是不等价的。由于学者和论文数量不断增加,现在的学者论文更容易被引用。1980年被引用100次的学者可能比2018年被引用100次的学者具有更高的影响力。同样,H指数也没有充分考虑时间效应。因此,仅仅采用引用量或H指数可能会导致一种错误的判断,即年长的学术巨头和年轻的学者对学术界具有相同的影响力。
二是领域的膨胀效应。一个重要但通常被忽视的因素是研究领域发展水平不均衡带来的影响。虽然不同领域的引用量均呈指数增长,但其膨胀速度和状态不同,发展水平也不同。例如,生物学的年总被引次数大约是政治学的40倍。图3给出了活跃学者在不同领域的膨胀情况,领域的大小按照它们自己的节奏发展,即使在单个领域(如图4所示的物理学领域),其子领域的发展水平也是完全不同的。拥有相同引用量的不同领域的学者,他们在各自领域的影响力是不相等的。在蓬勃发展的热门领域和在小众领域得到相同的引用量是不等价的。
三是年代的膨胀效应。即使在同一时间、同一领域内拥有相同的引用量和H指数,但在学者们活跃年代不同的情况下,他们的影响力也可能存在差异。活跃年代是指学者在所属领域内被引频次数快速增长的时期。如图5所示,威廉·菲利普斯和迈克尔·弗莱施豪尔是量子光学领域的两位杰出物理学家。根据谷歌学术统计,截至2018年,威廉·菲利普斯共获得引用23 750次,H指数为66,而迈克尔·弗莱施豪尔的被引用次数和H指数分别为21 578次和60。虽然他们有相似的引用和H指数,但威廉·菲利普斯(活跃年代为20世纪90年代)比迈克尔·弗莱施豪尔(活跃年代为21世纪初)有更早的活跃年代。也就是说,在一个全新的、学者较少的领域获得相同的引用通常比在一个成熟的领域难得多,而且领域的开创者比追随者影响力更大。因此,目前威廉·菲利普斯对量子光学的影响大于迈克尔·弗莱施豪尔,而实际中,威廉·菲利普斯获得了诺贝尔物理学奖,也验证了本文的观察。
图5 两学者历年新增引用量比较
然而,上述观察中得出的结论主要是基于人的主观经验。那么是否有一个量化指标可以消除领域和年代的膨胀效应 ,为学者提供科 学客观的评价?作为一种大胆而又严谨的尝试,本文提出一种新的度量标准,即图灵指数(Turing index),以重新评估学者的影响。
4 图灵指数
为了消除不同领域、不同年代对学者影响力评价的影响,本文首先研究了各个领域每年学者的新增学者引用量分布,即学者的数量与特定年份内相应增加的引用分布情况。为了寻找合适的量化指标,本文从数据集中提取数据,并绘制历年学者新增引用量分布图。
图6为2015年物理领域的引文网络,图6中每个节点代表2015年在物理领域发表或引用论文的活跃学者,红色节点的度数较高,绿色节点的度数较低,从图6可以看出,极少数红色节点被绿色节点包围,由此笔者猜想引用量分布符合幂律分布,即红色节点获得大部分的引用次数,大多数的绿色节点被引用次数则少得多。为了验证这一猜想,基于对每年论文的新增引用量和这些论文的所属学者和领域,本文计算出1 228 960 765条四元组,每一条四元组都由学者、领域、年份和引用组成,表示每年每个学者在不同领域的新增引用。
图6 2015年物理领域学者引文网络
利用四元组,本文用对数图绘制学者的引用量分布情况,如图7所示,尽管不同领域的学者数量不同,但这些引用量分布都可以通过线性函数很好地拟合,说明它们都遵循幂律分布,其形式如式(1)所示。
其中,n表示每年被引用次数增加数值为c的学者数目,N为当年被引用的活跃学者总数,k为比例指数。
引用量分布的归一化是为了让不同幂律分布公式符合相同的参数。为此,本文假定目标归一化领域f0有N0个学者和标度系数k0,同时引用量为c0的学者有N0个,那么其引用分布为:
同样,本文假设未归一化领域fi(i≥1)的引用分布为:
为了使领域fi具有与领域f0相同的分布,本文需要在ni=n0时,使得新增引用量ci归一化为c0,其中,c0表示在领域fi中引用量为ci的学者p归一化后在领域f0中的绝对位置。
然后有:
因为N0和k0是常量,所以有:
图7 不同领域不同年代新增引用量分布情况
其中,图片 。针对归一化,本文将c0作为学者的影响力I,学者p在该领域的成就可表示为:
领域通胀水平为:
领域的k值越高,则在该领域越难得到同样的引用量c,因此,相同引用量产生的影响力越大。活跃学者人数N的增加导致领域通胀水平D的增加,从而刻画指数膨胀效应。α是一个常量,可以看作一个平衡项,以防止归一化度量的欠收敛和过收敛。
图8显示了在3种情况下,领域和年代的归一化过程:相同年代不同领域、不同年代相同领域、不同年代不同领域。归一化后,不同领域、不同年代的引用量分布基本一致。
基于式(5)和提出的指标A和D,学者p在领域f从s年到t年的总影响力的图灵指数Tp,f,t为:
图8 不同领域不同年代新增引用量分布归一化结果
利用式(8),可以在相同条件下评估跨领域和跨年代学者的影响。
5 跨领域、跨年代学者影响力对比
本文建立了一个基于数据集的系统来计算和存储不同领域和不同年代学者的图灵指数。一个学者可以属于多个领域,通过对每年增加的引用量进行归一化处理,本文得到了1 228 960 765条包含学者、领域、年份和图灵指数信息的四元组。为了更好地理解图灵指数如何消除通胀差异、评估不同领域不同年代的学者的影响力,本文分别基于引用量和图灵指数衡量诺贝尔奖、菲尔兹奖和图灵奖得主的影响力,并进行比较。截至2015年入选学者的获奖统计数据见表2。
本文对相同年代不同领域、不同年代相同领域和不同年代不同领域这3种情况进行对比。
(1)相同年代不同领域
相同年代意味着相关学者的研究生涯大致是在同一时期开始的,引用量的增长速度因领域而异。由于一个领域的学者数量可能是另一个领域的30倍,所以领域的发展水平可能会形成巨大的对比。从图9(a)和图9(b)可以看出,诺贝尔生理学奖得主Paul Nurse和菲尔兹奖得主Pierrelouis Lions之间引用量的显著差异并不意味着他们的影响力存在巨大差距,因为他们在不同的领域。对各自历年新增引用量进行归一化处理后,两位学者的图灵指数表明,他们对各自领域的影响是相当的,发展轨迹也几乎相同。同样现象也出现在图9(c)和图9(d)中,其中,诺贝尔生理学奖获得者Ralph M Steinma在免疫学这一庞大的领域中被引用的次数较多,而诺贝尔经济学奖获得者Jean Tirole在工业管理这一领域中被引用的次数较少。通过引用量分析,Steinma的影响力似乎比Tirole大得多,但图灵指数显示两者的影响力相同,甚至轨迹相同。另一个发现是,由于领域迅速发展导致的膨胀,学者们可能会遵循不同的发展模式,这些发展模式无法在传统的总引用量衡量中体现。例如,在图9(e)和图9(f)中,Bruce Beutler的图灵指数呈线性稳步增长,而Eric Betzig在开始发展时较平缓,1992年后出现了一个跳跃,这说明他可能在那一年取得了很 大的突破。这一观察可以被证实,在1992年, Eric Betzig发表了一篇关于显微镜的论文,而这是他获得诺贝尔奖的主要贡献。
图9 学者的引用量和图灵指数对比结果
(3)不同年代不同领域
同样地,当同时考虑领域和年代时,影响力的度量也遵循同样的规则,但是有更多的比较形式。如图9(m)和图9(n)所示,诺贝尔生理学奖得主Paul Nurse比诺贝尔物理学奖得主Shuji Nakamura有更早的活跃年代,被引用的次数也更多。虽然较早的年代和较高的引用量表明较高的影响,但是Paul Nurse的所属领域要比Nakamura的所属领域大,根据图灵指数,这两位学者有着相似的影响力。另一种相反的情况如图9(o)和图9(p)所示,Oliver E Williams有更早的活跃年代,并且所在领域比Susumu Tonegawa的领域小,Oliver E Williams的引用量仅为Susumu Tonegawa的三分之一左右,但图灵指数显示,前者的影响力在进入21世纪后增长更快,2010年左右变得和后者一样,这意味着前者的贡献在近几年得到了认可,这一现象可以再次得到事实印证。Oliver E Williams虽然比Susumu Tonegawa年长,但是他在2009年获得了诺贝尔奖,Susumu Tonegawa在1987年获得了诺贝尔奖,图灵指数因而能够发现这样的现象。同时,领域膨胀能够导致引用的快速增长,通过消除领域通胀的影响,图灵指数有助于发现真正的学术新星,在图9(q)和图9(r)中,菲尔兹奖获得者Terence Tao在通过图灵指数消除领域通胀影响后仍然增长迅速,这表明其影响力增长速度远远快于领域的通胀。综上所述,尽管在引用量、领域、年代等方面存在差异,但这些顶尖学者对其所属领域的影响是相似的。
从学者的发展历程来看,由于现有理论并不能准确地刻画真实情况下的学术网络,学者的生涯并不能无限延长,论文发表亦不能无限增长。图灵指数下的学术网络始终符合幂律分布,由于资深学者影响力较高,“富者愈富”现象会在较短的时间周期出现,与理论贴合。但随着网络演进,经典的论文会保有其影响力,学者会更倾向于引用新近前沿的论文,图灵指数更高的学者在若干年后并不能因为过去图灵指数高而扩大优势,而是与当前的论文发表和学者工作的影响力息息相关,在过去图灵指数较低的学者,经过若干年的发展之后,有可能跟上甚至超越过去图灵指数更高的学者。
6 结束语
图灵指数可发现引用量增长的本质,不仅有助于确定和比较不同领域不同年代学者的历史影响,而且可为领域排名和科学奖项提供可靠的评价指标。从应用角度来看,由于学者影响评价的准确性与数据的可靠性密切相关,图灵指数未来的研究工作将侧重于提高学者数据的准确性和泛化性,同时尝试用图灵指数对学者生涯轨迹进行刻画。从理论化角度来看,由于学者的引用量和学者关系可以通过社交网络中的理论来刻画,因此可以试图采用网络演进理论对图灵指数的评估标准进行微观解释,并将图灵指数应用到更广泛的领域影响力评估中。
标签:影响力,指数,图灵,领域,学者,学术,引用 来源: https://blog.51cto.com/u_15127528/2693169