发布时间:2021-06-24所属分类:教育职称论文浏览:1次
摘 要: 摘要:以美国物理学会旗下期刊20002019年发表的论文和WebofScience论文摘要为基础,用模因短语刻画知识,构建模因关系网络并引入跨学科测度Rao-Stirling指数以计算模因的跨领域分数,从而追踪物理学中的跨领域模因。分别从网络拓扑结构指标、跨领域测度指标
摘要:以美国物理学会旗下期刊2000—2019年发表的论文和WebofScience论文摘要为基础,用模因短语刻画知识,构建模因关系网络并引入跨学科测度Rao-Stirling指数以计算模因的跨领域分数,从而追踪物理学中的跨领域模因。分别从网络拓扑结构指标、跨领域测度指标和专业术语对比3个方面进行验证,证明了所提的模因关系网络和模因的跨领域分数可以有效反映知识在不同领域间的扩散现象。
关键词:模因;跨领域;社区发现;美国物理学会数据集
近年来,一些社会问题和研究课题往往无法在单一领域内得到解决,于是跨领域研究逐渐成为一种新的解决思路。大数据的出现为探索科学结构及其发展模式提供了数据基础[1]。计算机科学、网络科学等科技的蓬勃发展为科学学研究提供了多种技术手段[2]。从研究引文分布[3-4]到合著网络[5-6]再到团队合作[7],科学学渐渐成为一门独立的、融合多学科知识的学科。虽然有些科学家更倾向于主流学科领域的创新[8-9]而不认可跨学科研究[8],但不可否认的是越来越频繁的跨领域交流对科学研究起到了一定的促进作用。文献[10]的分析表明,论文和发明专利的组合往往能获得更高的影响因子。文献[11]认为,如果把看似不相关的思想和方法成功地结合起来可能会产生很大的影响。但迄今为止这些宏观的跨学科研究往往以论文[9]、期刊[12]、学科领域[9]、团体[13]为研究对象,忽略了跨领域的微观本质——知识交流。
科学研究中知识的传播和演化从微观层面体现在知识随着论文的引用关系而传播[14]。用模因(meme)来描述知识的传播过程已经得到大多数学者的认同。模因由道金斯在《自私的基因》[15]一书中首次提出,他认为单词、旋律、食谱、思想等文化实体与基因的进化相似:都具有复制和突变功能,并且都用人类文化代替基因作为繁殖媒介。研究表明,模因的演化可以有效推动网络的扩散和演化[16]。在引文网络中,科学模因可以理解为论文中的短文本单位,在引用文献中被复制并以多种表现形式分布在不同领域[14]。分析模因在不同领域的分布可以有效追踪知识在不同领域的演进过程。因此,本文利用引文网络中的模因短语来推导知识在引文网络中的演化。
科学知识由包含在论文、书籍、专利、软件和其他学术制品中的概念和关系构成,这些知识元素又通过正式和非正式的信息流、思想等连接起来[17]。因此,科学知识可以描述为一个复杂的、自组织的、不断进化的多尺度网络[2]。网络科学为揭示知识的传播和演化提供了一个高效的工具。作为一种分析网络的工具,网络科学有助于更好地理解作者或论文在合著网络、引用网络中的作用。已有相关研究通过构建科学合作网络使知识的微观特征达到可视化,从而分析了合作网络的结构特性[18]。虽然不同领域表现出不同的网络拓扑结构[5-6],但是许多网络结构表现出相似的全局特性。小世界架构就是其中之一[6],它反映了领域内高度聚集、领域间稀疏连接的情况,为跨领域研究提供了一种思路。
本文从模因角度追踪跨领域的知识交流,构建模因关系网络,从而提出了一种分析科学文献中跨领域知识关系的研究框架,并将其应用于2000—2019年美国物理学会(AmericanPhysicalSociety,APS)数据集。在所构建的模因关系网络中,节点代表模因短语,边代表模因短语在论文摘要中的关联程度。利用有权无向的模因关系网络,本文对网络的结构特性和节点间关联度进行了探索性的研究,并着重进行以下实验:1)从引文网络中提取科学模因[14],构建模因关系网络,以探究其社团结构和小世界特性。2)基于之前论文多样性的研究[19],假设模因短语可以量化跨领域研究程度,提出了领域相似度,并计算模因跨领域指标,追踪到跨领域模因。
1数据和方法
1.1数据集
本研究的数据集使用物理学领域的引文网络,依托于APS数据集(包含元信息及引用关系)和WebofScience数据库中的APS文献摘要信息。在选取数据集时从现实角度出发主要考虑物理学对科学界长久以来的影响力,从数据权威性看APS数据集更能代表物理学的发展动态,且选取单一的数据集也有助于形成统一的标准化领域分类。
在数据预处理方面,本文根据文献唯一索引号DOI将摘要信息整合到APS数据元信息中,并提取出APS数据集中的引用关系形成引文网络。
1.2定义科学模因
文献中经常出现的短语或词汇可作为重要的模因,但是一些高频出现的词汇如理论、研究所包含的知识价值往往很低。文献[14]提出了一种基于引文网络识别科学模因的算法,利用模因出现的频率及其在引文中的传播比例刻画出模因短语的得分。
1.4.2领域相似性
模因所属领域由APS数据集中包含该模因的一组论文集确定。如图1所示,包含模因1的6篇文献中有4篇文献属于领域a,2篇文献属于领域b,由此推导出模因1属于领域a。如果领域i中的论文和领域j中的论文存在引用关系,那么领域i和领域j更相似[21]。将这一思想推广到模因关联度网络中,若领域i和领域j中的模因存在共现关系,那么领域i和领域j更相似。
本文提出基于模因关联度网络的领域间相似性度量指标Sij。如果模因间的关联跨越了领域i和j,则领域i和j的相似度增加;如果模因间的关联跨越了领域i和领域j以外其他领域,则领域i和j的相似度减少;如果模因间的关联在领域内部,则不影响领域间的相似度。同时相似度的计算考虑模因间的关联权重Wab。
1.5网络跨领域测度
为了从总体上度量一个学科内部的跨领域交流情况,单纯地累加领域相似度既缺乏可解释性,又忽略了不同领域维度对总体度量指标影响力的差异性。于是,本文借鉴Dworkin衡量网络跨领域程度的思想[22]提出了宏观的、平衡各领域维度差异的网络跨领域测度。
2结果和分析
2.1科学模因
本文在构建APS引文网络后使用式(2)识别摘要中的模因[14],模因得分越高的短语或词汇越有可能成为领域研究中的模因。
表1列出了2015—2019年期间APS引文网络中排名前10的科学模因。在百度词条中检索表1中的模因可以发现,近5年物理学领域的研究热点主要聚焦在宇宙学、材料(石墨烯)、量子通信、流体力学领域。同时科学模因分数也在随着研究的深入不断演变,进而反映出模因短语的热门程度随时间变化的趋势。
2.2模因关系网络
通过识别模因可以探究热点知识的演变。本文用构建模因关系网络的方法实现模因间关系的可视化,直观地展示不同模因间的关联程度,揭示模因演化过程中的相互影响。使用式(3)计算模因间的关联程度,并构建模因关联度网络。图2描绘了模因关系网络,并刻画了网络社团结构。网络可视化使用Gephi软件,其中网络可视化的具体设置为FruchtermanReingold布局(力引导布局)、快速模块化社区发现算法[23]和pagerank算法[24]。
模因关系网络不仅能呈现出社区划分结果,而且能够反映不同领域中科学模因的社团结构。可以看到,具有更多跨领域联系的模因(统计物理、交叉学科物理等)往往表现出更强类间连接,并与非线性物理、量子通信、复杂网络的模因呈现较强的关联度。同一模因往往横跨多个领域。
模因关系网络中边的权重表示不同模因间关联程度,关键模因周围的关联模因反映了关键知识随时间的演化趋势。其他模因与关键模因的距离用余弦相似度度量,模因字体大小与关联程度有关。图3显示2017—2019年期间分数排名第1的模因“darkmatter”、分数排名第2的模因“graphene”与其他模因的关联度变化。
2.3模因多样性指标
本节在构建模因关系网络的基础上进一步探究其跨领域特性,追踪跨领域模因的多样性。首先,由模因的领域关系定义出不同领域间的距离dij=1−Sij。其次,将领域间距离dij代入RS多样性指标∆,得到模因跨领域得分。最后,通过模因关系网络的社团划分、网络跨领域测度指标和对比百度词条来验证模因跨领域分数的准确性。
2.3.1领域相似性
为了量化不同领域间的模因扩散现象,本文以2000—2019年期间APS模因关系网络为基础,由式(5)计算出APS的领域相似性Sij,从而得到领域间距离如图4所示。从图4可以看到,关联度最高的两个领域为Gravitation,Cosmology&Astrophysics和Particles&Fields,从模因关系网络中得到的领域间相似性均低于0.3,这与以往跨学科相似度度量指标一致[25]。图4展示的领域相似度与模因社团划分结果相似,Particles&Fields表现出较强的交叉领域特性,可见领域相似性有效反映了领域间的合作关系。——论文作者:周毅1,闫光辉1,卢彬炜1,王珊1,李世魁1,卫祥3,杨仕博2,靳丹3
相关期刊推荐:《应用科学学报》办刊宗旨:积极反映我国应用科学方面的最新科研成果,广泛开展国内外学术交流,努力为繁荣科学研究、推广科研成果服务,促进应用科学领域的发展。报道范围:本刊强调科学的应用性,主要刊登电子技术、信息与通信工程、计算机科学、机电自动化、材料科学、应用物理、应用化学、应用数学等领域内的创新性科研成果。
SCISSCIAHCI