发布时间:2021-02-27所属分类:教育论文浏览:1次
摘 要: 摘要:[目的/意义]图书馆学发展的数据化势不可挡,探索、发现、掌握和适应其中规律将对图书馆学基础理论研究产生重要影响。[方法/过程]本文使用CiteSpace工具,以近五年国内图书馆学关于数据的文献为研究对象,得出图书馆学发展数据化的三个热点研究领域。采
摘要:[目的/意义]图书馆学发展的数据化势不可挡,探索、发现、掌握和适应其中规律将对图书馆学基础理论研究产生重要影响。[方法/过程]本文使用CiteSpace工具,以近五年国内图书馆学关于数据的文献为研究对象,得出图书馆学发展数据化的三个热点研究领域。采用问卷调查和访谈的方法讨论图书馆学发展数据化的趋势、成因和策略。[结果/结论]图书馆学发展的确存在数据化趋势并且集中在五个方面,呈现四个梯度。在此基础上,发现图书馆信息资源深度开发的需要、量化研究方法对图书馆学研究的影响和图书馆学学科边界的拓展是图书馆学发展数据化的重要成因,并提出应对策略。
关键词:图书馆学数据化图书馆实践图书馆学研究图书馆学教育
1研究缘起
发展趋势是一个学科基础理论研究的核心内容,图书馆学对发展趋势的研究亦呈百舸争流的态势。柯平[1]认为新技术、应用研究和数字化研究将对图书馆学发展产生持续影响;马海群[2]提出学科交叉、技术应用、深度需求是未来图书馆学科发展的重要作用因素;杨爱军[3]建议我国图书馆学应当注重层次化发展。除此之外,数据化成为图书馆学发展的新动向,图书馆学发展是否会形成数据化的趋势,将对图书馆学基础理论的研究产生重要影响。
“数据化”(datafication)一词是数据科学家维克托·迈尔-舍恩伯格(ViktorMayerSchonberger)和肯尼思·库克耶(KennethCukier)提出的专业术语,描述了在网络空间将社会行为转化为在线量化数据的技术趋势[4]。图书情报与档案管理学科领域关于数据化的观点主要集中在信息资源利用方式的变化,例如档案数据化是将数字档案资源转换为可供阅读、分析和处理的档案数据资源的过程[5];历史文献数据化是将文献转化为可量化分析的数据[6]。考虑到一个学科的数据化除了研究客体,还需要包括研究方法,笔者认为图书馆学的数据化是图书馆学领域将数据作为研究客体或研究工具的状况或现象,图书馆工作或图书馆学研究中挖掘数据、统计数据和分析数据等都是图书馆学数据化的具体表现。
需要说明的是,数据化与数字化、知识化既有区别也紧密相连。数字化为数据化奠定了基础,改变了信息的载体形式;知识化是对信息内容进行学习与创新的过程。数字化和知识化本质上都是对数据的加工处理,这与数据化是一致的。数据时代推进了图书馆学发展的数据化,探索、发现、掌握和适应图书馆学的数据化趋势是图书馆人的任务与担当。
2研究现状
2.1数据来源与分析工具
由于目前关于图书馆学的数据化尚未有明确的定义,且根据CNKI期刊数据库检索发现关于图书馆学数据化的研究较少,为了提高查全率,本文以CNKI期刊数据库为数据来源,将“篇名”检索词设置为“数据”,将检索时间设置在2015—2020年,限定文献分类为“图书馆学、图书馆事业”进行检索,将检索结果按照相关性排序,除去会议通知、征稿通知等与研究内容无关的题录,最终得到有效文献题录2057条。借助可视化软件CiteSpace,采用高频关键词的共现分析、聚类分析挖掘图书馆学关于数据的研究中包含的隐性知识,探索图书馆学关于数据的研究热点以及发展现状。
2.2文献数量与研究热点
文献信息计量统计是科学基础理论研究的一个重要环节,能够一定程度上反映出某类研究在该学科领域的研究热度。将图书馆学关于数据的研究进行信息计量统计,便于了解图书馆学发展数据化的基本情况。
图1反映了2015—2020年图书馆学关于数据的研究文献增长趋势,2016年发文增长率最高,达到了30%,文献数量在2019年达到峰值(2020年数据不完整,暂不做详细分析)。图谱方式可以直观地反映关键词之间的关系,如果某一关键词或标题词在其所属领域反复出现,即为高频次关键词,可体现出该关键词或标题词所表征的研究主题是当前的研究热点领域。图2为关键词知识图谱,其中每个节点代表关键词出现的频次,节点越大代表相应的关键词出现的越频繁,反之,代表关键词不经常出现。线表示节点之间的联系,节点之间的连线越多代表节点间的联系越紧密。
相关知识推荐:黑龙江省图书馆职称晋升条件
下页表1为检出的2057篇文献中频次排名前十的关键词,对其频次进行求和,值为1286次,占文献关键词总频次3216的46%。这些关键词反映了该时间段我国图书馆学关于数据的研究热点(高频关键词频之和占全部关键词总频次的40%以上就能代表该领域的研究热点[7)。]下页表2为2057篇文献中中心度排名前十的关键词,能够一定程度上反映出节点之间的联系和某节点在整个网络中的地位。结合图2、表1和表2可以发现,所获取的文献中频次最高的关键词是大数据,频次为580,其次是高校图书馆、图书馆、数据素养和关联数据等;知识图谱、机构知识库、元数据和个性化服务等关键词中心度较高,与其他关键词的联系较为紧密,这些关键词反映了2015—2020年图书馆学关于数据的热点研究。
2.3研究领域分析
研究热点反映的是学者们研究内容的集中,进而形成热点研究领域。近些年,大数据成为学术界的“新宠”,而大数据受到追捧的关键在于通过加工实现数据的“增值”。图书馆是大量数据的集中地,自然而然地成为数据化的阵地,关于元数据、知识图谱和机构知识库的研究也同样是将数据作为研究客体或研究工具的表现。
2.3.1图书馆实践数据化
对于研究热点的把握和追踪,有利于更加精准地分析与掌握图书馆学发展的趋势。通过词频分析,大数据、高校图书馆、图书馆、数据素养、关联数据等高频关键词,体现的是图书馆学关于数据的热点研究。大数据环境下信息技术加速迭代,图书馆的馆藏资源建设、馆员业务能力以及读者服务面临转型升级。王丹丹[8]提出应基于本地数据或多个机构的联合数据来开展数据驱动的馆藏建设;瞿浩[9]针对图书馆员数据管理的内涵、图书馆数据类型和图书馆员数据管理能力进行分析并提出相应的策略;罗凤莉[10]认为运用图书流通数据的关联规则挖掘隐含关系,有利于调整馆藏资源建设的学科结构、提升读者服务的工作水平;曹嘉君等[11]构建了基于数据科学的知识创新服务模式。图书馆实践的数据化为图书馆服务提供了新的途径,加快了图书馆信息资源的更新与流通速度,提高了图书馆读者服务的个性化水平,为信息传递提供了便捷的通道。图书馆实践的数据化使得图书馆的服务模式突破时空限制,更有效地提升图书馆的数据管理水平。
2.3.2图书馆学研究数据化
图书馆学研究的数据化主要体现在图书馆学研究内容和研究方法的数据化。调查结果中的数据素养、数据关联、科学数据和数据管理等高频关键词反映的是图书馆学研究内容的数据化拓展;知识图谱、元数据、CiteSpace、语义网、数据挖掘等高中心度关键词反映的是当前图书馆学研究的具体方法的数据化。赵蕊菡[12]发现大数据时代,图书馆学的研究内容从以文献为主转变为以数据为主,研究热点转向科研数据的发现、存储、使用与分享和利用开放科学整合信息资源;张晓琳[13]认为数据范式将成为一种新型图书馆学研究范式;赵蓉英等[14]提出利用可视化分析技术对数据科学的发展进行分析,研寻数据科学的演进轨迹;刘丹[15]通过建立面向关联数据的学位论文元数据语义化原型,评估语义网技术在学位论文元数据上的应用效果。数据化为图书馆学研究提供新课题,随着大数据、数据科学、人工智能的发展,大量数据可以被广泛使用,将数据转换成有用的信息和知识是当务之急,科研数据和元数据逐渐成为图书馆学研究的数据基础。
2.3.3图书馆学教育数据化
“iSchool运动”发展至今已在世界图书馆学和情报学领域产生了深远的影响,关于图书馆学专业教育的研究显示,数据素养是学者们重点关注的话题,也是本次检出的高频关键词。司莉等[16]以38所iSchool院校的138个图书情报专业研究生项目为样本,通过调查发现此类院校的数据素养课程注重培养学生的数据挖掘能力,强调在实践中培养数据意识与数据伦理;曹树金等[17]认为未来可以在我国数据素养课程设计、数据素养能力模型的构建、数据素养能力评估体系、指标建设等方面进行更为深入地探索;安璐等[18]构建了数据挖掘课程的知识体系。结合国内图书馆学专业院校的课程设置,发现近些年许多院校增设了“大数据分析导论”“数据可视化”“数据结构”等课程。这是图书馆学教育受到数据化影响的表现,学者们对数据的关注逐渐渗透于专业教育之中,数据泛在的环境下,培养具备数据素养、数据挖掘和数据管理能力的图书馆学研究者和实践者亦是发展复合型人才的要求。
3趋势调查
为了探究图书馆学发展的数据化趋势能否长足发展,本文编制了关于“图书馆学数据化发展专家态度调查”的问卷,设置了总加量表、累积量表和开放式填空问答,为确保调查的客观性、全面性和合理性,笔者邀请了10位专家进行调查。受访者年龄在35~50岁之间,包含2位研究馆员,1位图书馆学期刊主编,7位从事图书馆学教育和研究的资深学者(来自北京大学、武汉大学、南京大学、中山大学和河北大学)。学者研究方向涉及图书馆学理论、图书馆管理、数字图书馆、参考咨询和图书馆学教育等方面,保证了专家群体科学性调查的质量。
3.1总加量表调查
调查图书馆学发展数据化的专家态度,受访者的评估主观性较强,因此采用态度测量技术(量表)进行调查。问卷第一部分采用总加量表统计数据对图书馆学的影响程度,根据研究领域分析,总加量表部分设置了数据对图书馆实践、对图书馆学研究和对图书馆学教育的影响三个角度,共20个问题,专家态度平均分情况如表3所示,在调查统计结果中,第一部分中每个项目的平均得分均大于3分,说明项目的设置是比较合理的。
专家态度评分中平均分最高的三个问题分别是“读者的阅读、访问数据的分析和挖掘对于图书馆提供个性化服务的影响”“数据运用能力对于图书馆学专业学生就业的影响”和“数据素养对图书馆学学生专业能力的影响”,可见大多数专家认为数据对图书馆实践和图书馆学教育两个方面的影响较大;此外,关于数据对图书馆学研究的影响平均分最高值为4.3分,表示多数专家认为数据对图书馆学研究热点的影响较大,最低值为3.8分,说明专家认为数据对图书馆学研究对象的影响较小。
3.2累积量表调查
问卷第二部分采用累积量表调查图书馆学发展数据化的影响因素,同样以图书馆实践、图书馆学研究和图书馆学教育三个领域为基础,共设置12个问题。累积量表专家态度评分情况如下页表4所示,专家根据个人观点选择数据是否对量表中的选项产生影响。专家评分情况可以清晰地显示出所有选项得分均大于零,根据累积量表的记分法和得分原则,保留得分为正数的选项,项目全部保留。
按照图书馆实践、图书馆学研究和图书馆学教育三个领域(下页图3中简称为实践、研究和教育)分别将题目得分从高到低进行排序,整理得到图3,横轴为题目得分,纵轴为题目所属领域和题目序号。图书馆实践领域中题目9、10得分最高,对应的是图书馆用户服务和馆员综合能力;图书馆学研究领域中题目3、5得分最高,对应的是图书馆学研究工具和图书馆学研究热点;图书馆学教育领域中题目12得分最高,对应的是图书馆学学生综合素质。
在专家态度评分的基础上进一步分析,按照答案为“是”的数量将各问句从左至右顺序排列,回答“是”得1分,得到重新整理的表格如下页表5所示。经过排列,所有的结果构成了一个阶梯形态,累积量表法就是利用此形态来作为判断语句和量表的基础。阶梯形态外有两项“否”的回答,通常采用再现系数R来计算出现的误差是否能够被接受,如果量表再现系数R大于0.9,就称该量表是单维度的,每个人的态度得分就是他回答赞成的项目总数。如果R小于0.9表明量表设计欠准确。此量表的R值为0.983,设计较为准确。——论文作者:金胜勇张琪
SCISSCIAHCI