带摘要目录

2019年 第38卷 第7期
刊出日期:2019-07-28

情报理论与应用
情报分析方法与技术
情报用户与行为研究
情报理论与应用
667 学术社交网络用户的隐私保护研究——以科学网博客为例 Hot!
胡昌平, 仇蓉蓉, 王丽丽
DOI: 10.3772/j.issn.1000-0135.2019.07.001
用户的信息隐私权限设置情况反映了用户的隐私保护情况。本文通过对学术社交网络中用户隐私权限设置行为的分析,研究学术社交网络用户的隐私偏好以及用户相关属性对其隐私保护行为的影响。以科学网为例,探究科学网中研究领域为图书馆、情报与文献学的1032名博客用户的隐私保护情况,研究包括3个方面:获取博客用户个人信息的隐私权限设置情况,据此分析用户隐私关注的信息类型;根据科学网博客用户注册时间的不同,分析注册时间对用户隐私保护的影响;根据科学网博客用户受教育程度的不同,分析受教育程度对用户隐私保护的影响。研究发现,学术社交网络用户的隐私保护情况与其他类型社交网络用户的隐私保护情况有所不同,科学网博客用户的隐私保护程度普遍较高,尤其注重个人身份标识信息的隐私安全,同时为实现学术交流倾向于披露与学术相关的信息;随着时间推移,科学网博客用户隐私保护程度呈提升趋势,晚期注册用户比早期注册用户更注重个人基本信息的隐私安全,却倾向于学术交流;而受教育程度对用户在学术社交网络中隐私保护的影响不显著。
2019 Vol. 38 (7): 667-674 [摘要] ( 255 ) HTML (98 KB)  PDF (808 KB)  ( 806 )
675 人文社会科学学者的跨学科性对被引的影响研究 Hot!
张培, 阮选敏, 吕冬晴, 成颖, 柯青
DOI: 10.3772/j.issn.1000-0135.2019.07.002
在分析了现有研究方法不足的基础上,本文从作者视角开展了跨学科性对被引的影响研究。考虑到已有研究多集中于自然科学,本文选择人文社会科学的论文构建数据集。为控制论文质量,本文仅采集了CSSCI数据库中各学科一流期刊的来源论文。论文分别利用作者专业度和投票向量的欧氏距离量化独著与合著论文的作者跨学科性,同时辅之以跨学科数以完善跨学科性的测量。实证结果表明,总体上,跨学科性有利于提高论文被引;对独著论文来说,采用两种测度方法的作者跨学科性对论文被引均存在显著的正向影响;就合著论文而言,采用欧氏距离的测度结果显示二者间存在显著的正相关关系,而跨学科数视角则发现二者间的关系呈倒U形。此外,研究还发现作者数、学科以及论文质量对二者间关系存在显著影响。
2019 Vol. 38 (7): 675-687 [摘要] ( 161 ) HTML (182 KB)  PDF (938 KB)  ( 955 )
688 学科交叉直接测度研究 Hot!
马瑞敏, 闫晓慧, 申楠
DOI: 10.3772/j.issn.1000-0135.2019.07.003
当前,学科间的交叉融合趋势越来越明显,科学研究的深入开展越来越需要不同学科学者的协同创新,如何测度学科间的交叉性是一个重要的研究课题。在阐述模型构建基本思想的基础上,从文献直引、文献耦合和共关键词三个方面构建了学科交叉直接测度综合模型。利用Web of Science中信息科学与图书馆学的相关数据,与其他六个学科(如管理学、计算机科学-信息系统)的交叉度进行了计算分析,并从内部比较(综合模型与单指标模型比较)和外部比较(与当前主流指标模型比较)两个方面展开了实证研究。研究结果表明,本文所提出的模型具有一定的比较优势:原理上更科学、更简单易操作、更符合实际情况、区分度更强、结果更易理解,是一种探测学科交叉度的有效方法。
2019 Vol. 38 (7): 688-696 [摘要] ( 260 ) HTML (128 KB)  PDF (908 KB)  ( 734 )
697 引文波峰的量化与分布探究 Hot!
李凌英, 闵超, 孙建军
DOI: 10.3772/j.issn.1000-0135.2019.07.004
引文是科学知识的重要连接,引文波峰反映了引文扩散过程中最具影响力的阶段。本文希望借助引文波峰分布情况来深入了解科学引文的动态扩散过程。首先明确引文波峰的定义,并构建详细的量化方法,对美国物理学会的期刊文献进行波峰识别,根据识别的波峰总结出六种引文曲线类型,最后基于文献的波峰数量、波峰位置、波峰间隔等特征探究波峰分布差异。发现大部分文献有且只有一个波峰,同时也存在两个或多个波峰的情况。文献一般在发表后初期到达首次波峰与最高峰(主要是发表后0~5年、第1~2年最为突出)。首次波峰的位置分布与最高峰位置分布显著正相关,高被引文献更易在发表初期达到首次波峰。
2019 Vol. 38 (7): 697-708 [摘要] ( 155 ) HTML (158 KB)  PDF (4438 KB)  ( 718 )
709 基于主成分分析和神经网络对作者影响力的评估 Hot!
李勤敏, 郭进利
DOI: 10.3772/j.issn.1000-0135.2019.07.005
为了更合理地评价科研人员的学术影响力,本文考虑了6个作者影响力因子,并用多元统计方法综合为一个评价作者影响力的指标。首先,提出和改进与影响力有关的各个影响因子;然后,用主成分分析法提取主成分,用加权秩和比法综合各个主成分;最后,用神经算法学习预测,得出预测模型。对291个作者进行实证分析,对比传统指标发现:改进指标具有良好的区分性、相关性和综合性,能够更加全面地对科研人员的影响力进行评价。
2019 Vol. 38 (7): 709-715 [摘要] ( 194 ) HTML (179 KB)  PDF (800 KB)  ( 736 )
716 基于类中心向量的论文作者归属机构自动识别方法研究 Hot!
何涛, 王桂芳, 马廷灿
DOI: 10.3772/j.issn.1000-0135.2019.07.006
对大规模科技文献进行整理分析时,常常需要自动识别论文作者所归属的组织机构,此时需要将论文中的作者地址信息与对应的机构名称进行自动匹配。同一个机构的作者地址信息在不同的英文论文中可能出现多种不同的写法,这给匹配造成了困难。针对这一问题,设计出一种机器学习方法,此方法充分利用英文论文中作者地址的书写特点,在基于类中心向量的基础上将作者地址信息与机构名称进行自动匹配。与传统方法比较,该方法不需要手工编写烦琐的匹配规则,被应用于中国科学院作者地址信息数据集,实验结果证明了此方法的可行性。
2019 Vol. 38 (7): 716-721 [摘要] ( 217 ) HTML (74 KB)  PDF (720 KB)  ( 712 )
情报分析方法与技术
722 让知识产生智慧——基于人工智能的文本挖掘与问答技术研究 Hot!
温有奎, 温浩, 乔晓东
DOI: 10.3772/j.issn.1000-0135.2019.07.007
计算机硬件性能的提升和云计算技术的发展提高了科技文献信息检索的速度和多类型数据聚类问题,但检索的对象还不能直接进入文献内容的事实知识,因而难以实现智能化的科技文献大数据知识的问题快速回答和推荐服务功能,由此大数据环境下的科技文献信息浏览方式越来越增加了科技人员获取创新点知识的时间和负担。究其原因有两点,一是科技文献的数据模型是非结构化文本数据结构,二是传统的信息检索系统的数据库不支持非结构化的文本数据结构。这两点制约了科技文献大数据成果与用户问题智能化和自动化回答服务的发展。针对这一问题,本文提出基于科技文献大数据创新点成果的智能挖掘和知识服务研究,首先利用人工智能的思想对科技文献进行创新点成果挖掘,其次建立创新点成果语义知识库,最后建立基于语义知识库的智能推理机的问题答案服务系统,以此探索科技文献大数据服务的浏览模型向问题回答的智能化和自动化方向发展的研究方法。
2019 Vol. 38 (7): 722-730 [摘要] ( 354 ) HTML (61 KB)  PDF (1584 KB)  ( 1198 )
731 人物本体词表之间的互操作及分类体系构建 Hot!
贾君枝, 崔西燕
DOI: 10.3772/j.issn.1000-0135.2019.07.008
随着人物本体词表的不断构建,用户查询并使用合适的本体词表存在一定困难。因此,通过对人物本体词表的属性进行重新聚合,以人物的自然属性以及社会属性为基础构建以人为核心的多维人物属性清单,可为用户使用本体词表提供清晰的分类导航。本体映射是实现目前本体词表间语义桥梁搭建的最为广泛和有效的技术。本文采用字符串相似度算法进行基于属性的名称、定义域、值域、上位属性相似度计算,同时对具有映射关系的本体词表属性进行总结归纳。最终,分析得出关于人的关系、地点、联系方式、事件等11种不同类型的属性分类体系,实现对多个本体词表的聚合。
2019 Vol. 38 (7): 731-741 [摘要] ( 193 ) HTML (91 KB)  PDF (3138 KB)  ( 587 )
742 面向企业信息检索的语义扩展查询方法 Hot!
耿爽, 杨辰, 牛奔, 蚁文洁, 刘雷
DOI: 10.3772/j.issn.1000-0135.2019.07.009
为了弥补传统的信息检索方法在企业内实施时查准率较低的缺陷,解决监督学习中训练数据短缺的问题,本研究提出了基于企业知识域类别和语义关联的查询词扩展方法。该方法首先利用主题模型对企业文档库进行建模,其次结合专家意见构建企业知识分类及相应的带有权重的类别描述词集,最后利用语义相似度对查询进行分类,在知识域描述词集中选择查询扩展词对查询进行扩展。本研究利用一家电子产品制造公司的真实数据进行实验研究,实验结果表明,扩展后的查询更能准确反映用户的查询要求,有效地提升了企业信息检索的查准率。
2019 Vol. 38 (7): 742-749 [摘要] ( 157 ) HTML (127 KB)  PDF (803 KB)  ( 647 )
750 基于专利的知识网络结构特征演变分析:以中国汽车产业为例 Hot!
徐露允, 曾德明, 陈静
DOI: 10.3772/j.issn.1000-0135.2019.07.010
技术创新的关键是知识整合和知识组合配置,知识整合和知识组合配置策略的不同带来了异质性的知识网络结构特征,从而反映出企业创新能力、创新决策的差异性。运用中国汽车产业2001—2014年申请的发明专利和实用新型专利筛选出961家企业,并利用企业专利数据中的专利分类号构建知识网络,重点分析了知识网络关系特征和聚集特征演变过程。通过2821个知识网络的结构特征演变分析发现,我国汽车产业知识网络关系特征总体水平较低,但仍呈现出了上升趋势,汽车产业在总体上形成了一定程度的局部知识聚集和全局知识聚集,但局部聚集程度明显高于全局聚集程度;依据是否参与协作研发或技术标准制定将企业进行分类,不同类别下企业知识网络结构呈现出差异性的特征。研究发现有助于揭示我国汽车产业知识融合发展规律,为日后推动技术跨界融合以提升自主创新能力提供了一定的理论指导。
2019 Vol. 38 (7): 750-759 [摘要] ( 276 ) HTML (93 KB)  PDF (1096 KB)  ( 868 )
情报用户与行为研究
760 查询式序列视角下跨设备搜索信息准备与重用阶段的眼动变化研究 Hot!
吴丹, 梁少博, 董晶
DOI: 10.3772/j.issn.1000-0135.2019.07.011
在信息检索领域中,用户在搜索引擎结果页面的眼动行为一直受到研究者的关注;特别是在跨设备搜索、跨屏交互日益普遍的背景下,用户发生设备转移后在SERP上的眼动行为分析已成为一个研究热点。在复杂搜索任务中,用户会提交多个查询式,而现有研究缺乏基于查询式序列的角度分析用户SERP眼动行为。本文通过在实验室环境下,开展用户实验,收集用户在跨设备搜索任务中的信息准备和信息重用两个阶段的眼动数据,从基本眼动现象、时间维度现象、空间维度现象三个层次,分析实验用户在SERP上眼动注视行为的变化。研究发现“信息重用”阶段中,用户在SERP上的注视时长、关注点数量,相比“信息准备”阶段都有所降低;注视区域的演化规律也发生了变化;眼跳次数、回视次数等指标也普遍降低;支持用户跨设备网络搜索的工具能够有效降低用户的眼动视觉负荷。
2019 Vol. 38 (7): 760-770 [摘要] ( 217 ) HTML (99 KB)  PDF (2899 KB)  ( 678 )