|
|
861 |
整合不同评论平台的图书综合影响力评价研究 |
|
|
章成志, 童甜甜, 周清清 |
|
|
DOI: 10.3772/j.issn.1000-0135.2018.09.001 |
|
|
目前电商网站、社交媒体网站上包含大量的图书评论数据。挖掘在线图书评论,对于图书的全面评价、用户购买决策等都具有重要的作用。然而,目前基于图书评论的图书评价研究主要依据单一的评论平台,尚未利用多个平台的评论数据,在一定程度上造成图书评价结果的片面性。为此,本文量化不同平台图书评论差异的基础上,提出一种整合不同平台的图书综合影响力评价方法,即通过对社交平台、电子商务网站等数据源图书评论的采集与整合,进行图书综合影响力的评价。本文以4个学科的348本图书为例,从图书属性层面整合多源数据,分析不同整合策略所得图书评价结果的差异及原因。与基于单一平台的图书评价结果对比分析表明,整合不同平台数据的评价方法能够更加全面地评价图书影响力,降低传统方法的局限性。 |
|
|
2018 Vol. 37 (9): 861-873
[摘要]
(
253
)
HTML
(1 KB)
PDF
(644 KB)
(
1406
) |
|
|
|
874 |
一种新型期刊评价方法—基于论文作者简介的分析 |
|
|
宋晓晨,李梦豪,周良 |
|
|
DOI: 10.3772/j.issn.1000-0135.2018.09.002 |
|
|
对于学术期刊质量的评价指标或方法,传统上有两种:文献计量指标和专家评议法。这两种指标或方法各有优势。本文提出了一个基于论文作者简介中披露信息的期刊评价方法。该方法以公认权威期刊论文作者为切入点,通过搜集其在这些期刊论文中所撰写的个人简介,其中披露了自己的研究工作发表的主要期刊,通过对期刊排列顺序的信息进行归纳计算,得到各期刊的作者投票得分,以此得分对某个领域的期刊进行排序。进一步地,本文以国际信息系统领域重要期刊为实例对该方法的效果进行了检验。结果表明,该方法在一定程度上结合了两种传统方法的优势,弥补了一定的不足,具有实践意义。 |
|
|
2018 Vol. 37 (9): 874-881
[摘要]
(
173
)
HTML
(1 KB)
PDF
(346 KB)
(
636
) |
|
|
|
|
890 |
高校学生网络行为时序特征的可视化分析 |
|
|
严承希, 王军 |
|
|
DOI: 10.3772/j.issn.1000-0135.2018.09.004 |
|
|
在信息环境下,关于网络信息行为的研究是一个有着普遍需求和意义的重要课题。高校大学生群体是中国网民群体中重要的核心力量和生力军,探索与把握当前中国大学生用户网络行为和兴趣需求特征具有丰富的现实意义与社会价值。可视化分析可以直观地呈现用户行为的整体分布特征,为进一步的深入分析奠定基础。本文以中国大学生的纵向网络访问日志为分析对象,通过实证分析揭示了大学生网络行为在学期、周、小时等多重时间粒度下的分布特征。同时,基于马尔可夫链、Gini指数、h指数等指标,本文进一步讨论了不同小时时段下大学生用户群体的行为时序性行为特征和兴趣需求分布,为大数据环境下理解大学生的网络生活规律和支持企业个性化推荐服务提供了科学参考。特别地,本文创新地将h指数应用于用户兴趣网站排名算法中,展现了经典信息计量学分析方法在网络用户行为分析过程与应用中的价值,促进了应用情报学不同方法之间融合。 |
|
|
2018 Vol. 37 (9): 890-904
[摘要]
(
232
)
HTML
(1 KB)
PDF
(2392 KB)
(
1358
) |
|
|
|
|
912 |
基于概念格的在线健康社区用户画像研究 |
|
|
张海涛, 崔阳, 王丹, 宋拓 |
|
|
DOI: 10.3772/j.issn.1000-0135.2018.09.006 |
|
|
基于概念格构建在线健康社区群体用户画像,揭示不同类型群体用户多维度的特征以及不同情境下的行为规律,为优化社区服务提供依据。利用Python获取在线健康社区糖尿病圈的用户数据,从用户需求、用户角色、用户行为三个维度构建在线健康社区用户画像概念模型;利用ConExp1.3工具构建用户细分标签概念格,通过概念格Hasse图将用户群体分为3大类,实现社区群体用户画像的构建;通过关联规则挖掘群体用户在不同情境下的行为规律,实现用户画像的完整刻画。利用概念格进行群体聚类能够以层级的形式显示每类群体的属性特征,并且易于挖掘用户属性之间的关联,在构建全面准确的群体用户画像方面具有突出的优势,有助于社区深入了解用户群体,实现精准服务。 |
|
|
2018 Vol. 37 (9): 912-922
[摘要]
(
287
)
HTML
(1 KB)
PDF
(2977 KB)
(
1492
) |
|
|
|
923 |
理论术语抽取的深度学习模型及自训练算法研究 |
|
|
赵洪, 王芳 |
|
|
DOI: 10.3772/j.issn.1000-0135.2018.09.007 |
|
|
理论术语的抽取是大规模文献内容分析和跨学科知识转移深度揭示的基础。作为一种特定类型的命名实体,理论术语涉及的学科多、文献规模大、特征复杂,也缺乏大规模的成熟语料,因而抽取难度较大。为提高理论术语的抽取性能并降低训练集的人工标注代价,本文构建了面向理论术语抽取的深度学习模型,并研究了该模型中理论术语的特征构造和标注方法,同时也提出了一种自训练算法以实现模型的弱监督学习。通过实验对比,分别验证了本文模型和自训练算法的有效性,不仅为理论术语抽取提供了更加有效的通用方法,也为其他类型命名实体的识别研究提供了方法参考。 |
|
|
2018 Vol. 37 (9): 923-938
[摘要]
(
223
)
HTML
(1 KB)
PDF
(794 KB)
(
1188
) |
|
|
|
939 |
一种基于机器学习的新兴技术识别方法: 以机器人技术为例 |
|
|
周源, 刘宇飞, 薛澜 |
|
|
DOI: 10.3772/j.issn.1000-0135.2018.09.008 |
|
|
基于文献数据帮助技术预见研究提高其信度和效度,逐渐受到国内外预见方法学的关注。但是,传统文献计量学无法高通量的处理数据,分析时未能考虑文献的语义信息,同时,无法有效的嵌入技术专家领域知识与判断,使得适用性和有效性受到限制。因此,本文提出一种基于机器学习主题模型的新兴技术识别预见方法,通过对技术领域全样本的论文与专利数据的高通量融合处理,挖掘论文与专利的语义信息,从而提高技术识别的全面性与颗粒度一致性;在此基础上,将预见专家组的领域知识与判断,融入机器学习过程中,从而提高机器学习的准确度与识别新兴技术的能力,同时,使用论文与专利每年引用率作为指标,分析技术领域下细分技术的潜在新兴模式。本研究以机器人技术为例,提取Web of Science(WoS)论文数据库和Thomson Innovation(TI)专利数据库的十余万全领域海量数据,识别出机器人领域的新兴技术簇群,并进一步甄别全新技术颠覆和跨领域技术融合驱动等两种新兴技术出现模式,为新兴技术发展轨迹预见工作提供有益的支持。 |
|
|
2018 Vol. 37 (9): 939-955
[摘要]
(
379
)
HTML
(1 KB)
PDF
(11009 KB)
(
494
) |
|
|
|