en
×

分享给微信好友或者朋友圈

使用微信“扫一扫”功能。
参考文献 1
RotoloD, HicksD, MartinB R. What is an emerging technology?[J]. Research Policy, 2015, 44(10): 1827-1843.
参考文献 2
KajikawaY, TakedaY. Structure of research on biomass and bio-fuels: A citation-based approach[J]. Technological Forecasting and Social Change, 2008, 75(9): 1349-1359.
参考文献 3
ShibataN, KajikawaY, TakedaY, et al. Detecting emerging research fronts in regenerative medicine by the citation network analysis of scientific publications[J]. Technological Forecasting and Social Change, 2011, 78(2): 274-282.
参考文献 4
YoonJ, ChoiS, KimK. Invention property-function network analysis of patents: A case of silicon-based thin film solar cells[J]. Scientometrics, 2011, 86(3): 687-703.
参考文献 5
SmallH. Tracking and predicting growth areas in science[J]. Scientometrics, 2006, 68(3): 595-610.
参考文献 6
LeeW H. How to identify emerging research fields using scientometrics: An example in the field of Information Security[J]. Scientometrics, 2008, 76(3): 503-525.
参考文献 7
LüL, ZhouT. Link prediction in complex networks: A survey[J]. Physica A: Statistical Mechanics and its Applications, 2011, 390(6): 1150-1170.
参考文献 8
LibenNowellD, KleinbergJ. The link-prediction problem for social networks[J]. Journal of the Association for Information Science and Technology, 2007, 58(7): 1019-1031.
参考文献 9
GunsR, RousseauR. Recommending research collaborations using link prediction and random forest classifiers[J]. Scientometrics, 2014, 101(2): 1461-1473.
参考文献 10
翟东升, 刘鹤, 张杰, 等. 一种基于链路预测的技术机会挖掘方法[J]. 情报学报, 2016, 35(10): 1090-1100.
参考文献 11
宫雪, 崔雷. 基于医学主题词共现网络的链接预测研究[J]. 情报杂志, 2018, 37(1): 66-71, 52.
参考文献 12
ShibataN, KajikawaY, SakataI. Link prediction in citation networks[J]. Journal of the American Society for Information Science and Technology, 2012, 63(1): 78-85.
参考文献 13
ZhangY, PorterA L, HuZ, et al. “Term clumping” for technical intelligence: A case study on dye-sensitized solar cells[J]. Technological Forecasting and Social Change, 2014, 85: 26-39.
参考文献 14
滕立, 沈君, 高继平. 词知识网络中的认知结构: 理论、方法与实证[J]. 情报学报, 2013, 32(9): 976-989.
参考文献 15
ZhouT, LüL, ZhangY C. Predicting missing links via local information[J]. The European Physical Journal B, 2009, 71(4): 623-630.
参考文献 16
潘庆先, 董红斌, 韩启龙, 等. 一种基于BP神经网络的属性重要性计算方法[J]. 中国科学技术大学学报, 2017, 47(1): 18-25.
参考文献 17
LüL, ZhouT. Link prediction in weighted networks: The role of weak ties[J]. Europhysics Letters, 2010, 89(1): 18001.
参考文献 18
JehG, WidomJ. SimRank: A measure of structural-context similarity[C]// Proceedings of the Eighth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM Press, 2002: 538-543.
参考文献 19
KimJ, MageeC L. Dynamic patterns of knowledge flows across technological domains: Empirical results and link prediction[OL]. https://arxiv.org/ftp/arxiv/papers/1706/1706.07140.pdf.
参考文献 20
MarianiM S, MedoM, ZhangY C. Identification of milestone papers through time-balanced network centrality[J]. Journal of Informetrics, 2016, 10(4): 1207-1223.
参考文献 21
赵雨, 李惠, 关雷雷, 等. 钙钛矿太阳能电池技术发展历史与现状[J]. 材料导报, 2015, 29(11): 17-21.
参考文献 22
GreenM A, Ho-BaillieA, SnaithH J. The emergence of perovskite solar cells[J]. Nature Photonics, 2014, 8(7): 506-514.
参考文献 23
WangY, LvZ, LiaoQ. Synergies of electrochemical metallization and valance change in all-inorganic perovskite quantum dots for resistive switching[J]. Advanced Materials, 2018, 30(28): 1800327.
参考文献 24
FengJ, ZhuX, YangZ. Record efficiency stable flexible perovskite solar cell using effective additive assistant strategy[J]. Advanced Materials, 2018, 30(35): e1801418.
参考文献 25
ZhangQ, SuR, DuW N, et al. Advances in small perovskite-based lasers[J]. Small Methods, 2017, 1(9): 1700163.
目录 contents

    摘要

    随着新一轮科技革命和产业变革的加速演进,新兴技术识别成为影响一个国家和地区未来发展战略的重要议题。本文基于德温特专利数据,引入复杂网络链路预测方法与神经网络算法构建动态预测新兴技术发展网络的方法体系,并围绕新颖性与影响力两个维度识别新兴技术主题。同时,应用钙钛矿材料领域相关数据进行实证分析,验证了本文新兴技术主题识别方法的可行性与有效性。

    Abstract

    The acceleration of the new generation of technological revolution and industrial transformation stimulates the recognition of emerging technologies, which has become a crucial issue related to the future developmental strategy of a country and region. We initially predict the dynamic change of a co-word network based on link prediction and neural network algorithms. Emerging topics are then detected by measuring their novelty and influence. An empirical study on applications of perovskite materials is conducted to demonstrate the reliability of the proposed method.

  • 1 引 言

    识别新兴技术主题、进行新兴技术预布局是影响一个国家和地区未来发展战略的重要议题。然而,新兴技术具有高度的不确定性、模糊性和复杂性,技术特征不明显,导致其识别难度大、准确度[1],如何准确地识别新兴技术主题一直以来都是文献计量领域的重点和难点问题。

    近年来,很多学者通过构建网络,结合评价指标定量(如网络中心性指标等)开展新兴技术的识别研究。例如,Kajikawa[2]、Shibata[3]、Yoon[4]构建引文网络、发明属性-功能网络(invention property-function network),从时间和技术功能维度刻画技术的新颖性,识别新兴技术主题。Small[5]、Lee[6]在识别方法上不仅考虑了技术新颖性,还利用网络时序分析、结构洞理论等测度了技术增长性、影响力等性质。然而,这些研究强调基于历史文献数据的静态分析,不能实时体现网络动态发展特征。

    复杂网络链路预测方法主要基于网络的结构信息,计算未连接节点间产生链接的可能性,预测网络的动态变化,进而揭示技术领域未来的发展趋[7]。尽管,链路预测方法已经广泛应用于文献计量学领域,例如,科研合作者推[8,9]、技术机会挖[10,11]及引用关系挖[12],但多数文献仅限于对现有模型的简单应用,缺乏与特定网络特征的有效结合,预测精准度难以达到预期。

    为解决上述问题,本文首先基于加权共词网络进行链路预测,综合考量节点的局部信息、网络路径信息以及动态随机游走等指标,构建用于预测新兴技术发展的动态网络,并利用Back Propagation(BP)神经网络算法训练链路预测模型实现指标的非线性拟合,提升预测模型的精确度。之后,本文从技术新颖性和技术影响力两个角度入手,识别出具有高新颖性和高影响力的技术主题作为新兴技术主题。为验证本方法的有效性,本文以钙钛矿材料为例,识别该领域的新兴技术主题。本方法可以为国家制定产业科技政策和战略或者企业发展科技战略规划提供重要的决策参考。

  • 2 方法框架

    本文整合了文献计量、文本挖掘、机器学习与复杂网络分析方法,构建了基于加权网络链接预测的新兴技术主题识别方法,具体研究步骤如图1所示。

    图1
                            基于加权网络链接预测的新兴技术主题识别研究框架

    图1 基于加权网络链接预测的新兴技术主题识别研究框架

  • 2.1  数据获取与加权网络构建

    第一步,围绕具体的技术主题。从德温特专利数据库检索下载专利数据,并按照时间的先后顺序将所有数据划分为三个数据集D1、D2、D3,在后续的模型训练以及技术主题识别中将发挥不同的作用(详见2.2节)。利用Vantage Point软件获取标题和摘要中的技术术语,使用“主题词簇(Term Clumping)”方法进行数据清洗并获得技术术语集[13],并基于共现关系构建共词矩阵和网络。其中,技术术语与其自身的共现频次为0。将矩阵中共现频次转化为共现余弦指[14],计算公式为

    consinea,b=Fa,bFa×Fb(0consinea,b1)
    (1)

    式中,F(a)、F(b)分别表示技术术语ab在数据集中出现的频次;F(a, b) 为ab的共现频次。最终由三个数据集获得加权共词网络N1、N2、N3。

  • 2.2  链路预测模型训练

    第二步,选取链路预测指标。根据网络结构特性对指标进行调参,并利用BP神经网络模型将指标非线性拟合,用来提升预测精准度。其中,N1、N2中的节点数据集作为训练集和验证集分别对预测模型进行训练和超参数(BP神经网络节点数、学习率等)调节,N3中的节点数据集作为测试集验证模型的精准度。由于N3网络由最新时间段产生,反映技术的最新发展状况,训练后的模型将用于计算N3网络中未链接节点对可能出现链接的可能性,进而将这种可能性转化为权重,预测未来的网络。

  • 2.2.1  链路预测指标调参

    总结Liben-Nowell、周涛等的研究成果,在三种类型的链路预测指标(基于节点局部信息、基于局部路径信息、基于随机游走)中,Common Neighbors(CN)、Local Path(LP)、SimRan(SR)在多数复杂网络中(合作网络、共引网络、蛋白质相互作用网络等)均表现出较高的精准[8,15]。因此,本文选用该三种指标进行链路预测,覆盖所有网络节点,并用Area Under the Curve(AUC)指标从整体上评估预测精准度。同一类别的链路预测指标反映的都是一种网络信息,例如,Resource Allocation、Jaccard等基于节点局部信息的指标只是在CN指标的基础上对权重做了不同的处理。而本文所使用的BP神经网络算法可以实现对指标的权重分[16]以提高预测精准度,因而每个类别只选择了一个指标。相关指标介绍如下。

    (1)CN指标:计算方法如公式(2)所示。参数α调节边的权重(即不同权重的边对预测结果的贡献不与自身权重w呈正相[17]),根据自身网络的性质不断调整α(-1α1)取值,使得评估指标达到最优。

    SxyCN=ZΓ(x)Γ(y)wxzα+wyzα
    (2)

    式中,Γ(x)Γ(y)表示节点xy的连边节点集合;wxzwyz表示xy同节点z连边的权重。

    (2)LP指标:该指标适用于非加权网络。共词网络中节点之间的连边权重越大,连接路径越少,两节点越“亲密”,指标得分越高。本文对该指标进行改进使其适用于加权网络。具体方法为,将节点的路径距离定义为权重倒数累加和的倒数,计算方法为

    SxyLP=lxynL(x,y)lxy2+αlxy3
    (3)
    lxyn=nwij-1-1
    (4)

    式中,wij表示边的权重;lxyn为节点xy之间的n阶路径距离;α(0α1)用于确定3阶路径所占比重。

    (3)SR指[18]:计算两个随机游走者从两节点出发后相遇总时间的期望值。其假设前提是,两个节点所连接的邻居节点越相似,则两节点未来产生连线的可能性越大。计算方法为

    SxySR=αvzΓ(x)vz'Γ(y)szz'SimRkxky
    (5)

    式中,kxky分别为节点xy的度数;α(0α1)描述了相似性传递时的衰减情况。

    (4)AUC指标:链路预测中,由于样本数据过大,我们利用了Lü[7]的抽样比较的简化计算方法,即随机在测试集中选择存在链接的节点对分数值与不存在链接的节点对分数值进行比较,若前者大于后者,则加1分,相等加0.5分。若抽样比较n次,其中有n1次前者大于后者,n2次前者等于后者,则AUC值为

    AUC=n1+0.5n2n
    (6)
  • 2.2.2  链路预测模型训练

    BP神经网络是一种对非线性函数进行权值训练的多层映射网络,具有很强的非线性映射能力,可将上述三种指标进行非线性拟合,进一步提升预测精准度。本模型的训练主要包括三个步骤:

    (1)数据标准化:为消除指标数量级不同所产生的影响,基于转化函数x*进行min-max标准化(即x*=x-minmax-min),并最终获得每对节点的特征向量以及对应标签(存在链接为1,不存在为0)。

    (2)样本正负例调平衡:由于技术术语共词网络为稀疏网络,即存在链接的节点对数量远远少于不存在链接节点对的数量,正例(存在链接)、负例(不存在链接)样本的不平衡容易造成过拟合,预测结果会偏向样本数较多的分类。因此,本文对负例样本欠抽样,删除3个指标值均为0的样本,使用SMOTE算法对正例样本进行分析,并基于“插值”法人工合成新的正例样本。最终,使得两者的比例约为1∶1。

    (3)BP神经网络模型训练:本文构建BP神经网络。考虑到本文选取特征量较少,且为二分类问题,故选择了三层网络,即输入层、输出层及一层隐藏层。其中,输入层的神经元为3个,对应3个指标;输出层神经元为2个,对应节点对是否会产生链接的可能性;隐藏层的神经元数量的确定采用试凑法,在实际训练过程中进行调节。

  • 2.2.3  未来网络预测

    训练后的链路预测模型用于计算N3网络中节点对产生链接的可能性。设置阈值为0.5,即认为可能性大于0.5的节点对会产生链接,并将可能性转化为预测边的权重Wp,相应的计算方法参考了Kim[19]的研究,其计算公式为

    Wp=SIMAX(S)×MAX(W)
    (7)

    式中,Si为预测的节点对产生链接的概率值;MAX(W)MAX(S)分别为网络中存在边的权重最大值和预测得分最大值。

  • 2.3  新兴技术主题识别

    新兴技术主题识别主要围绕两步展开:即通过层次聚类获得技术主题;之后,基于技术术语出现的时间信息来测度新颖性,基于网络拓扑结构信息测度影响力,并围绕技术新颖性与技术影响力两个维度开展分析,识别新兴技术主题。

  • 2.3.1  层次聚类

    考虑到单个的技术术语并不能全面有效地反映技术主题,本文将层次聚类方法应用于从技术术语网络中获取技术主题的实现。首先,去除N3网络中低频词,然后将共现矩阵导入SPSS进行层次聚类,其中,类间距离的计算采用平均距离。

  • 2.3.2  技术主题新颖性测度

    技术主题的新颖性考虑了技术主题出现的时间维度,即一个技术术语出现的时间越晚,认为其新颖程度越高。技术主题的新颖度为聚类中技术术语新颖度的平均值,计算方式为

    ND=1Mj=MYj-1Ni=NYi
    (8)

    式中,N为集合中技术术语的总数;M为聚类中的技术术语个数;Y代表其出现的最早年份。

  • 2.3.3  技术主题影响力测度

    技术主题影响力体现了该技术在整个技术网络中的重要程度。网络中心性指标被用来测度节点在网络中的影响力,本文选取了PageRank(PR)指标。该指标在测度节点影响力时,综合考虑了邻居节点的数量以及影响力程度。本文将其应用于无向网络中,并使用Time-rescaled处理,即节点得分会与同一时间段出现的节点进行Z-score标准化,在一定程度上消除时间偏差。例如,一篇新发表的里程碑式的论文,其引用量可能不及多数发表时间较久的论文,单纯靠引用量(引用网络中的度中心性)测度其影响力存在时间上的偏差。Mariani[20]在测度论文影响力时,为解决这个问题创新性地引入了Time-rescaled处理方式。PR的计算方式及Time-rescaled处理具体分别如公式(9)与公式(10)所示:PR(pi)=1-dn+dpiM(pi)wpi,pj×PR(pi)k(pi) (9)

    R_PR=1Mi=MPR(pi)-μ(pri)δ(pri)
    (10)

    式中,n为网络中节点总数;d为阻尼系数;k(pi)为节点pi的度;wpi,pj为节点对pi,pj边的权重;M(pi)为节点pi存在连边的节点集合;μ(pri)δ(pri)分别为同一时间范围内节段集合的PR均值与标准差。

    本部分计算出每个技术主题的ND(新颖性)、PR(影响力)指标值,并认为两指标值均高的主题更具有成为新兴技术的可能性。

  • 3 案例分析

    近年来,钙钛矿材料由于优异的光电性能以及成本优势,成为光伏、计算器件等领域的新星。例如,钙钛矿太阳能电池在极短的时间内将光电转化效率提升至22%以上,引起了光伏界的广泛关[21]。本文从德温特数据库下载了2009—2017年关于钙钛矿材料的专利共计6337条,并按照年份划分为2009—2011、2012—2014、2015—2017三个数据集,分别包含1371、1643、3323条专利。运用主题词簇法,最终分别获得技术术语1292、1649、4005个,生成共现矩阵,并转化为技术术语加权共现网络N1、N2、N3。网络的具体信息如表1所示。

    表1 N1N2N3网络属性

    网络N1N2N3
    节点129216494005
    3469944058111781

    由于数据量过大,本文随机分别选取N1、N3网络节点数据的10%作为训练集和测试集,这里,α以0.2为步长递增。实验的结果如图2所示,最终CN、LP、SR指标α参数分别为0.6、0.2和0.6,此时AUC值最高,分别为0.84、0.82、0.91。

    图2
                            链路指标调参实验结果

    图2 链路指标调参实验结果

    在计算预测指标并调整正负样例平衡后,训练链路预测模型。经过测试,BP神经网络输入层和隐藏层激活函数设置为‘ReLU’,并对3个特征值进行非线性的映射,其中隐藏层的神经元为8个。同时,输出层函数‘Softmax’,计算最终每对未链接节点产生链接的可能性。在该模型中,输入的特征值经过隐藏层的非线性函数转换,再由输出层函数对这些特征进行分类。最终,链路预测模型的验证集、测试集的AUC值分别达到0.96、0.95(如图3所示),相比于单一指标,预测精准有了明显提高。之后,基于N3网络预测未来网络。

    图3
                            BP神经网络模型训练

    图3 BP神经网络模型训练

    将预测后的网络转化为矩阵,删除低频词后,得到技术术语83个。通过层次聚类得到技术主题19个,结果如表2所示。在表中可以看出,目前钙钛矿材料的主要研究方向集中在太阳能电池领域,在聚类中产生的技术主题多数与该领域相关,如flexible solar cell(柔性太阳能电池)、high durability(耐久性)、fill factor(填充因子)、hole transport(空穴传输)等。除此之外还涉及基础性的研究,如元素提取、晶体提纯等,相关主题如rare earth(稀土元素)、recrystallization nanocrystals(纳米晶体重结晶)、morphology(材料形貌)等。其次,是除太阳能电池之外的应用研究,如image sensors(图像传感器)、quantum dot laser(量子点激光器)、light emitting devices(发光二极管)。同时钙钛矿材料的研究也扩展到了计算机领域,如memory device(数据存储器)。

    表2 钙钛矿领域技术主题及对应技术术语

    序号技术主题技术术语
    1flexible solar cellflexible solar cell, flexible thin films, wearable devices, solution coating
    2image sensorsimage sensors, optoelectronic, nanocrystals
    3high durabilityhigh durability, cross-linking, general formula, carrier long time
    4rare earthrare earth, alkaline earth metal, ceramic capacitor
    5fill factorfill factor, circuit voltage, electrode materials, images
    6hole transporthole transport, light absorber, Spiro-OMeTAD, TiO2
    7perovskite thin filmperovskite thin film, vapor-assisted deposition, vapor solution process, doctor blading, self-assembled monolayer
    8electron transportelectron transport, transparent substrate, electron transmission lay, metal electrode, two-step method
    9memory deviceexcellent sensitivity, response speed, drive unit, data processor, PC, p-i-n structure, data processor
    10quantum dot laserquantum dot laser, spray coating, laser devices, field effect transistor, spectral coherence, low threshold, inkjet printing
    11fuel cellfuel cell, air electrode, fuel electrode, power generation, Perovskite oxide, diode laser array
    12electroluminescent deviceselectroluminescent devices, photoreceptor, hole injection, single bond, luminous efficiency, charge transport
    13leak freeleak free, non-toxic, environment friendly, lead leakage
    14light emitting deviceslight emitting devices, quantum yield, electroluminescent display, cesium
    15recrystallization nanocrystalsrecrystallization nanocrystals, large thin nanoplates, high pressure
    16morphologymorphology, nanowire, nanosheet, KPFM, crystal growth
    17devices stabilitydevices stability, thermal stability, moisture, UV, air stability
    18piezoelectric elementpiezoelectric element, ferroelectricity
    19mass productionmass production, low cost, large area

    通过对技术节点的新颖度和影响力指标计算,得出散点图(图4)。为了便于分析,本文将两个指标值也进行了min-max标准化。可以看出,目前最有影响力的研究是主题7和主题8,但新颖度不高(0.30和0.20)。技术主题7 Perovskite thin film(钙钛矿薄膜)主要涉及多种制备方法,如vapor-assisted deposition(气相辅助沉积)、doctor blading(刮刀法)等。同样,技术主题8 electron transport(电子传输层)涉及太阳能电池电子传输层的制备基底transparent substrate(透明基底)、制备方法two-step method(两步法)。一般光伏电池主要由空穴传输层、活性层、电子传输层及正负电极组成。perovskite thin film(钙钛矿薄膜)作为最关键的活性层,和electron transport(电子传输层)共同决定着钙钛矿电池的光电转化效率,以及将来能否实现产业化,即关系到本文聚类出的其他技术主题,如mass production(大规模生产)、high durability(耐久性),因而两个技术主题影响力较高,是研究中的重中之[22]。该结论与2016年学术界将钙钛矿电池作为新兴技术的观点保持一[21],但技术的新颖度并不高,可能的原因是本文仅从时间维度去测度新颖性,而两项技术主题作为钙钛矿电池的核心技术,其研究起源的时间较早。技术主题9是 memory device(记忆存储器),技术术语有excellent sensitivity[极好的敏感(驱动单元)]、data processor(数据处理器)等,已有机构将钙钛矿材料作为阻变层应用在瞬态阻变存储器中,为安全存储设备等研究提供了新的思路,目前研究成果还处于概念层[23]。此技术主题的新颖性最高(1.0),但影响力(0.25)较低;故技术主题9在未来一定时间内不会有太大的影响力,因而不认为钙钛矿记忆存储器是新兴技术主题。

    图4
                            技术主题新颖度-影响力

    图4 技术主题新颖度-影响力

    技术主题1是flexible solar cell(柔性太阳能电池),其主要应用于可穿戴设备(wearable devices)等方面。该技术主题新颖度(0.67)及影响力(0.83)较高,因而本文认为其是新兴技术主题。从最近的研究进展得知,柔性钙钛矿太阳能电池具有质量轻、形状可塑等优点,在众多钙钛矿电池中占据重要地位, 是最有可能实现工业化生产的柔性电池之一。近期,又有中国科学院学者造出的柔性钙钛矿电池的效率达18.04%,是目前柔性储能设备的最高效[24]。可穿戴设备是将人“物联网化”的重要媒介和载体,而柔性电池为其中的关键部件。这些从一定程度上验证了钙钛矿柔性太阳能电池为新兴技术主题这一结论。

    技术主题10为quantum dot laser(量子点激光器),涉及field effect transistor(场效应晶体管)、spectral coherence(材料的光谱相关性)等技术术语,该技术主题的新颖度(0.79)和影响力(0.67)均较高,认为以钙钛矿材料制备的量子点激光机为新兴技术主题。钙钛矿作为一种优秀的半导体材料,其光学增益高、量子产率高等优点使其成为设计低阈值彩色激光器件的理想材料。目前,已经有以钙钛矿材料为增益介质研发的薄膜型多晶钙激光器、单晶钙钛矿激光器及微盘钙钛矿激光器等实际应用,并表现出颠覆性的性能突[25],也验证了该技术主题为新兴技术主题的结论。

  • 4 结论与不足

    本文引入的加权网络链路预测方法,揭示了技术术语网络的动态变化,解决了新兴技术主题在发展前期影响力难以测度的问题。在链路预测的方法上,综合考虑了网络局部、路径以及随机游走这三类网络结构信息,并训练神经网络链路预测模型,相比单一的预测指标,大大提升了预测的精准度。在新兴技术影响力识别上,借鉴了Time-scaled方法,从一定程度上消除了时间偏差。在新兴技术主题的识别结果中,部分结论与当前学术界的共识基本保持一致,证明了该方法的有效性。

    本项研究也存在一定的缺陷与不足。首先,由于共词网络的局限性,无法测度技术对社会和经济产生的影响力,以及技术主题的一致性与成长性[1]。然而,综合考量技术与社会、经济等因素的相互影响不仅仅是文献计量领域的复杂问题,亦是计量经济学领域的重要研究问题之一。如何有效地整合两个学科的概念体系与分析方法,是本研究重要的未来研究方向之一。其次,如何从专利文本中有效地区分与提取技术术语是文献计量领域的另一个复杂问题,新兴技术术语的不规范性导致传统的主题词清洗与萃取方法并不能达到理想的效果。因此,本研究引入了专家知识,弥补定量方法的缺陷与不足。思考如何引入深度学习的方法,转换文本表征方式,是后续研究的另一个重要方向。

  • 参考文献

    • 1

      Rotolo D, Hicks D, Martin B R. What is an emerging technology?[J]. Research Policy, 2015, 44(10): 1827-1843.

    • 2

      Kajikawa Y, Takeda Y. Structure of research on biomass and bio-fuels: A citation-based approach[J]. Technological Forecasting and Social Change, 2008, 75(9): 1349-1359.

    • 3

      Shibata N, Kajikawa Y, Takeda Y, et al. Detecting emerging research fronts in regenerative medicine by the citation network analysis of scientific publications[J]. Technological Forecasting and Social Change, 2011, 78(2): 274-282.

    • 4

      Yoon J, Choi S, Kim K. Invention property-function network analysis of patents: A case of silicon-based thin film solar cells[J]. Scientometrics, 2011, 86(3): 687-703.

    • 5

      Small H. Tracking and predicting growth areas in science[J]. Scientometrics, 2006, 68(3): 595-610.

    • 6

      Lee W H. How to identify emerging research fields using scientometrics: An example in the field of Information Security[J]. Scientometrics, 2008, 76(3): 503-525.

    • 7

      Lü L, Zhou T. Link prediction in complex networks: A survey[J]. Physica A: Statistical Mechanics and its Applications, 2011, 390(6): 1150-1170.

    • 8

      LibenNowell D, Kleinberg J. The link-prediction problem for social networks[J]. Journal of the Association for Information Science and Technology, 2007, 58(7): 1019-1031.

    • 9

      Guns R, Rousseau R. Recommending research collaborations using link prediction and random forest classifiers[J]. Scientometrics, 2014, 101(2): 1461-1473.

    • 10

      翟东升, 刘鹤, 张杰, 等. 一种基于链路预测的技术机会挖掘方法[J]. 情报学报, 2016, 35(10): 1090-1100.

    • 11

      宫雪, 崔雷. 基于医学主题词共现网络的链接预测研究[J]. 情报杂志, 2018, 37(1): 66-71, 52.

    • 12

      Shibata N, Kajikawa Y, Sakata I. Link prediction in citation networks[J]. Journal of the American Society for Information Science and Technology, 2012, 63(1): 78-85.

    • 13

      Zhang Y, Porter A L, Hu Z, et al. “Term clumping” for technical intelligence: A case study on dye-sensitized solar cells[J]. Technological Forecasting and Social Change, 2014, 85: 26-39.

    • 14

      滕立, 沈君, 高继平. 词知识网络中的认知结构: 理论、方法与实证[J]. 情报学报, 2013, 32(9): 976-989.

    • 15

      Zhou T, Lü L, Zhang Y C. Predicting missing links via local information[J]. The European Physical Journal B, 2009, 71(4): 623-630.

    • 16

      潘庆先, 董红斌, 韩启龙, 等. 一种基于BP神经网络的属性重要性计算方法[J]. 中国科学技术大学学报, 2017, 47(1): 18-25.

    • 17

      Lü L, Zhou T. Link prediction in weighted networks: The role of weak ties[J]. Europhysics Letters, 2010, 89(1): 18001.

    • 18

      Jeh G, Widom J. SimRank: A measure of structural-context similarity[C]// Proceedings of the Eighth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM Press, 2002: 538-543.

    • 19

      Kim J, Magee C L. Dynamic patterns of knowledge flows across technological domains: Empirical results and link prediction[OL]. https://arxiv.org/ftp/arxiv/papers/1706/1706.07140.pdf.

    • 20

      Mariani M S, Medo M, Zhang Y C. Identification of milestone papers through time-balanced network centrality[J]. Journal of Informetrics, 2016, 10(4): 1207-1223.

    • 21

      赵雨, 李惠, 关雷雷, 等. 钙钛矿太阳能电池技术发展历史与现状[J]. 材料导报, 2015, 29(11): 17-21.

    • 22

      Green M A, Ho-Baillie A, Snaith H J. The emergence of perovskite solar cells[J]. Nature Photonics, 2014, 8(7): 506-514.

    • 23

      Wang Y, Lv Z, Liao Q. Synergies of electrochemical metallization and valance change in all-inorganic perovskite quantum dots for resistive switching[J]. Advanced Materials, 2018, 30(28): 1800327.

    • 24

      Feng J, Zhu X, Yang Z. Record efficiency stable flexible perovskite solar cell using effective additive assistant strategy[J]. Advanced Materials, 2018, 30(35): e1801418.

    • 25

      Zhang Q, Su R, Du W N, et al. Advances in small perovskite-based lasers[J]. Small Methods, 2017, 1(9): 1700163.

黄璐

机 构:北京理工大学管理与经济学院,北京 100081

Affiliation:School of Management and Economics, Beijing Institute of Technology, Beijing 100081

邮 箱:huanglu628@163.com

作者简介:黄璐,女,1984年生,博士,副教授,硕士生导师,主要从事文献计量分析、科技创新管理领域的研究,E-mail:huanglu628@163.com

朱一鹤

机 构:北京理工大学管理与经济学院,北京 100081

Affiliation:School of Management and Economics, Beijing Institute of Technology, Beijing 100081

作者简介:朱一鹤,男,1994年生,硕士,主要从事文献计量分析的研究

张嶷

机 构:悉尼科技大学工程与信息技术学院,悉尼 2007

Affiliation:Centre for Artificial Intelligence, Faculty of Engineering and Information Technology, University of Technology, Sydney 2007

作者简介:张嶷,男,1987年生,博士,讲师,主要从事文献计量分析、数据挖掘与信息系统、技术管理等领域的研究。

车 尧

角 色:责任编辑

Role:Executive editor

1000-0135-2019-38-4-335/alternativeImage/10efde3a-d5e9-4e2c-9857-d940434bbf28-F001.jpg
网络N1N2N3
节点129216494005
3469944058111781
1000-0135-2019-38-4-335/alternativeImage/10efde3a-d5e9-4e2c-9857-d940434bbf28-F002.jpg
1000-0135-2019-38-4-335/alternativeImage/10efde3a-d5e9-4e2c-9857-d940434bbf28-F003.jpg
序号技术主题技术术语
1flexible solar cellflexible solar cell, flexible thin films, wearable devices, solution coating
2image sensorsimage sensors, optoelectronic, nanocrystals
3high durabilityhigh durability, cross-linking, general formula, carrier long time
4rare earthrare earth, alkaline earth metal, ceramic capacitor
5fill factorfill factor, circuit voltage, electrode materials, images
6hole transporthole transport, light absorber, Spiro-OMeTAD, TiO2
7perovskite thin filmperovskite thin film, vapor-assisted deposition, vapor solution process, doctor blading, self-assembled monolayer
8electron transportelectron transport, transparent substrate, electron transmission lay, metal electrode, two-step method
9memory deviceexcellent sensitivity, response speed, drive unit, data processor, PC, p-i-n structure, data processor
10quantum dot laserquantum dot laser, spray coating, laser devices, field effect transistor, spectral coherence, low threshold, inkjet printing
11fuel cellfuel cell, air electrode, fuel electrode, power generation, Perovskite oxide, diode laser array
12electroluminescent deviceselectroluminescent devices, photoreceptor, hole injection, single bond, luminous efficiency, charge transport
13leak freeleak free, non-toxic, environment friendly, lead leakage
14light emitting deviceslight emitting devices, quantum yield, electroluminescent display, cesium
15recrystallization nanocrystalsrecrystallization nanocrystals, large thin nanoplates, high pressure
16morphologymorphology, nanowire, nanosheet, KPFM, crystal growth
17devices stabilitydevices stability, thermal stability, moisture, UV, air stability
18piezoelectric elementpiezoelectric element, ferroelectricity
19mass productionmass production, low cost, large area
1000-0135-2019-38-4-335/alternativeImage/10efde3a-d5e9-4e2c-9857-d940434bbf28-F004.jpg

图1 基于加权网络链接预测的新兴技术主题识别研究框架

表1 N1N2N3网络属性

图2 链路指标调参实验结果

图3 BP神经网络模型训练

表2 钙钛矿领域技术主题及对应技术术语

图4 技术主题新颖度-影响力

image /

无注解

无注解

无注解

无注解

无注解

无注解

  • 参考文献

    • 1

      Rotolo D, Hicks D, Martin B R. What is an emerging technology?[J]. Research Policy, 2015, 44(10): 1827-1843.

    • 2

      Kajikawa Y, Takeda Y. Structure of research on biomass and bio-fuels: A citation-based approach[J]. Technological Forecasting and Social Change, 2008, 75(9): 1349-1359.

    • 3

      Shibata N, Kajikawa Y, Takeda Y, et al. Detecting emerging research fronts in regenerative medicine by the citation network analysis of scientific publications[J]. Technological Forecasting and Social Change, 2011, 78(2): 274-282.

    • 4

      Yoon J, Choi S, Kim K. Invention property-function network analysis of patents: A case of silicon-based thin film solar cells[J]. Scientometrics, 2011, 86(3): 687-703.

    • 5

      Small H. Tracking and predicting growth areas in science[J]. Scientometrics, 2006, 68(3): 595-610.

    • 6

      Lee W H. How to identify emerging research fields using scientometrics: An example in the field of Information Security[J]. Scientometrics, 2008, 76(3): 503-525.

    • 7

      Lü L, Zhou T. Link prediction in complex networks: A survey[J]. Physica A: Statistical Mechanics and its Applications, 2011, 390(6): 1150-1170.

    • 8

      LibenNowell D, Kleinberg J. The link-prediction problem for social networks[J]. Journal of the Association for Information Science and Technology, 2007, 58(7): 1019-1031.

    • 9

      Guns R, Rousseau R. Recommending research collaborations using link prediction and random forest classifiers[J]. Scientometrics, 2014, 101(2): 1461-1473.

    • 10

      翟东升, 刘鹤, 张杰, 等. 一种基于链路预测的技术机会挖掘方法[J]. 情报学报, 2016, 35(10): 1090-1100.

    • 11

      宫雪, 崔雷. 基于医学主题词共现网络的链接预测研究[J]. 情报杂志, 2018, 37(1): 66-71, 52.

    • 12

      Shibata N, Kajikawa Y, Sakata I. Link prediction in citation networks[J]. Journal of the American Society for Information Science and Technology, 2012, 63(1): 78-85.

    • 13

      Zhang Y, Porter A L, Hu Z, et al. “Term clumping” for technical intelligence: A case study on dye-sensitized solar cells[J]. Technological Forecasting and Social Change, 2014, 85: 26-39.

    • 14

      滕立, 沈君, 高继平. 词知识网络中的认知结构: 理论、方法与实证[J]. 情报学报, 2013, 32(9): 976-989.

    • 15

      Zhou T, Lü L, Zhang Y C. Predicting missing links via local information[J]. The European Physical Journal B, 2009, 71(4): 623-630.

    • 16

      潘庆先, 董红斌, 韩启龙, 等. 一种基于BP神经网络的属性重要性计算方法[J]. 中国科学技术大学学报, 2017, 47(1): 18-25.

    • 17

      Lü L, Zhou T. Link prediction in weighted networks: The role of weak ties[J]. Europhysics Letters, 2010, 89(1): 18001.

    • 18

      Jeh G, Widom J. SimRank: A measure of structural-context similarity[C]// Proceedings of the Eighth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM Press, 2002: 538-543.

    • 19

      Kim J, Magee C L. Dynamic patterns of knowledge flows across technological domains: Empirical results and link prediction[OL]. https://arxiv.org/ftp/arxiv/papers/1706/1706.07140.pdf.

    • 20

      Mariani M S, Medo M, Zhang Y C. Identification of milestone papers through time-balanced network centrality[J]. Journal of Informetrics, 2016, 10(4): 1207-1223.

    • 21

      赵雨, 李惠, 关雷雷, 等. 钙钛矿太阳能电池技术发展历史与现状[J]. 材料导报, 2015, 29(11): 17-21.

    • 22

      Green M A, Ho-Baillie A, Snaith H J. The emergence of perovskite solar cells[J]. Nature Photonics, 2014, 8(7): 506-514.

    • 23

      Wang Y, Lv Z, Liao Q. Synergies of electrochemical metallization and valance change in all-inorganic perovskite quantum dots for resistive switching[J]. Advanced Materials, 2018, 30(28): 1800327.

    • 24

      Feng J, Zhu X, Yang Z. Record efficiency stable flexible perovskite solar cell using effective additive assistant strategy[J]. Advanced Materials, 2018, 30(35): e1801418.

    • 25

      Zhang Q, Su R, Du W N, et al. Advances in small perovskite-based lasers[J]. Small Methods, 2017, 1(9): 1700163.