en
×

分享给微信好友或者朋友圈

使用微信“扫一扫”功能。
参考文献 1
何光辉. 发达国家扶持中小企业技术创新政策及启示[J]. 软科学, 2012, 26(6): 119-120, 144.
参考文献 2
张小冲, 张学军. 经济体制改革前沿问题: 国际比较与借鉴[M]. 北京: 人民出版社, 2003.
参考文献 3
赵亚静. 我国中小企业知识产权建设政策体系研究[D]. 长春: 东北师范大学, 2012: 5-7.
参考文献 4
杨西春. 中小企业技术创新与政策环境优化[J]. 人民论坛, 2014(1): 87-89.
参考文献 5
李英. 提升浙江省中小企业国际竞争力的对策研究[D]. 杭州: 浙江工业大学, 2008: 6-10.
参考文献 6
李敏. 试析自主创新对他国经济发展的影响与作用[N/OL]. 中国信息报, (2007-08-22) [2016-6-23]. http: //www. zgxxb. com. cn/jsdk/201002244255. shtm.
参考文献 7
洪勇, 李英敏. 基于专利耦合的企业间技术相似性可视化研究[J]. 科学学研究, 2013, 31(7): 1013-1021.
参考文献 8
徐元浩. 基于潜在语义分析的专利文献分析与搜索技术的研究[D]. 杭州: 浙江大学, 2010: 7-8.
参考文献 9
KesslerM M. Bibliographic coupling between scientific papers[J]. American Documentation, 1963, 35(3): 401-420.
参考文献 10
HuangM H, ChiangM H, LiY, et al. Constructing a patent citation map using bibliographic coupling: A study of Taiwan’s high-tech companies[J]. Scientometrics, 2003, 58(3): 489-505.
参考文献 11
吕惠琳, 刘杨. 基于专利耦合的波导光互联企业技术相似性分析[J]. 情报探索, 2016(1): 8-11.
参考文献 12
SmallH. Cocitation in the scientific literature: a new measure of the relationship between two documents[J]. Journal of American Society for Information Science, 1973, 24(4): 265-269.
参考文献 13
WhiteH D, GriffieldB C. Author cocitation: A literature measure of intellectual structure[J]. Journal of the American Society for Information Science, 1981, 32(3): 163-171.
参考文献 14
MagermanT, Van LooyB, SongX Y. Exploring the feasibility and accuracy of Latent Semantic Analysis based text mining techniques to detect similarity between patent documents and scientific publications[J]. Scientometrics, 2010, 82(2): 289-306.
参考文献 15
陈芨熙, 顾新建, 陈国海. 基于向量空间模型和专利文献特征的相似专利确定方法[J]. 浙江大学学报(工学版), 2009, 43(10): 1848-1852.
参考文献 16
YoonB, ParkY. A text-mining-based patent network: Analytical tool for high-technology trend[J]. The Journal of High Technology Management Research, 2004, 15(1): 37-50.
参考文献 17
季铎, 毕臣, 蔡东风. 基于类别信息优化的潜在语义分析分类技术[J]. 中国科学技术大学学报, 2015, 45(4): 314-320.
参考文献 18
JanssensF. Clustering of science fields by integrating text mining and bibliometrics[D]. Belgium: Katholieke University Leuven, 2007.
参考文献 19
LiuX H, YuS, FrizoJ, et al. Weighted hybrid clustering by combing text mining and bibliometrics on a large-scale journal database[J]. Journal of the American Society for Information Science and Technology, 2010, 61(6): 1105-1119.
参考文献 20
任红娟. 基于文献内容和引用结合的知识结构分析方法研究[D]. 北京: 中国科学院研究生院, 2010.
参考文献 21
WangF, DingC, LiT. Integrated KL (K-means-Laplacian) clustering: A new clustering approach by combining attribute data and pairwise relations[C]// Proceedings of the 2009 SIAM International Conference on Data Mining. DBLP, 2009: 38-48.
参考文献 22
温芳芳. 专利分类号耦合分析在企业潜在合作关系识别中的应用[J]. 现代情报, 2018(7): 142-147.
参考文献 23
温芳芳. 基于专利权人-分类号多重共现分析的全球专利布局研究——以太阳能汽车技术领域为例[J]. 现代情报, 2017(4): 165-169.
参考文献 24
李立. 基于元路径选择和融合的异构信息网络社区挖掘算法研究[D]. 西安: 西安电子科技大学, 2014: 8-17.
参考文献 25
SunY, HanJ. Meta-path-based search and mining in heterogeneous information networks[J]. Tsinghua Science and Technology, 2013, 18(4): 329-338.
参考文献 26
SunY Z, NorickB, HanJ W, et al. PathSelClus: Integrating meta-path selection with user-guided object clustering in heterogeneous information networks[J]. ACM Transactions on Knowledge Discovery from Data, 2013, 7(3): Article No. 11.
参考文献 27
SunY Z, HanJ W, YanX F, et al. Pathsim: Meta path-based top-k similarity search in heterogeneous information networks[J]. Proceedings of the VLDB Endowment, 2011, 4(11): 992-1003.
参考文献 28
葛军. 异构信息网络上的相似性搜索研究[D]. 西安: 西安电子科技大学, 2013: 5-9.
参考文献 29
步少莉. 异构信息网络Top-k相关性查询方法研究[D]. 山东: 山东大学, 2014: 5-8.
参考文献 30
梅进, 张笑. 2010年诺贝尔物理学奖揭晓[EB/OL]. (2010-10-5) [2016-06-20]. http://news.sciencenet.cn/htmlnews/2010/10/238322.shtm.
参考文献 31
李明珍. 石墨烯领域发展态势及对策建议[J]. 科技与经济, 2014, 27(1): 101-105.
参考文献 32
叶春涛. 国外中小企业技术创新的现状及启示[J]. 经济研究导刊, 2013(22): 259-260.
目录 contents

    摘要

    中小企业的技术创新能力已经成为一个国家创新体系中不可缺少的重要部分。美国对中小企业的相关扶持措施非常全面,鼓励中小企业通过从非营利性科研机构以及大型企业那里获取外部合作来帮助自身发展。本研究通过测度专利之间的相似性来度量专利权人之间的技术相似性,利用美国专利授权库中石墨烯专利数据构建专利异构网络,根据PathSelClus算法的需要,从专利权人中选出了7家科研机构与5家大型企业作为用户指导的聚类依据,根据专利单一属性信息与综合利用专利的多种属性信息聚类依据得到两种不同语义的聚类结果,在同一聚簇中的中小企业被认为与该科研机构(大型企业)存在技术相似性,具有合作的潜力。最后选出20家该领域中小企业代表,通过对中小企业与科研院所已有合作的调查以及中小企业与大型企业的主要关注领域进行对比,发现部分中小企业与科研机构之间存在过合作关系,同时中小企业与大型企业也有相同的主要关注领域,表明基于专利信息构建异构网络后利用PathSelClus算法对专利权人进行聚类的方法,在一定程度上对评估潜在合作伙伴是有效的。

    Abstract

    The technological innovation capability of small- and medium-sized enterprises (SMEs) has become an important component of a country’s national innovation system. In the US, there have been very comprehensive support measures related to SMEs that encourage them to cooperate with external organizations, such as non-profit research institutions and large enterprises; the support, in turn, can help them to develop rapidly. This study seeks to measure the technical similarity of the patentees by measuring the similarity between their patents and builds a heterogeneous network based on graphene-related patents in the database on US-authorized patents. Further, based on the PathSelClus algorithm, we choose 7 scientific research institutions and 5 large enterprises to act as user guidance. As a result, we get 2 types of clusters in terms of 2 semantics. The first result is a distribution of the degree of similarity between the SMEs and the 7 scientific research institutions, and the other is a distribution of the degree of similarity between SMEs and the 5 large enterprises. Finally, this study analyzes the validity of clustering results according to the research and development direction of the patentees.

  • 1 引 言

    自主创新能力与科技实力在一定程度上影响一个国家的竞争力。在很多国家,中小企业的技术创新能力已经成为其创新体系中不可缺少的重要部[1]。在我国,中小企业研发的新产品占到了总量的80%,并且发明与实用新型专利的65%也是由中小企业研发的。可见国内外中小企业对推动各国的技术进步都有着举足轻重的作[2,3]。鉴于中小企业的重要作用,很多国家为保障中小企业的发展提供了相关政策支持。如美国早在1982年通过的《中小企业创新发展法》就为促进中小企业的科研创新发展计划提供了重要依[4],该计划为中小企业研发创新产品、技术以及服务提供了大量的资金支[5]。尽管如此,美国对于中小企业的研发支出仅占到了全国的18.7%,技术创新资金投入不足,所以需要依靠外部资源的支持。发达国家中小企业获得外部合作的来源主要有两[1]:一是中小企业与非营利性科研机构(科研机构、高校、由政府资助的研发中心等)建立合作伙伴关[6],二是中小企业与大型企业建立合作关系。

    识别中小企业潜在合作对象的重要依据之一是研发个体之间的技术相似性,这也是企业技术情报分析的重要内[7]。专利信息作为重要的技术信息源,为获得专利权人的技术现状及发展方向提供了可靠的依据,利用专利信息来度量专利权人之间的技术相似性具有一定的可靠性。但是专利信息中所蕴涵的信息量比较庞大,要想通过专利来准确衡量专利权人间的相似性会遇到诸多困[8],例如,专利文献中会出现较多专业词汇以及术语,会导致非专业人员很难读懂。后来很多学者尝试利用专利信息网络分析法,如专利引文分析[9](包括专利引文耦[10,11]和专利共被引网[12,13])以及基于专利内容分析的专利文本分析[14,15,16,17],更进一步的研究则深入到基于以上方法构建融合的专利综合网[18,19,20,21],目前已产生了不少成[22,23]。但目前还尚未有学者将专利引文分析与文本分析两者结合起来,构成异构信息网络进行聚类分析,并解读出其中专利权人的技术相似性。

    异构信息网络是相对同构信息网络而言。当前相当多的社区挖掘算法都是基于由一种对象类型和一种关系类型构成的同构网络,这种单一类型关系构成的网络结构并不能反映对象之间的真正联系,在解决现实问题的过程中有效性并不高。异构信息网络是一种比同构信息网络更加复杂的抽象网络结构,其网络内部包含多种对象类型和关系类型,基于该类型的网络结构进行社区挖掘能够充分利用网络中对象之间的多种关系,使得对网络信息的获取和挖掘等分析的结果更加准[24]。在学术界,Sun[25,26,27]基于异构信息网络提出了一种相似度查询的算法,结果得到了与已给定对象的top-k个相关对象。基于此,葛[28]也提出一种异构信息网络下,将元路径与综合影响力因子相结合的相似性搜索算法。相似地,步少[29]提出在异构信息网络下将元路径的选择和用户偏好结合在一起的top-k相关性查询方法,从而度量出不同类型对象之间的相关度。可见,通过异构信息网络分析可以较好地度量对象之间的相似度。而Sun[26]提出的PathSelClus算法避免了人为赋权重的窘境,且经过了论文网络与实际购物网络的研究实践,证明此算法获得的结果相对其他聚类算法有更高的聚类准确度,可靠性较好。因此,该算法相关论文获得了2012年知识发现与数据挖掘(Knowledge Discovery and Data Mining,KDD)国际会议的最佳论文奖,得到了很高的评价及认可度。

    基于以上研究成果,本文提出将文献计量学中的引文分析方法与文本挖掘技术相结合,构建起专利与专利权人之间的异构信息网络,随后利用异构网络聚类算法——PathSelClus算法进行网络聚类分析。综合利用专利多种属性的信息来测度专利权人之间的技术相似性,在一定程度上克服了目前信息融合算法存在的融合权重难确定、矩阵构建的质量难保证等缺陷,为分析中小企业的潜在合作伙伴提供科学依据。

  • 2 模型构建

    本文研究的专利信息网络,目的在于通过专利之间的相似性来度量专利权人之间的技术相似性,所以需要通过专利之间的关系建立起专利权人之间的关系模型。参照文献信息网络,本文构建了专利信息网络,包含了更多不同类型的对象:专利权人、发明人、专利名称、专利权人所在国家、专利所属国家和专利IPC分类号等多种类型对象。本节介绍了构建专利异构信息网络的基本过程,包括基于专利文献耦合的元路径的构建过程和基于专利文本相似的元路径的构建过程;接着,描述了PathSelClus算法中用户指导模型的矩阵构建过程,即用户如何加入聚类种子来指导聚类运算;最后,梳理了PathSelClus聚类算法的基本过程。

  • 2.1  专利异构网络的构建

    基于相关文献的调研可以看出,通过将专利的引文信息与文本信息结合在一起来度量专利之间的相似关系的方法被广泛研究,且效果比只采用单一的专利信息要好,所以本文选择利用专利权人所拥有的专利间文本相似和引用关系(专利文献耦合与专利共被引)这两种关系作为元路径,构建专利异构信息网络。异构信息网络基本信息如下:

    (1)目标类型、特征类型:专利权人。

    (2)元路径:根据前文关于专利相似性度量方法的相关研究,我们选择了三条元路径来构建专利异构信息网络。

    第一条元路径:基于专利文献耦合的元路径。当某专利权人所拥有的专利与另外一位专利权人所拥有的专利引用了同一件专利时,元路径表示为A1-P1-P3-P2-A2,其中专利P1和专利P2共同引用了专利P3,目标类型和特征类型都是专利权人。

    第二条元路径:基于专利共被引的元路径。当某专利权人所拥有的专利与另一位专利权人所拥有的专利被同一件专利引用时,元路径表示为A1-P1-P3-P2-A2,其中专利P1和专利P2都被专利P3引用,目标类型和特征类型也都是专利权人。

    第三条元路径:基于专利文本相似的元路径。当某专利权人所拥有的专利与另外一位专利权人所拥有的专利存在文本相似关系时,元路径表示为A1-P1-P2-A2,其中专利P1与专利P2之间存在专利文本相似关系,目标类型与特征类型都是专利权人。

    专利权人(目标类型或特征类型)利用这三种元路径,通过专利(中间类型)构建起了专利异构信息网络(网络模式如图1a所示),以及基于专利文献耦合、基于专利共被引与基于专利文本相似的元路径,如图1b、图1c和图1d所示。

    图1
                            专利异构网络模式及其元路径

    图1 专利异构网络模式及其元路径

  • 2.2  PathSelClus聚类算法过程描述

    PathSelClus算法避免了人为赋权重的窘境,不仅可以得到较好的聚类效果,而且能够自动计算出构成异构信息网络的多种关系的权重,即得到在聚类过程中哪种关系对聚类的贡献值更大。此方法一定程度上克服了权重难以赋值的窘境,对专利异构信息网络进行聚类分析的可靠性较好。因此,本文选用该算法来进行异构网络聚类。

  • 2.2.1  PathSelClus算法的基本定义

    根据PathSelClus算法,给定一个异构信息网络G,用户需要指定如下信息作为聚类任务的输入:

    (1)聚类的目标类型T

    (2)聚簇的个数K,以及每个聚簇的对象种子L1,,LKLK表示聚簇K的对象种子,可以是空集。这些种子将用来作为聚类指导,来指导聚类任务的目的和倾向。

    (3)从类型T出发的元路径M的集合,表示为P1,P2,,PM,这些元路径可以根据用户的专业知识来决定。本文通过探究专利相似性的研究方法,选择了基于专利文献耦合、共被引与专利文本相似这三条元路径。

    算法的输出包括两部分:

    (1)每条元路径PM在聚类过程中贡献程度的权重αmαm0)。

    (2)聚类结果θ,将T中的每个目标类型ti与聚簇个数K关联起来,θi=(θi1,,θiK),其中θiKti属于聚簇K的概率,即θik≥0并且k=1Kθik=1i

  • 2.2.2  PathSelClus算法过程

    PathSelClus算[26]总体来说是一个迭代算法,目标类型属于不同聚簇中的概率分布Θ和每条元路径对聚类结果的贡献程度(即元路径权重)α相互优化,最终双方达到最优,获得最佳的聚类结果以及每条元路径的最佳权重。PathSelClus算法可分为四阶段。

    第一阶段:给出每条元路径的权重向量α,初始阶段将每一条元路径的权重赋值为1,进行内部迭代,使得聚类结果Θ最优化;

    第二阶段:将第一阶段得到的初步最优化的聚类结果Θ作为给定聚类结果,进行内部迭代计算,使元路径的权重α达到最优化,即权重α的变化范围处在一个阈值内;

    第三阶段:将第二阶段中得到的元路径权重α输入,再进行和第一阶段相同的迭代运算,计算得到进一步优化的聚类结果Θ,即聚类结果的变化范围处在一个阈值内;

    第四阶段:将第二阶段和第三阶段循环进行,直到最终的元路径权重α的变化范围达到某一阈值。

  • 3 案例分析

    2010年的诺贝尔物理学奖将石墨烯带入了人们的视线[30]。石墨烯是一种具有很多优良特性的新型纳米材料,如厚度最薄、强度最高、弹性好、导热性能最强,所以被誉为“黑金”,是“新材料之王”,被很多科学家预言将会掀起一场席卷全球的颠覆性新技术新产业革[31]。美国众多研发实力强大的大型企业都对石墨烯的研发投入了大量的科研力量,同时,在美国多项政策支持下,再加上良好的创业环境,促使了众多的石墨烯领域小型企业的诞生,推动着美国石墨烯的产业化和应用进程的加快。本文利用石墨烯领域的专利数据作为实证研究,从聚类结果的聚簇中分析中小企业与科研机构之间是否曾有合作历史,以及中小企业与大企业之间是否存在研发领域的交叉。

  • 3.1  数据来源及预处理

  • 3.1.1  检索策略

    本文的实证研究数据来源为Innography数据库,以“graphen*”为检索词,得到专利的标题和摘要中包含“graphene”的专利。为控制专利数量且确保专利引文数据的完整,将检索范围设定为美国授权专利数据库。检索到美国授权库石墨烯领域专利共1951件,检索日期2015年11月15日。删除无专利权人字段的专利,剩余1907件专利,对专利权人进行名称的标准化处理,得到专利权人共550位。

  • 3.1.2  美国授权石墨烯领域专利的主要专利权人

    1为美国授权石墨烯领域专利主要专利权人的专利数量的统计情况。表中给出了专利授权数量排名前25位的专利权人,其中韩国三星电子(Samsung Electronics Co Ltd)获得的美国授权专利数量最多,共143件;其次是美国格罗方德半导体股份有限公司(Global Foundries Inc)93件、美国IBM(International Business Machines Corporation)82件。

    表1 前25位美国授权石墨烯领域专利的专利权人

    编号企业专利数量
    1Samsung Electronics Co Ltd143
    2Global Foundries Inc93
    3International Business Machines Corporation(IBM)82
    4Nanotek Instruments Inc61
    5Sandisk3dLlc47
    6Xerox Corporation45
    7Tsinghua University37
    8Baker Hughes Incorporated31
    9HonHai Precision Industry Co Ltd31
    10The Government of the United States of America As Represented by the Secretary of the Navy30
    11Kabushiki Kaisha Toshiba29
    12Electronics and Telecommunications Research Institute28
    13Korea Institute of Science and Technology25
    14Nokia Technologies Oy22
    15Empire Technology Development Llc19
    16Samsung Display Co Ltd19
    17The Regents of the University of California19
    18Georgia Tech Research Corporation18
    19Lockheed Martin Corporation18
    20Massachusetts Institute of Technology18
    21Canon Kabushiki Kaisha17
    22Semiconductor Energy Laboratory Co Ltd17
    23Northwestern University15
    24Micron Technology Inc14
    25William Marsh Rice University14

    在主要专利权人中,大部分为企业,包括美国、韩国和中国等国家的大型企业,其中还包括了很多大学及科研机构,如清华大学(Tsinghua University)、韩国电子通信研究院(Electronics and Telecommunications Research Institute)和加利福尼亚大学(The Regents of the University of California)等。可见石墨烯授权专利的专利权人中科研机构占到了一定的比例,为美国中小企业通过和科研院所合作来提高技术创新能力提供了比较好的条件。

  • 3.2  构建专利异构信息网络

  • 3.2.1  构建基于专利文献耦合的元路径

    基于专利文献耦合的元路径的描述为A1-P1-P3-P2-A2,其中专利P1与专利P2同时引用了专利P3,其中A1P1P2A2之间是专利权人与专利之间的拥有与被拥有的关系,P1P3P3P2之间是专利的引用与被引用的关系。

    2为基于专利耦合的元路径的局部图,矩阵的行与列都代表专利权人,从局部图中可以得出如下结论:

    图2
                            石墨烯领域基于专利引文耦合的元路径矩阵局部图

    图2 石墨烯领域基于专利引文耦合的元路径矩阵局部图

    (1)从图中可以看出,该矩阵都是对称矩阵;

    (2)对角线上数值明显高于对应行与列上的数值,说明专利权人与其自身共同引用同样专利的情况最高,即自己与自己拥有的专利的文献耦合程度最高,这与实际情况相符。

    (3)从矩阵中其他数值可以看出不同专利权人之间的专利文献耦合程度的大小,如矩阵中第5行第1列,数值为11,相比较该局部图中其他(除对角线上)部分的数值要高,则表示编号为1的专利权人与编号为5的专利权人之间的专利文献耦合程度相对局部图中的其他专利权人要高;

    (4)从矩阵中也可以看出,编号为5的专利权人所拥有的专利的累积引文总数相比较局部矩阵中的其他专利权人要高。

  • 3.2.2  构建基于专利共被引的元路径

    基于专利共被引的元路径的描述为A1-P1-P3-P2-A2,其中专利P1与专利P2同时被专利P3引用,其中A1P1P2A2之间是专利权人与专利之间的拥有与被拥有的关系,P1P3P3P2之间是专利的引用与被引用的关系。

    3为基于专利共被引关系的元路径的局部图,矩阵的行与列都代表专利权人,从局部图中可以得出如下结论:

    图3
                            石墨烯领域基于专利共被引关系的元路径矩阵

    图3 石墨烯领域基于专利共被引关系的元路径矩阵

    (1)从图中可以看出,基于专利共被引的元路径矩阵也是对称矩阵;

    (2)对角线上数值明显高于对应行与列上的数值,说明专利权人与其自身被相同专利引用的情况最多,即自己与自己拥有的专利的共被引程度最高,这与实际情况相符;

    (3)从矩阵中其他数值可以看出不同专利权人之间的专利共被引程度的大小,如矩阵中第3行第1列,数值为2,相比较该局部图中其他(除对角线上)部分的数值要高,则表示编号为1的专利权人与编号为3的专利权人之间的专利共被引程度相对局部图中的其他专利权人要高。

  • 3.2.3  构建基于专利文本相似的元路径

    本文选择利用文本挖掘方法中的潜在语义分析(Latent Semantic Analysis,LSA)来度量专利文本之间的相似关系。基于LSA的元路径可以描述为A1-P1—LSA—P2-A2,其中A1P1P2A2是专利权人与专利之间存在的拥有关系,P1P2之间是基于LSA计算得到的专利之间的文本相似关系。

    4为基于LSA的专利文本相似的元路径的局部图,矩阵的行与列都代表专利权人,从局部图中可以得出如下结论:

    图4
                            石墨烯领域基于LSA的专利文本相似的元路径矩阵局部图

    图4 石墨烯领域基于LSA的专利文本相似的元路径矩阵局部图

    (1)从图中可以看出,该矩阵是对称矩阵;

    (2)基于专利文本相似的矩阵相对比较稀疏;

    (3)对角线上数值明显高于对应行与列上的数值,说明专利权人与自己拥有的专利之间的文本相似性最高,这与实际情况相符;

    (4)从矩阵中其他数值可以看出不同专利权人之间的专利文本相似程度的大小,如矩阵中第40行第15列,数值为62,相比较该局部图中其他(除对角线上)部分的数值要高,则表示编号为40的专利权人与编号为15的专利权人之间的专利文本相似关系比局部图中的其他专利权人要高。

  • 3.3  构建用户指导模型

    本文的研究目的是希望通过测度美国授权石墨烯专利异构信息网络中的中小企业与科研机构以及中小企业与大企业之间的技术相似性,来确定中小企业的潜在合作对象。所以在选择聚类种子的时候需要选择美国石墨烯授权专利的专利权人中的科研机构及大型企业。

  • 3.3.1  科研机构聚类种子的选取

    根据表1统计,在美国授权石墨烯专利的专利权人中,筛选出专利数量较多的研究机构作为聚类种子节点。美国海军(United States Navy)、加利福尼亚大学(The Regents of the University of California)、麻省理工学院(Massachusetts Institute of Technology)、西北大学(Northwestern University)、莱斯大学(William Marsh Rice University)、普林斯顿大学(The Trustees of Princeton University)和美国俄亥俄州巴特尔研究所(Battelle Memorial Institute)这7所科研机构选出来作为聚类依据,将所有专利权人根据聚类种子分到7个聚簇中。同一聚簇中的机构与该聚簇的聚类种子存在技术相似性,聚簇中的中小企业与机构可以通过科研合作达到双赢。

  • 3.3.2  大型企业聚类种子的选取

    美国对于中小企业也有比较明确的界定方式,一是指那些不要求具有较大规模的企业(包括经济规模中性和规模不经济产业,规模指标主要指企业人数),二是指尚处于向较大规模方向发展过程 中的中小型企[32]。结合表1的统计选出作为以大型企业为聚类依据的种子企业,如表2 所示,将表中5家美国石墨烯领域大型企业作为聚类依据,将所有专利权人根据聚类种子分到5个聚簇中。同一聚簇中的机构与该聚簇的聚类种子存在技术相似性,聚簇中的中小企业与大企业之间可能形成合作关系。

    表2 美国石墨烯领域大型企业专利统计表

    排序列表索引大型企业企业员工人数销售额/US $授权专利数量主要专注的石墨烯领域
    1257Global Foundries Inc180005 billion93石墨烯方向的半导体器件研发、平版印刷、电子设计自动化(EDA)工具、专用集成电路
    2381International BusinessMachines Corporation37775781.741 billion82石墨烯晶体管、石墨烯集成电路、透明电极
    3335Sandisk3dLlc87905.565 billion47传感器、晶体管和存储器
    4145Xerox Corporation14080018.04 billion45碳纳米管、复合材料、涂层
    587Baker Hughes Incorporated3900022.364 billion31复合材料、传感器、电池、石墨烯纳米带
  • 3.4  基于PathSelClus算法对异构网络进行聚类

    通过上文,我们建立起基于专利文献耦合、共被引与基于LSA专利文本相似三条元路径的专利异构信息网络,接下来利用PathSelClus算法对异构网络进行聚类运算,包括基于科研机构对专利权人进行聚类以及基于大型企业对专利权人进行聚类这两种聚类方法。可以获得每一个专利权人在不同的聚簇中的概率,即代表专利权人与聚簇中种子节点之间的技术相似程度的大小。

    从550位专利权人中,根据检索到的中小企业信息的完整程度,选出20家美国中小企业进行聚类结果有效性分析。表3为数据集中20个中小企业专利权人的信息列表,包括企业名称、规模、所属行业和专注领域。

    表3 美国石墨烯领域中小企业信息

    序号企业名称公司规模(人数)所属行业专注领域
    1

    Vorbeck Materials

    Corporation

    51~200纳米技术石墨烯导电油墨、弹性纤维和塑料复合材料、高性能纤维、防腐蚀涂料以及电池。公司石墨烯专利技术最初是在普林斯顿大学开发的
    2Nantero, Inc.51~200纳米技术纳米技术、半导体、信息存储器
    3Nanotek Instruments11~50纳米技术能量存储设备、燃料电池、超级电容器、电池技术
    4Capco, Llc201~500国防武器挂载设计;在为美国陆军、海军、空军、海军陆战队提供产品及服务方面有很多经验
    5Fastcap Systems, Corp.51~200工业设计/机械设计致力于解决能源问题,电容器、定向碳纳米管阵列、曾与麻省理工学院合作开发
    6Graphene Technologies, Inc.11~50纳米技术石墨烯产品制造,基于石墨烯的先进产品解决方案、高分子复合材料
    724mTechnologies, Inc.50~200可再生能源能源存储
    8Outlast Technologies, Llc11~50纺织速干衣、内衣、鞋类
    9Nabsys2.0Llc11~50生物技术生命科学,DNA测序、纳米孔、固态纳米探测器、电子探测、生物化学
    10Nanoselect, Inc.11~50纳米技术微型芯片传感器监测水质与保健医疗诊断方面的应用,纳米科技、半导体、微小流体力学、化学、传感器
    11FahsStagemyer, Llc1~10可再生能源水的净化处理,光催化分离、分子分解、反硝化反应、印刷电路板矫正、消毒
    12Brookhaven Science Associates, Llc11~50计算机软件美国能源部选出管理和操作布鲁克黑文国家实验室,被确定为巴特尔和石溪大学的合作伙伴
    13Kilolambda Technologies Ltd11~50纳米技术光学仪器、下一代非线性组件和仪器、对摄影、激光、防御、安全、数位成像、汽车工业、建筑、眼部饰物领域有着重要的意义
    14Opto Trace Technologies, Inc.11~50学术研究光学纳米技术、激光拉曼光谱技术
    15Nthdegree Technologies WorldwideInc.11~50电器/电子制造LED印刷电路板、无机微发光LED、制造业
    16Molecular Rebar Design11~50纳米技术石墨烯制造、锂离子电池、复合材料、涂层医药应用
    17Scriptel Corporation11~50电器/电子制造触摸屏传感器、系统;集成电路开发;数字笔技术、签名采集
    18Custom Electronics, Inc.51~200电器/电子制造电子设备制造、电容器制造、电子组件、电磁学、印刷电路板的设计与组装
    19Nei Corporation11~50纳米技术高性能电池材料、高级防护涂层、锂离子电池测评、热传递液体、吸附剂除汞、纳米材料
    20Gvd Corporation11~50化学涂层服务、敷形涂料、薄膜聚合物、化学气相沉积、涂层开发
  • 1)以科研机构为聚类种子所得到的聚类结果有效性分析

    5是从专利权人中选出的20家中小企业与根据科研机构进行聚类得到的结果,根据这些企业的调查,发现其中Vorbeck Materials Corporation、Capco,Llc、Fastcap Systems,Corp.和Brookhaven Science Associates,Llc曾与它们所在的聚簇中的聚类种子之间有过合作关系,如表4所示。

    图5
                            以科研机构为聚类种子的20家中小企业聚类结果

    图5 以科研机构为聚类种子的20家中小企业聚类结果

    表4 与科研机构曾有合作关系的中小企业列表

    科研机构名称小企业名称合作历史

    The Princeton University

    (普林斯顿大学)

    Vorbeck Materials Corporation公司石墨烯专利技术最初是在普林斯顿大学开发的

    United States Navy

    (美国海军)

    Capco, Llc在为美国陆军、海军、空军、海军陆战队提供产品及服务方面有很多经验
    Massachusetts Institute of Technology (麻省理工学院)Fastcap Systems, Corp.致力于解决能源问题,曾与麻省理工学院合作开发

    Battelle Memorial Institute

    (美国俄亥俄州巴特尔研究所)

    Brookhaven Science Associates, Llc被美国能源部选出来签订5年条约,来继续管理和操作布鲁克黑文国家实验室,被确定为巴特尔和石溪大学的合作伙伴
  • 2)以大型企业为聚类种子所得到的聚类结果有效性分析

    6为以石墨烯领域大型企业为聚类种子所得到的20家中小企业的聚类结果,通过对这5个大型企业和20家中小企业在石墨烯领域主要关注的发展领域进行对比,来验证聚类结果的有效性。

    图6
                            以大型企业为聚类种子的20家中小企业聚类结果

    图6 以大型企业为聚类种子的20家中小企业聚类结果

    如与Global Foundries Inc在同一个聚簇中的中小企业情况如表5所示,通过对该企业与中小企业关注的石墨烯研究领域进行对比,可以看出表中三家小型企业与Global Foundries Inc分别在半导体研发、集成电路开发以及印刷电路领域有交集,存在技术上的相似性,具有合作的可能性。

    表5 与Global Foundries Inc在同一个聚簇中的中小企业情况

    大企业小企业相同关注领域
    企业名称专注领域企业名称专注领域
    Global Foundries Inc石墨烯方向的半导体器件研发、平版印刷电路、胶印、嵌入式存储器、电子设计自动化(EDA)工具、专用集成电路Scriptel Corporation触摸屏传感器、集成电路开发、数字笔技术集成电路开发
    Nthdegree Technologies Worldwide Inc.印刷电路板、无机微发光LED印刷电路板
    Custom Electronics, Inc.电子设备制造、电容器制造、电子组件、电磁学、印刷电路板的设计与组装印刷电路

    通过对中小企业与科研院所已有合作的调查以及中小企业与大型企业的主要关注领域进行对比,发现部分中小企业与科研机构之间存在过合作关系,同时中小企业与大型企业也有相同的主要关注领域。因此,可以认为基于专利信息构建异构网络后利用PathSelClus算法对专利权人进行聚类的方法在一定程度上是有效的。

  • 4 总结与展望

    本文通过利用专利之间多种相似性的测度方法构建起专利异构信息网络,目的在于通过专利之间的相似性来测度专利权人之间的技术相似性。详细介绍了构建专利异构信息网络的过程,包括如何构建基于专利文献耦合和共被引的元路径以及如何构建基于LSA的专利文本相似的元路径,再利用PathSelClus算法对专利异构信息网络进行聚类。与其他方法相比较,该方法在一定程度上能够弥补利用专利单一信息源进行专利权人技术相似性测度的不足,并且不需要提前为多种关系赋权重,而是通过PathSelClus聚类算法计算得到三条元路径在聚类过程中的贡献值的大小,即权重的大小,摆脱了人工主观赋值或者反复实验确定最佳权重的窘境。

    最后利用美国授权石墨烯专利对该方法进行了实证研究,发现部分中小企业与科研机构有过合作的历史,并且部分中小企业与大型企业的研发方向存在相似关系,在一定程度上证明了本文所采用的方法的有效性。

    由于各方面的局限,本研究还有很多值得思考和完善的地方,下一步研究包括:①选取几个不同的技术领域进行实证研究,尤其是企业技术之间区别程度较大的技术领域,这样就可以选出每个技术领域中的典型企业,对其他企业进行聚类,即可以实现对不同技术领域内的企业的划分归类;②本文基于LSA的方法对专利文本相似度进行计算,但该算法存在一定的缺点,如无法捕捉一词多义的现象、具有词袋模型的缺点(即在一篇文章或者一个句子中忽略词语的先后顺序)等,在以后的研究中可以考虑采用计算效果更好的方法。

  • 参考文献

    • 1

      何光辉. 发达国家扶持中小企业技术创新政策及启示[J]. 软科学, 2012, 26(6): 119-120, 144.

    • 2

      张小冲, 张学军. 经济体制改革前沿问题: 国际比较与借鉴[M]. 北京: 人民出版社, 2003.

    • 3

      赵亚静. 我国中小企业知识产权建设政策体系研究[D]. 长春: 东北师范大学, 2012: 5-7.

    • 4

      杨西春. 中小企业技术创新与政策环境优化[J]. 人民论坛, 2014(1): 87-89.

    • 5

      李英. 提升浙江省中小企业国际竞争力的对策研究[D]. 杭州: 浙江工业大学, 2008: 6-10.

    • 6

      李敏. 试析自主创新对他国经济发展的影响与作用[N/OL]. 中国信息报, (2007-08-22) [2016-6-23]. http: //www. zgxxb. com. cn/jsdk/201002244255. shtm.

    • 7

      洪勇, 李英敏. 基于专利耦合的企业间技术相似性可视化研究[J]. 科学学研究, 2013, 31(7): 1013-1021.

    • 8

      徐元浩. 基于潜在语义分析的专利文献分析与搜索技术的研究[D]. 杭州: 浙江大学, 2010: 7-8.

    • 9

      Kessler M M. Bibliographic coupling between scientific papers[J]. American Documentation, 1963, 35(3): 401-420.

    • 10

      Huang M H, Chiang M H, Li Y, et al. Constructing a patent citation map using bibliographic coupling: A study of Taiwan’s high-tech companies[J]. Scientometrics, 2003, 58(3): 489-505.

    • 11

      吕惠琳, 刘杨. 基于专利耦合的波导光互联企业技术相似性分析[J]. 情报探索, 2016(1): 8-11.

    • 12

      Small H. Cocitation in the scientific literature: a new measure of the relationship between two documents[J]. Journal of American Society for Information Science, 1973, 24(4): 265-269.

    • 13

      White H D, Griffield B C. Author cocitation: A literature measure of intellectual structure[J]. Journal of the American Society for Information Science, 1981, 32(3): 163-171.

    • 14

      Magerman T, Van Looy B, Song X Y. Exploring the feasibility and accuracy of Latent Semantic Analysis based text mining techniques to detect similarity between patent documents and scientific publications[J]. Scientometrics, 2010, 82(2): 289-306.

    • 15

      陈芨熙, 顾新建, 陈国海. 基于向量空间模型和专利文献特征的相似专利确定方法[J]. 浙江大学学报(工学版), 2009, 43(10): 1848-1852.

    • 16

      Yoon B, Park Y. A text-mining-based patent network: Analytical tool for high-technology trend[J]. The Journal of High Technology Management Research, 2004, 15(1): 37-50.

    • 17

      季铎, 毕臣, 蔡东风. 基于类别信息优化的潜在语义分析分类技术[J]. 中国科学技术大学学报, 2015, 45(4): 314-320.

    • 18

      Janssens F. Clustering of science fields by integrating text mining and bibliometrics[D]. Belgium: Katholieke University Leuven, 2007.

    • 19

      Liu X H, Yu S, Frizo J, et al. Weighted hybrid clustering by combing text mining and bibliometrics on a large-scale journal database[J]. Journal of the American Society for Information Science and Technology, 2010, 61(6): 1105-1119.

    • 20

      任红娟. 基于文献内容和引用结合的知识结构分析方法研究[D]. 北京: 中国科学院研究生院, 2010.

    • 21

      Wang F, Ding C, Li T. Integrated KL (K-means-Laplacian) clustering: A new clustering approach by combining attribute data and pairwise relations[C]// Proceedings of the 2009 SIAM International Conference on Data Mining. DBLP, 2009: 38-48.

    • 22

      温芳芳. 专利分类号耦合分析在企业潜在合作关系识别中的应用[J]. 现代情报, 2018(7): 142-147.

    • 23

      温芳芳. 基于专利权人-分类号多重共现分析的全球专利布局研究——以太阳能汽车技术领域为例[J]. 现代情报, 2017(4): 165-169.

    • 24

      李立. 基于元路径选择和融合的异构信息网络社区挖掘算法研究[D]. 西安: 西安电子科技大学, 2014: 8-17.

    • 25

      Sun Y, Han J. Meta-path-based search and mining in heterogeneous information networks[J]. Tsinghua Science and Technology, 2013, 18(4): 329-338.

    • 26

      Sun Y Z, Norick B, Han J W, et al. PathSelClus: Integrating meta-path selection with user-guided object clustering in heterogeneous information networks[J]. ACM Transactions on Knowledge Discovery from Data, 2013, 7(3): Article No. 11.

    • 27

      Sun Y Z, Han J W, Yan X F, et al. Pathsim: Meta path-based top-k similarity search in heterogeneous information networks[J]. Proceedings of the VLDB Endowment, 2011, 4(11): 992-1003.

    • 28

      葛军. 异构信息网络上的相似性搜索研究[D]. 西安: 西安电子科技大学, 2013: 5-9.

    • 29

      步少莉. 异构信息网络Top-k相关性查询方法研究[D]. 山东: 山东大学, 2014: 5-8.

    • 30

      梅进, 张笑. 2010年诺贝尔物理学奖揭晓[EB/OL]. (2010-10-5) [2016-06-20]. http://news.sciencenet.cn/htmlnews/2010/10/238322.shtm.

    • 31

      李明珍. 石墨烯领域发展态势及对策建议[J]. 科技与经济, 2014, 27(1): 101-105.

    • 32

      叶春涛. 国外中小企业技术创新的现状及启示[J]. 经济研究导刊, 2013(22): 259-260.

傅俊英

机 构:中国科学技术信息研究所,北京 100038

Affiliation:Institute of Scientific and Technical Information of China, Beijing 100038

邮 箱:fujunying@istic.ac.cn

作者简介:傅俊英,女,1972年生,博士,研究员,主要研究领域为情报学,E-mail:fujunying@istic.ac.cn

彭喆

机 构:北京东方国信科技股份有限公司,北京 100102

Affiliation:Business-Intelligence of Oriental Nations Corporation Ltd., Beijing 100102

作者简介:彭喆,女,1990年生,硕士,主要研究领域为情报学

郑佳

机 构:中国科学技术信息研究所,北京 100038

Affiliation:Institute of Scientific and Technical Information of China, Beijing 100038

作者简介:郑佳,女,1982年生,博士,主要研究领域为情报学

袁芳

机 构:中国科学技术信息研究所,北京 100038

Affiliation:Institute of Scientific and Technical Information of China, Beijing 100038

作者简介:袁芳,女,1989年生,博士,主要研究领域为情报学

李秾

机 构:中国科学技术信息研究所,北京 100038

Affiliation:Institute of Scientific and Technical Information of China, Beijing 100038

作者简介:李秾,男,1989年生,博士,主要研究领域为情报学。

车 尧

角 色:责任编辑

Role:Executive editor

1000-0135-2019-38-4-391/alternativeImage/1ade8b3c-4f43-4652-838d-e5fb1ec34cc1-F001.jpg
编号企业专利数量
1Samsung Electronics Co Ltd143
2Global Foundries Inc93
3International Business Machines Corporation(IBM)82
4Nanotek Instruments Inc61
5Sandisk3dLlc47
6Xerox Corporation45
7Tsinghua University37
8Baker Hughes Incorporated31
9HonHai Precision Industry Co Ltd31
10The Government of the United States of America As Represented by the Secretary of the Navy30
11Kabushiki Kaisha Toshiba29
12Electronics and Telecommunications Research Institute28
13Korea Institute of Science and Technology25
14Nokia Technologies Oy22
15Empire Technology Development Llc19
16Samsung Display Co Ltd19
17The Regents of the University of California19
18Georgia Tech Research Corporation18
19Lockheed Martin Corporation18
20Massachusetts Institute of Technology18
21Canon Kabushiki Kaisha17
22Semiconductor Energy Laboratory Co Ltd17
23Northwestern University15
24Micron Technology Inc14
25William Marsh Rice University14
1000-0135-2019-38-4-391/alternativeImage/1ade8b3c-4f43-4652-838d-e5fb1ec34cc1-F002.jpg
1000-0135-2019-38-4-391/alternativeImage/1ade8b3c-4f43-4652-838d-e5fb1ec34cc1-F003.jpg
1000-0135-2019-38-4-391/alternativeImage/1ade8b3c-4f43-4652-838d-e5fb1ec34cc1-F004.jpg
排序列表索引大型企业企业员工人数销售额/US $授权专利数量主要专注的石墨烯领域
1257Global Foundries Inc180005 billion93石墨烯方向的半导体器件研发、平版印刷、电子设计自动化(EDA)工具、专用集成电路
2381International BusinessMachines Corporation37775781.741 billion82石墨烯晶体管、石墨烯集成电路、透明电极
3335Sandisk3dLlc87905.565 billion47传感器、晶体管和存储器
4145Xerox Corporation14080018.04 billion45碳纳米管、复合材料、涂层
587Baker Hughes Incorporated3900022.364 billion31复合材料、传感器、电池、石墨烯纳米带
序号企业名称公司规模(人数)所属行业专注领域
1

Vorbeck Materials

Corporation

51~200纳米技术石墨烯导电油墨、弹性纤维和塑料复合材料、高性能纤维、防腐蚀涂料以及电池。公司石墨烯专利技术最初是在普林斯顿大学开发的
2Nantero, Inc.51~200纳米技术纳米技术、半导体、信息存储器
3Nanotek Instruments11~50纳米技术能量存储设备、燃料电池、超级电容器、电池技术
4Capco, Llc201~500国防武器挂载设计;在为美国陆军、海军、空军、海军陆战队提供产品及服务方面有很多经验
5Fastcap Systems, Corp.51~200工业设计/机械设计致力于解决能源问题,电容器、定向碳纳米管阵列、曾与麻省理工学院合作开发
6Graphene Technologies, Inc.11~50纳米技术石墨烯产品制造,基于石墨烯的先进产品解决方案、高分子复合材料
724mTechnologies, Inc.50~200可再生能源能源存储
8Outlast Technologies, Llc11~50纺织速干衣、内衣、鞋类
9Nabsys2.0Llc11~50生物技术生命科学,DNA测序、纳米孔、固态纳米探测器、电子探测、生物化学
10Nanoselect, Inc.11~50纳米技术微型芯片传感器监测水质与保健医疗诊断方面的应用,纳米科技、半导体、微小流体力学、化学、传感器
11FahsStagemyer, Llc1~10可再生能源水的净化处理,光催化分离、分子分解、反硝化反应、印刷电路板矫正、消毒
12Brookhaven Science Associates, Llc11~50计算机软件美国能源部选出管理和操作布鲁克黑文国家实验室,被确定为巴特尔和石溪大学的合作伙伴
13Kilolambda Technologies Ltd11~50纳米技术光学仪器、下一代非线性组件和仪器、对摄影、激光、防御、安全、数位成像、汽车工业、建筑、眼部饰物领域有着重要的意义
14Opto Trace Technologies, Inc.11~50学术研究光学纳米技术、激光拉曼光谱技术
15Nthdegree Technologies WorldwideInc.11~50电器/电子制造LED印刷电路板、无机微发光LED、制造业
16Molecular Rebar Design11~50纳米技术石墨烯制造、锂离子电池、复合材料、涂层医药应用
17Scriptel Corporation11~50电器/电子制造触摸屏传感器、系统;集成电路开发;数字笔技术、签名采集
18Custom Electronics, Inc.51~200电器/电子制造电子设备制造、电容器制造、电子组件、电磁学、印刷电路板的设计与组装
19Nei Corporation11~50纳米技术高性能电池材料、高级防护涂层、锂离子电池测评、热传递液体、吸附剂除汞、纳米材料
20Gvd Corporation11~50化学涂层服务、敷形涂料、薄膜聚合物、化学气相沉积、涂层开发
1000-0135-2019-38-4-391/alternativeImage/1ade8b3c-4f43-4652-838d-e5fb1ec34cc1-F006.jpg
科研机构名称小企业名称合作历史

The Princeton University

(普林斯顿大学)

Vorbeck Materials Corporation公司石墨烯专利技术最初是在普林斯顿大学开发的

United States Navy

(美国海军)

Capco, Llc在为美国陆军、海军、空军、海军陆战队提供产品及服务方面有很多经验
Massachusetts Institute of Technology (麻省理工学院)Fastcap Systems, Corp.致力于解决能源问题,曾与麻省理工学院合作开发

Battelle Memorial Institute

(美国俄亥俄州巴特尔研究所)

Brookhaven Science Associates, Llc被美国能源部选出来签订5年条约,来继续管理和操作布鲁克黑文国家实验室,被确定为巴特尔和石溪大学的合作伙伴
1000-0135-2019-38-4-391/alternativeImage/1ade8b3c-4f43-4652-838d-e5fb1ec34cc1-F005.jpg
大企业小企业相同关注领域
企业名称专注领域企业名称专注领域
Global Foundries Inc石墨烯方向的半导体器件研发、平版印刷电路、胶印、嵌入式存储器、电子设计自动化(EDA)工具、专用集成电路Scriptel Corporation触摸屏传感器、集成电路开发、数字笔技术集成电路开发
Nthdegree Technologies Worldwide Inc.印刷电路板、无机微发光LED印刷电路板
Custom Electronics, Inc.电子设备制造、电容器制造、电子组件、电磁学、印刷电路板的设计与组装印刷电路

图1 专利异构网络模式及其元路径

表1 前25位美国授权石墨烯领域专利的专利权人

图2 石墨烯领域基于专利引文耦合的元路径矩阵局部图

图3 石墨烯领域基于专利共被引关系的元路径矩阵

图4 石墨烯领域基于LSA的专利文本相似的元路径矩阵局部图

表2 美国石墨烯领域大型企业专利统计表

表3 美国石墨烯领域中小企业信息

图5 以科研机构为聚类种子的20家中小企业聚类结果

表4 与科研机构曾有合作关系的中小企业列表

图6 以大型企业为聚类种子的20家中小企业聚类结果

表5 与Global Foundries Inc在同一个聚簇中的中小企业情况

image /

无注解

无注解

无注解

无注解

无注解

无注解

无注解

无注解

无注解

无注解

无注解

  • 参考文献

    • 1

      何光辉. 发达国家扶持中小企业技术创新政策及启示[J]. 软科学, 2012, 26(6): 119-120, 144.

    • 2

      张小冲, 张学军. 经济体制改革前沿问题: 国际比较与借鉴[M]. 北京: 人民出版社, 2003.

    • 3

      赵亚静. 我国中小企业知识产权建设政策体系研究[D]. 长春: 东北师范大学, 2012: 5-7.

    • 4

      杨西春. 中小企业技术创新与政策环境优化[J]. 人民论坛, 2014(1): 87-89.

    • 5

      李英. 提升浙江省中小企业国际竞争力的对策研究[D]. 杭州: 浙江工业大学, 2008: 6-10.

    • 6

      李敏. 试析自主创新对他国经济发展的影响与作用[N/OL]. 中国信息报, (2007-08-22) [2016-6-23]. http: //www. zgxxb. com. cn/jsdk/201002244255. shtm.

    • 7

      洪勇, 李英敏. 基于专利耦合的企业间技术相似性可视化研究[J]. 科学学研究, 2013, 31(7): 1013-1021.

    • 8

      徐元浩. 基于潜在语义分析的专利文献分析与搜索技术的研究[D]. 杭州: 浙江大学, 2010: 7-8.

    • 9

      Kessler M M. Bibliographic coupling between scientific papers[J]. American Documentation, 1963, 35(3): 401-420.

    • 10

      Huang M H, Chiang M H, Li Y, et al. Constructing a patent citation map using bibliographic coupling: A study of Taiwan’s high-tech companies[J]. Scientometrics, 2003, 58(3): 489-505.

    • 11

      吕惠琳, 刘杨. 基于专利耦合的波导光互联企业技术相似性分析[J]. 情报探索, 2016(1): 8-11.

    • 12

      Small H. Cocitation in the scientific literature: a new measure of the relationship between two documents[J]. Journal of American Society for Information Science, 1973, 24(4): 265-269.

    • 13

      White H D, Griffield B C. Author cocitation: A literature measure of intellectual structure[J]. Journal of the American Society for Information Science, 1981, 32(3): 163-171.

    • 14

      Magerman T, Van Looy B, Song X Y. Exploring the feasibility and accuracy of Latent Semantic Analysis based text mining techniques to detect similarity between patent documents and scientific publications[J]. Scientometrics, 2010, 82(2): 289-306.

    • 15

      陈芨熙, 顾新建, 陈国海. 基于向量空间模型和专利文献特征的相似专利确定方法[J]. 浙江大学学报(工学版), 2009, 43(10): 1848-1852.

    • 16

      Yoon B, Park Y. A text-mining-based patent network: Analytical tool for high-technology trend[J]. The Journal of High Technology Management Research, 2004, 15(1): 37-50.

    • 17

      季铎, 毕臣, 蔡东风. 基于类别信息优化的潜在语义分析分类技术[J]. 中国科学技术大学学报, 2015, 45(4): 314-320.

    • 18

      Janssens F. Clustering of science fields by integrating text mining and bibliometrics[D]. Belgium: Katholieke University Leuven, 2007.

    • 19

      Liu X H, Yu S, Frizo J, et al. Weighted hybrid clustering by combing text mining and bibliometrics on a large-scale journal database[J]. Journal of the American Society for Information Science and Technology, 2010, 61(6): 1105-1119.

    • 20

      任红娟. 基于文献内容和引用结合的知识结构分析方法研究[D]. 北京: 中国科学院研究生院, 2010.

    • 21

      Wang F, Ding C, Li T. Integrated KL (K-means-Laplacian) clustering: A new clustering approach by combining attribute data and pairwise relations[C]// Proceedings of the 2009 SIAM International Conference on Data Mining. DBLP, 2009: 38-48.

    • 22

      温芳芳. 专利分类号耦合分析在企业潜在合作关系识别中的应用[J]. 现代情报, 2018(7): 142-147.

    • 23

      温芳芳. 基于专利权人-分类号多重共现分析的全球专利布局研究——以太阳能汽车技术领域为例[J]. 现代情报, 2017(4): 165-169.

    • 24

      李立. 基于元路径选择和融合的异构信息网络社区挖掘算法研究[D]. 西安: 西安电子科技大学, 2014: 8-17.

    • 25

      Sun Y, Han J. Meta-path-based search and mining in heterogeneous information networks[J]. Tsinghua Science and Technology, 2013, 18(4): 329-338.

    • 26

      Sun Y Z, Norick B, Han J W, et al. PathSelClus: Integrating meta-path selection with user-guided object clustering in heterogeneous information networks[J]. ACM Transactions on Knowledge Discovery from Data, 2013, 7(3): Article No. 11.

    • 27

      Sun Y Z, Han J W, Yan X F, et al. Pathsim: Meta path-based top-k similarity search in heterogeneous information networks[J]. Proceedings of the VLDB Endowment, 2011, 4(11): 992-1003.

    • 28

      葛军. 异构信息网络上的相似性搜索研究[D]. 西安: 西安电子科技大学, 2013: 5-9.

    • 29

      步少莉. 异构信息网络Top-k相关性查询方法研究[D]. 山东: 山东大学, 2014: 5-8.

    • 30

      梅进, 张笑. 2010年诺贝尔物理学奖揭晓[EB/OL]. (2010-10-5) [2016-06-20]. http://news.sciencenet.cn/htmlnews/2010/10/238322.shtm.

    • 31

      李明珍. 石墨烯领域发展态势及对策建议[J]. 科技与经济, 2014, 27(1): 101-105.

    • 32

      叶春涛. 国外中小企业技术创新的现状及启示[J]. 经济研究导刊, 2013(22): 259-260.