基于机器学习的“从0到1”型技术融合预测方法研究

作  者:

作者简介:
吕璐成(1989- ),男,博士,中国科学院文献情报中心副研究员,硕士生导师,中国科学院大学经济与管理学院信息资源管理系,研究方向:技术识别与预测,专利挖掘;赵亚娟(通信作者)(1975- ),女,博士,中国科学院文献情报中心研究员(北京 100190),博士生导师,中国科学院大学经济与管理学院信息资源管理系,研究方向:知识产权情报研究,E-mail:zhaoyj@mail.las.ac.cn(北京 100190)。

原文出处:
情报理论与实践

内容提要:

[目的/意义]“从0到1”型技术融合是新兴技术的种子或萌芽,文章聚焦“从0到1”型技术融合的预测方法研究,为技术前瞻布局提供支撑。[方法/过程]利用专利数据,用专利分类号表征技术,用专利分类号的首次共现表征“从0到1”型技术融合,建立技术融合预测特征体系,采用机器学习方法,开展预测方法研究。[结果/结论]研发机构特征和动态时序特征的引入显著提升了预测效果,结合4类动态时序特征(语义特征、研发机构特征、网络邻居特征以及中心性特征)、训练模型采用随机森林模型得到的预测模型效果最优,其F1值达到91.08%,体现了创新主体行为、技术发展的动态性以及技术间关系的演变对技术融合的促进作用,为理解技术融合的内在机理、研发智能技术预测工具提供了参考依据。


期刊代号:G9
分类名称:图书馆学情报学
复印期号:2026 年 01 期

字号:

  0 引言

  技术融合对于引导技术创新、洞察技术机会和新产品开发具有重要推动作用[1-2],深受政府管理层、产业界和学术界的关注。目前,技术融合研究开展的思路从采用数据角度可以划分为:基于论文数据[3]、基于专利数据[4]、基于标准数据[5]、基于Wikipedia百科数据[6]。其中,专利数据是公认的技术情报载体,具有结构化程度高、信息公开完备等优势,因此基于专利数据开展技术融合研究是目前的主流研究方向[7-8]。已有技术融合研究多侧重于讨论特定领域技术融合现象的测度分析,如区块链与人工智能[9]、IoT[10]等领域的技术融合现象。近年来,伴随着创新决策层和创新实体对于识别新技术和技术机会发现的强烈需求,技术融合的趋势预测问题愈发受到技术预测学者的高度关注,并形成了若干研究成果[11-12]。然而,较少研究对于预测对象进行细粒度的区分和探讨。

  本文借鉴Feng等[13]对技术融合对象的细分,结合技术融合过程将技术融合划分为潜在型技术融合(Potential Convergence,融合关系从无到有)和潜力型技术融合(Promising Convergence,融合关系从有到强)。具体地,将潜在型技术融合界定为“从0到1”型技术融合,指两个原本独立、没有交集的技术首次发生融合的现象,属于技术融合启动阶段,如图1上半部分所示,图中圆圈表示一项技术,技术对T1和T2在t时刻之前一直没有发生过关系,但在t时刻初次融合;将潜力型技术融合界定为“从1到N”型技术融合,指已经发生过融合的技术对融合程度随时间保持稳定或持续增强的现象,属于技术融合深化阶段,如图1下半部分所示,已经在t-n时刻发生融合的技术对T3和T4融合程度随时间一直持续增强或保持稳定。

  

  图1 技术融合类型划分

  从实际的创新决策需求看,“从0到1”型技术融合和“从1到N”型技术融合都有较高的关注价值,相对而言,“从0到1”型技术融合更具意想不到性,对于新技术布局和创新决策具有现实意义,本文主要关注这类融合现象的预测。现有研究多采用专利分类号表示技术,通过专利分类号的共现关系来表示技术融合关系。基于这些思想,本文将“从0到1”型技术融合界定为两个原本独立、没有交集的专利分类号第一次发生共现的现象,以此开展“从0到1”型技术融合预测模型研究,并通过对现有预测工作采用的方法、特征的总结和拓展,研究新特征对于预测结果的影响。通过研究,本文尝试回答如下问题:①“从0到1”型技术融合预测模型的构建应该考虑使用哪些特征、使用何种模型,如何构建效果最优;②引入新特征是否能够提升模型预测效果。

  1 相关研究进展

  构建精准的技术融合预测模型的关键在于预测方法和特征的选取,本文对于现有研究中采用的技术融合预测方法和特征进行了梳理,以下详细论述。

  1.1 技术融合预测方法

  当前,技术融合研究多以专利分类号的共现关系表示技术融合关系,预测研究的核心是对专利分类号未来是否会发生共现进行预测。归纳来看,技术融合预测研究采用的方法主要有链路预测、时间序列预测和机器学习方法三类,如表1所示。

  

  第一类是基于技术融合网络来预测网络中未链接技术节点产生链路的可能性,这种预测方法主要是基于技术融合网络的网络结构特征相似性,采用如链路预测等复杂网络方法开展预测工作,如Y.Park等[14]基于专利引证关系构建知识流动网络,采用链路预测方法预测潜在引证关系,基于此进行技术融合趋势预测和技术机会发现;J.H.Cho等[15]利用CN指标、Salton指标、Jaccard指标等链路预测指标进行融合趋势预测;Feng等[13]利用RA(Resource Allocation)指标、王宏起等[12]采用Katz链路预测指标进行预测。

  第二类是基于技术融合网络中分类号对的历史共现数据预测未来共现的可能性,这种预测方法主要是基于历史数据采用统计学模型来拟合历史数据,进而预测未来的融合趋势。例如,J.Kim等[18]基于专利引证关系,采用DSM(依赖结构矩阵)识别关键融合技术,采用神经网络方法拟合历史数据来预测融合趋势;李树刚等[19]基于技术融合关系时间序列,采用ARIMA时间序列预测模型(整合移动平均自回归模型)预测感知人工智能技术的融合趋势。

  第三类是同时利用多种特征训练机器学习模型进行趋势预测,如T.S.Kim[20]等利用IPC共现对的CN等链路预测指标、计量学指标以及文本相似性指标作为特征,采用支持向量机、神经网络等机器学习模型来构建融合预测模型;张金柱等[21]利用专利分类网络结构特征与文本语义特征,基于关联强度的网络结构相似性特征、基于中心度的网络结构相似性特征以及基于文本表示学习的语义相似性特征,采用随机森林模型预测形成技术融合关系预测方法;还通过专利分类序列的网络特征学习和分类关联文本语义表示来预测技术融合趋势[22]。

相关文章: