[目的/意义]“从0到1”型技术融合是新兴技术的种子或萌芽,文章聚焦“从0到1”型技术融合的预测方法研究,为技术前瞻布局提供支撑。[方法/过程]利用专利数据,用专利分类号表征技术,用专利分类号的首次共现表征“从0到1”型技术融合,建立技术融合预测特征体系,采用机器学习方法,开展预测方法研究。[结果/结论]研发机构特征和动态时序特征的引入显著提升了预测效果,结合4类动态时序特征(语义特征、研发机构特征、网络邻居特征以及中心性特征)、训练模型采用随机森林模型得到的预测模型效果最优,其F1值达到91.08%,体现了创新主体行为、技术发展的动态性以及技术间关系的演变对技术融合的促进作用,为理解技术融合的内在机理、研发智能技术预测工具提供了参考依据。
图1 技术融合类型划分 从实际的创新决策需求看,“从0到1”型技术融合和“从1到N”型技术融合都有较高的关注价值,相对而言,“从0到1”型技术融合更具意想不到性,对于新技术布局和创新决策具有现实意义,本文主要关注这类融合现象的预测。现有研究多采用专利分类号表示技术,通过专利分类号的共现关系来表示技术融合关系。基于这些思想,本文将“从0到1”型技术融合界定为两个原本独立、没有交集的专利分类号第一次发生共现的现象,以此开展“从0到1”型技术融合预测模型研究,并通过对现有预测工作采用的方法、特征的总结和拓展,研究新特征对于预测结果的影响。通过研究,本文尝试回答如下问题:①“从0到1”型技术融合预测模型的构建应该考虑使用哪些特征、使用何种模型,如何构建效果最优;②引入新特征是否能够提升模型预测效果。 1 相关研究进展 构建精准的技术融合预测模型的关键在于预测方法和特征的选取,本文对于现有研究中采用的技术融合预测方法和特征进行了梳理,以下详细论述。 1.1 技术融合预测方法 当前,技术融合研究多以专利分类号的共现关系表示技术融合关系,预测研究的核心是对专利分类号未来是否会发生共现进行预测。归纳来看,技术融合预测研究采用的方法主要有链路预测、时间序列预测和机器学习方法三类,如表1所示。
第一类是基于技术融合网络来预测网络中未链接技术节点产生链路的可能性,这种预测方法主要是基于技术融合网络的网络结构特征相似性,采用如链路预测等复杂网络方法开展预测工作,如Y.Park等[14]基于专利引证关系构建知识流动网络,采用链路预测方法预测潜在引证关系,基于此进行技术融合趋势预测和技术机会发现;J.H.Cho等[15]利用CN指标、Salton指标、Jaccard指标等链路预测指标进行融合趋势预测;Feng等[13]利用RA(Resource Allocation)指标、王宏起等[12]采用Katz链路预测指标进行预测。 第二类是基于技术融合网络中分类号对的历史共现数据预测未来共现的可能性,这种预测方法主要是基于历史数据采用统计学模型来拟合历史数据,进而预测未来的融合趋势。例如,J.Kim等[18]基于专利引证关系,采用DSM(依赖结构矩阵)识别关键融合技术,采用神经网络方法拟合历史数据来预测融合趋势;李树刚等[19]基于技术融合关系时间序列,采用ARIMA时间序列预测模型(整合移动平均自回归模型)预测感知人工智能技术的融合趋势。 第三类是同时利用多种特征训练机器学习模型进行趋势预测,如T.S.Kim[20]等利用IPC共现对的CN等链路预测指标、计量学指标以及文本相似性指标作为特征,采用支持向量机、神经网络等机器学习模型来构建融合预测模型;张金柱等[21]利用专利分类网络结构特征与文本语义特征,基于关联强度的网络结构相似性特征、基于中心度的网络结构相似性特征以及基于文本表示学习的语义相似性特征,采用随机森林模型预测形成技术融合关系预测方法;还通过专利分类序列的网络特征学习和分类关联文本语义表示来预测技术融合趋势[22]。