0 引言 改革开放四十多年,特别是党的十八大以来,我国不断完善科技创新体制机制,基本形成覆盖全面、门类齐全、工具多元的科技创新政策体系。从国家层面依据创新驱动发展战略目标发布的大量政策文件,到地方根据国家要求和精神出台的相关政策措施,共同构成了一个庞大的科技创新政策体系。同时,随着国家和社会的科技创新投入不断增强,科技创新活动不断深入,各类科技创新产出数据日益丰富。例如,以论文、专著为载体的文献数据,以专利、技术标准为载体的技术数据,以技术合同交易额、专利实施率、市场占有率和产品规模为指标的成果转化数据,以及政策实施过程中的人才、项目、平台基地、科研仪器设备等基础条件数据等。这些数据不仅反映了政策对各类科技创新活动的影响,也是衡量政策产出和实施效果的基础,更是科技创新政策分析的重要依据和有效证据。 现有科技政策分析主要从领域、主题、地域、府际等方面展开,侧重于政策演化分析[1]、政策量化评价[2-3]、政策工具分析[4-5]、政策府际关系[6]等,并从政策计量学、公共管理、科学学等多个学科视角[7],探索了科技创新政策分析的理论模型和工具方法等;而国内外相关政策服务平台则主要提供政策文本集成、检索、浏览等基本服务,扩展了政策专题组织、可视化计量分析服务等。然而在政策分析数据的采集、处理方面大多各行其是,主要从大量分散的政务公开文本和网络开源数据中获取[8],缺乏对数据的颗粒化处理,没有对海量数据形成系统化的、规模化的、集中式的、标准化的组织和挖掘,数据可复用性不高,没有形成集成化的政策分析软件、工具和平台,更无法支撑模式化、面向多主体多场景的政策分析需求,不能顺应智能化、大数据化、自动化的政策分析趋势。因此,需要构建面向政策分析的大数据支撑体系,借助大数据、云计算、人工智能等技术方法,统筹现有资源,统一集成、汇聚形成多来源、多类型、多模态政策数据,推进政策资源的大规模、集中式、标准化、平台化数据治理,满足科技创新政策制定者和科技创新主体的多样化需求,提升政策分析附加值[9-10]。这样,既能建立基于海量政策文本的大数据语料库,形成科技创新实施效果的事实型投入产出指标库,推进科技创新政策分析基础数据资源建设;又能基于大数据计算重塑政策分析方法,构建政策分析标准、工具、算法和模型,强化政策分析的数据基座、方法论体系和应用场景。 1 科技创新政策分析内涵及其大数据特征 随着全球科技竞争越发激烈,世界主要国家纷纷调整科技创新政策目标,丰富政策工具,优化政策生态,国家间科技竞争实质上演变成科技创新制度及其政策的竞争。科技创新政策不仅关系到科研资源分配效率、科技资助方向和前沿科技突破效果,更成为科技大国博弈的主要阵地。科技创新政策分析贯穿于政策制定、执行和反馈的全过程,可以分解为定义、描述、预测、评价和对策等步骤。通过剖析政策要素、过程和结果,客观全面地展示政策绩效、预期、偏好、效果等,以实施政策监测、预测、评估和提出建议,为政策解读、宣讲、调整、优化、监督和落实提供依据,增强决策的预期性和科学性。因此,科技创新政策分析不仅是对过去政策的归纳和诊断,更是对未来政策的指导和判断;它既是洞悉科技施政不确定性、不稳定性和复杂性的重要方法,又是跟踪和评估政策执行力、协同力和满意度的有效手段。此外,它也是把握政策链与创新链、产业链、人才链深度融合的有效工具,是构建政策知识服务平台的重要措施。其本质上是对“事实—数据—信息—知识—情报”等信息链的揭示,开展政策需求分析、信息组织、文本计量、效果评估和方案建议等科技情报研究过程,以履行“耳目、尖兵、参谋”的职责[11]。 自2005年时任美国科技政策办公室主任约翰·马伯格倡议将科技政策研究发展为“科技政策学”[12]、2006年美国国家科学基金会启动“科学与创新政策科学”研究计划以来,科技创新政策分析逐渐从注重政策过程转向以科技创新过程、要素和措施为中心,并围绕多源异构大数据展开多学科分析。例如,从情报学视角,推进政策文本计量研究和战略情报研究;从公共政策学视角,探索复杂性公共政策的行为、模拟、实验和预测研究;从创新经济学视角,评估科技政策的投入产出效率;从循证医学视角,推进“基于证据或数据”的政策分析新模式[13]等。在此过程中,围绕政策制定、执行、评估和修订过程,推进技术性数据管理与社会性政策科学的交叉融合,聚焦于将海量数据转化为可供决策的“情报”,围绕科技创新政策的全流程分析、全数据挖掘、全主体服务、全方位评价和全时空推演,发展基于科技创新活动全生命周期的政策分析范式。作为一种大样本数据发现过程,科技创新政策分析涉及的数据量大,包括各类政策文本数据、政策实施数据和创新产出数据等大数据资源;涉及的数据类型多样,包括结构化数据、非结构化数据以及半结构化数据[14];涉及数据来源渠道广泛,数据分布在不同的地理位置、系统或平台上,并且数据会随时间发生变化。因此,科技创新政策分析需要利用智能算法、强大的数据处理平台和新的数据处理技术,来跨地域、跨系统、跨领域地实时处理、整合、统计和分析大规模的数据[15],保证数据的准确性和可靠性。在此基础上,从大量不相关的各种类型数据中,呈现政策文本重点内容,识别政策施政重要主题,梳理政策演化及发展规律,检验政策执行效果,发现政策文本存在问题,并对政策做出预测和调整[16]。由此可见,科技创新政策分析既贯穿政策问题、议程、制定、执行、评估和反馈等一系列政策流程,又具备大数据分析的海量、泛在、融合、动态等特性,需要借助大数据的资源、方法、技术、平台和工具,支撑和赋能科技创新政策分析流程、模式和场景,推进基于大数据的政策分析范式的形成。