当下,快速发展的大模型技术持续引领着创新的潮流,并为千行百业带来了变革。在科技期刊领域,大模型以其出色的内容理解、数据分析、文本生成等功能,为内容组织、筛选、生产乃至传播带来了质的提升和效率的增强。[1-2]然而,如何利用好大模型技术,驾驭其推动产业的整体升级发展,并带来长久利益,国内对此的研究尚不深入。[3]此外,作为大模型技术基石之一的数据,科技期刊界该如何正确评估自身数据的价值,如何面对大模型技术带给业界的挑战并积极应对是亟须探讨的议题。[4-5] 笔者在中国知网等平台以“大模型/生成式人工智能+数据资产+科技期刊”为关键词进行检索后,未发现相关学术成果,但通过“出版+数据资产”等关键词检索,可以发现业界已对数据资产和预训练相关的责权利问题有部分研究。[6-9]笔者认为,面对大模型时代的新挑战,业界要敢于突破技术惯性和传统价值观念,从深度和广度等多方向探讨科技期刊数据资产的价值识别与管理、数据脱敏与隐私计算、数据智能生态与激励设计、人工智能伦理规范等各方面问题,为加速融合前沿技术、开拓科技期刊的新视界打下坚实地基。本文基于“中国科协大模型技术对中国科技期刊发展的影响分析及对策”课题对国内几十家机构的实地调研及专家访谈,并结合中华医学会杂志社在数据资源开发与利用方面的实践经验,通过阐述科技期刊数据资产在大模型技术背景下的价值、面临版权挑战和收益,从积极拥抱前沿技术和加速资产变现角度探讨科技期刊如何开展有效的知识标注和数据管理以提升内容价值和专业潜力,更好地支持大模型训练和知识服务类产品的研发,提出针对科技期刊数据资产管理、利用和交易的对策建议,期望为科技期刊的政策制定者和行业实践者提供决策支持与参考,共同推动人工智能时代科技期刊行业的持续健康发展。 1 数据资产的内涵、评估方法及相关政策 数据资产最早由美国学者理查德·彼得森提出[10],并随着数据管理、数据挖掘和数字经济的发展而普及。和数据资产密切相关的概念还包括数据、数据资源、数据要素、数据治理、数据入表等,要想厘清数据资产的内涵,要将其和以上数据相关的概念一并研究。数据是指对客观事物或事件的性质、状态以及相互关系等记录并可以鉴别的符号。通过利用、挖掘可以产生价值的数据就是数据资源。而数据资产是指企业拥有合法控制权的,可以可靠计量的,未来能够带来明确经济利益流入的数据资源。数据资产的本质依然是资产,它指的是以数据为主要内容和服务的、满足资产确认条件的数据资源。将数据确认为企业资产负债表中的数据资产的过程称为数据入表。当数据资产作为生产要素参与到整个社会的数据市场、数字经济的交易流通,就转化为数据要素。 根据《数据资产评估指导意见》,数据资产的评估方法主要有成本法、收益法和市场法等[11],在执行数据资产评估业务时,需要关注影响数据资产价值的成本因素、场景因素、市场因素和质量因素。[12]其中,成本法的本质是重置成本法,指的是对被评估数据资产以特定应用场景开发为前提,通过溯源分析重新开发该数据产品可能发生的成本,并结合数据产品的实际情况进行调整。收益法指的是根据数据资产历史应用情况和未来应用场景,结合企业经营情况分析该资产经济利益流入情况,并重点考虑数据资产的贡献比例、相关风险等等。市场法需要考虑类似数据资产是否存在合法合规、活跃的公开交易市场,根据相关资产的特点选择合适的可比案例,并根据其中差异做相应调整。 近年来,我国在数字经济和数据资产管理领域连续推出重大举措。2021年12月,国务院发布了《“十四五”数字经济发展规划》,强调要坚持应用牵引、数据赋能,要充分发挥数据要素作用。[13]2022年12月,中共中央、国务院审议通过了《关于构建数据基础制度更好发挥数据要素作用的意见》(简称“数据二十条”),构建了数据基础制度体系、创新了数据产权制度、保障了效率和公平、强化了数据安全治理,对数据要素价值的释放具有里程碑意义。[14]2023年2月,中共中央、国务院印发了《数字中国建设整体布局规划》,阐述了数字中国建设的“2522”整体框架,在第一个“2”中提出了畅通数据资源大循环的要求,进一步明确有关数据要素的全方位管理体系和管理制度。[15]2023年10月,国家数据局成立,负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字经济、数字社会规划和建设。2023年12月,中央经济工作会议提出要加速人工智能和数字经济的发展。紧接着,国家发展改革委及国家数据局发布了《数字经济促进共同富裕实施方案》,突出数据在实现高质量发展中的作用。[16]2024年1月,财政部发布了《关于加强数据资产管理的指导意见》。[17]随后,国家数据局会同其他16个有关部门共同制订《“数据要素×”三年行动计划(2024-2026年)》,进一步明确了数据资产管理的方针和具体任务,揭示了数据要素在工业制造等领域的潜在应用。[18]这些政策和措施共同促进了数据资源的资产化和价值激发,为数字经济的发展提供了清晰的方向和强有力的支持。 2 科技期刊数据资产的定义与数据资源分类