1 引言 随着大数据、区块链、云计算等数智技术的飞速发展,数智时代已然来到。数智时代的核心特征是数据、算力和算法综合赋能以助推现实世界变革发展,而一直受益于信息技术和情报技术两大关键技术交融重塑并产生价值增值的情报工作[1],也正借助数智技术实现知识推理和决策服务的全链路和多场景应用,并逐步走向专深化、多元化和智慧化。 但与此同时,数智化的快速推进也导致信息源杂乱无序、数据量持续飙升、数据存储结构日益复杂、数据老化速度愈发加快,致使“数据海啸”与“知识饥渴”的矛盾凸显,情报筛选与价值识别的难度加剧。在此背景下,传统情报服务模式已经难以满足用户对快速响应、精准分析和高效决策的服务需求。因此,情报工作积极拥抱数智技术以适应时代变革已成为必然趋势[2]。 今天,人工智能(Artificial Intelligence,AI)作为数智时代的关键技术,正在引领各行业的智能化变革。情报行业也不例外,情报工作应对数智技术的挑战,核心是构建“AI for情报”的体系和方法。因此,本文以AI为立足点,通过梳理数智时代情报工作面临的挑战,剖析情报工作应用AI的领域范畴和关键技术,并通过构建基于情报智能体的技术体系,探讨如何利用情报智能体的高效数据采集、信息处理、知识发现和决策支持能力,来解决数智时代情报工作面临的核心挑战,为实现数智技术特别是AI技术与情报工作相互增益、助推情报工作提质增效提供支撑。 2 数智时代情报工作面临的挑战 数智技术的迅猛发展在推动情报工作创新突破的同时,也使其面临前所未有的复杂性。技术迭代加速与信息生态变革的双重压力下,情报工作的目标、对象、方法和服务模式均需系统性重构。这里主要从技术驱动、用户需求、信息形态、方法转型和服务适配五个维度,剖析当前情报工作亟需应对的核心挑战。 2.1 信息技术快速发展带来的挑战 情报工作自诞生之日起就显现出与技术之间的高亲和度和强耦合力,其借助信息技术与情报技术的交融渗透加速嬗变,情报范式得以深层次转变,服务生态得以全方位重塑,情报流程得以数智化变迁。 在信息技术应用的早期,情报工作主要集中于工作过程的自动化,情报系统通过预设规则和专家知识模拟情报人员的思维方式为情报工作赋能,如自动化文献编目和计算机情报检索。此后,随着信息技术的发展,情报工作的重点转向了利用网络、数据库和文本数据实现信息向知识的转化以及对信息资源的深度加工[3]。机器学习模型如SVM和LDA被引入以解决丰富多样化的用户需求与传统文献组织分析效率低下之间的矛盾。而深度学习技术如BERT的崛起和应用,使得情报工作正向更深层次、全方位的智慧化服务方向转型。但随着数据量呈指数级增长,传统技术逐渐暴露三大局限:①规则驱动系统难以应对非结构化数据的复杂性;②静态模型难以适应动态情报场景的演变速度;③单任务处理机制割裂了情报价值链的整体性。不难发现,在当前情报环境呈现数据维度、空间维度、时间维度和认知维度等“四维复杂性”特征的现实约束下,传统技术体系在情报采集、信息处理、知识发现、决策支持等核心环节陷入困境。 2022年底,ChatGPT等大模型的出现,带来了集信息检索、获取、处理及情报生成于一体的人智协同新机制,深刻冲击乃至改变了知识生产模式和情报获取方式。以往重复性高但创新性弱的琐碎人工工作,例如翻译、综述、摘要、标引、检索等很可能被AI取代,仅仅掌握基本信息技能难以承担情报产品的设计工作,情报人员需要具备高效驾驭模型的能力,深刻理解用户需求、精准洞察情报数据、深度提炼检索问题并定制化创建交互体验[4]。 因此,在数智时代新质生产力战略下,如何积极拥抱大模型等AI技术,通过目标驱动与数据驱动的范式融合以实现智慧化转型,通过强化学习使模型定期迭代优化以适应复杂情报场景,通过将专家经验编码为可执行认知图谱以实现人机协同进化,进而拓宽情报工作服务范畴并确保其稳定发展,已经成为当前面临的迫切问题。 2.2 用户需求专深化的挑战 情报服务工作归根结底是对用户需求的精准感知和具体响应。数智时代,用户获取信息的渠道日益多样化,信息获取变得更加便捷。用户的信息素养显著提升,大多数情况下能够轻松获取所需信息,因此对信息服务的要求也相应提高。例如,用户现在可以依赖搜索引擎、社交媒体、专业数据库等多种渠道获取信息,而不仅仅是通过传统的情报服务。这种变化对情报服务的“耳目、尖兵”功能提出了新的更高要求。 一方面,传统被动式的情报服务已难以满足需求,需要转变为主动服务。主动服务要求情报机构能够快速、精准地理解用户需求,特别是通过提前感知用户需求,主动生成用户需要的情报产品。在用户提出具体要求时,能够零时滞地提供所需信息。另一方面,提供的情报内容必须更加精准和具有针对性,帮助用户直接解决问题,而无需用户再进行二次选择,避免增加用户的信息负担。 另一方面,当前的生成式检索系统虽然能够快速生成答案,但面临信息过载和价值密度不一的问题,且静态知识库与动态情报需求之间存在时间差,导致生成的情报与用户实际需求匹配度不高。例如,在处理金融情报、经贸情报、科技情报等专业性强的领域问题时,生成式检索系统可能因训练语料的不完备和不准确,生成逻辑通顺但存在错误或偏差的内容,这不仅不符合用户实际需求,甚至还可能产生误导,引发信息焦虑,增加用户的认知负担。上述难题对情报服务挖掘信息数据的使命提出新的更高要求,情报机构需要确保用户需求和情报供给之间的平衡,帮助用户从海量信息中挖掘高价值知识,提供结果性描述及辅助性信息,全面展示数据挖掘过程,提升数据公正性,减少黑箱影响。