DOI:10.12154/J.QBZLGZ.2026.01.010 1 引言 以ChatGPT为代表的生成式AI技术的出现带动了用户和市场对生成式AI搜索产品的广泛关注,随后促生了Bing、文心一言和Kimi等生成式智能搜索引擎。这些智能搜索引擎将生成式AI技术与传统搜索引擎相结合,实现交互式问答搜索,重塑了信息搜索方式[1]。随着越来越多用户关注,生成式智能搜索已经成为新的主流搜索方式,响应教育、医疗和商业等多领域的多元需求[2]。尽管这类搜索引擎已被大量使用,但“黑箱式”的内容生成机制,使其搜索效果的量化评估成为亟待填补的研究空白。相较于传统搜索引擎通过链接列表呈现结果、用户自主判断信息相关性的模式,生成式智能搜索引擎直接输出整合后的结论,其背后的信息筛选、逻辑构建与内容生成过程缺乏透明性,这使得对其搜索效果的科学评估更具必要性与紧迫性[3]。 分层交互模型是信息检索领域解释用户—系统交互效果的核心理论框架,该理论指出用户与信息系统的交互涉及三个核心维度,即系统、任务和认知[4]。在系统维度,界面和技术特性是直接影响交互效果的基础载体,包括搜索引擎的特性、功能以及界面设计等[5]。在任务维度,不同任务类型对用户交互效果存在本质差异,例如事实任务相比探索任务的搜索效果更好[6]。在认知维度,通常认为场独立相比场依赖用户的搜索效果更好[7],但认知对信息检索的影响仍存在争议,因为不同情境下个体的认知风格可能呈现矛盾特征[8],并且部分研究指出,新型网络平台为用户提供了灵活获取多样化信息的便利,因此认知的影响效果不能一概而论[9]。学习风格作为用户认知特征的稳定表现形式,会通过信息接收偏好与反馈需求等路径显著影响搜索效果[10],不同学习风格用户在生成式智能搜索引擎中可能存在差异化的搜索行为和搜索效果。 现有针对生成式智能搜索的相关研究集中于对生成内容可信度和生成结果有效性的探索,仅有少量研究分析了不同任务类型对用户满意度的影响和不同认知风格对学习型搜索行为的影响,对用户搜索效果关注的缺失将难以支撑平台架构的系统性优化。因此,本文以分层交互模型为基础,从系统交互、任务交互和认知交互(以学习风格为个体认知差异)三个维度建立指标,分析其对用户搜索行为和搜索效果的影响,以期实现对生成式智能搜索引擎的深度评估,更好支持用户交互。具体而言,本文旨在调查以下研究问题:(1)生成式智能搜索引擎的系统交互如何影响搜索效果?(2)不同任务类型如何影响用户搜索行为和搜索效果?(3)不同学习风格如何影响用户搜索行为和搜索效果? 2 相关研究 2.1 交互信息检索模型 信息检索是图书情报学、人机交互学和心理学等各个相关领域的关注重点,基于对用户需求和检索情景的关注,学者们从信息检索交互的不同角度提出了信息检索模型。从信息寻求过程视角,Marchionini[11]的过程模型指出,用户在信息搜寻中会经历一系列子过程,并受到认知与心理因素的显著影响。而多片段信息搜索模型[12]进一步揭示了用户认知需求与任务理解状态的变化对搜索效果的关键作用。 在信息系统交互视角,分层交互模型[4]突出了系统表现对检索效果的影响。其理论源于“获取—认知—应用”框架,获取指信息获取,认知强调信息处理与吸收,应用则关注信息在具体情境中的使用。该模型包含表面层、交互层和情境层三个层次,表面层关注用户通过查询与系统界面的交互,交互层侧重用户认知状态对搜索结果的理解与解释,情境层则涵盖任务属性与信息需求变化对交互的影响。此外,分层交互模型同时从用户和系统两个维度进行阐释,用户层面关注查询行为与心理、情感、情境及任务属性带来的需求变化;系统层面则涉及工程架构、处理逻辑与内容符号表示等多重层次。由于该模型综合考量信息系统属性、任务属性与用户认知状态,因此为评估生成式智能搜索引擎提供了坚实的理论基础。 2.2 分层交互的搜索行为 2.2.1 系统与用户交互行为 交互设计是信息检索系统评估的重要方面,关系到用户对搜索结果的满意度和整体体验。搜索系统的评估主要包括三个关键要素:系统、资源和用户使用,相应形成了以系统为中心、以内容为中心和以用户为中心的三种评估思路[13]。其中,以系统为中心的评估关注界面设计、网站结构与信息组织、可访问性与系统性能等[5];以内容为中心的评估聚焦内容有用性、有效性、前沿性等[14];以用户为中心的评估则涵盖用户需求、期望、使用情景和系统对用户的影响等。随着人机交互研究深入,以系统为中心的交互设计得到广泛探讨。研究表明,搜索引擎界面的视觉呈现方式(如图文结合、增强型缩略图等)能提升用户相关性判断效率、缩短用户检索时间[15]。此外,良好的网页组织与充足的导航工具也能显著提升用户对系统的评价[14]。 2.2.2 任务与用户交互行为 基于任务的用户交互行为研究早已是人机交互领域研究的重点,以往研究的任务维度主要关注两类:客观搜索任务维度和主观搜索任务维度[16]。前者是不涉及用户特征的客观维度,后者是由任务特征和用户感知共同定义的维度,涉及搜索过程中用户与任务特征的交互。不同任务类型产生不同的交互行为:涉及无明确任务目标、结构不明确、高认知活动和不熟悉主题的搜索任务,往往会产生更活跃的搜索活动,包括更多的查询重构、更多的关键词、更多的点击量和更多的查询放弃等;而当任务目标清晰、结构明确时,用户的查询数量减少且多样性降低,通常会有时间更长、更具体的查询行为[17]。可见,任务类型不同,用户交互的特点也有差异。