DOI:10.12154/j.qbzlgz.2025.06.006 1 引言 2025年国务院《政府工作报告》强调要健全网络生态治理长效机制,其中网络虚假信息治理是关键一环[1]。国家互联网信息办公室的“清朗”行动将虚假信息及短视频乱象作为重点治理对象。截至2025年6月,我国短视频用户规模已达10.68亿人[2],短视频成为用户信息获取的核心渠道。但与此同时,近20%的网络谣言以包含短视频的形式传播[3]。部分用户通过操纵短视频“文本+音频+图像”等多模态内容结构以骗取流量[4]。基于流量池等短视频平台内容推送机制,用户对虚假多模态内容的信任及分享会进一步促进短视频传播,加速虚假短视频扩散与蔓延[5]。而信息操纵理论指出用户可基于不同方式操纵信息内容以实现欺骗目的,内容结构是信息操纵的重要方式[6]。为此,亟需从多模态内容特征出发,分析虚假短视频内容结构操纵如何影响用户分享意愿。 当前学界针对虚假信息的多模态特征展开了系列研究,主要关注图文虚假信息的多模态内容检测,涉及文本特征、图像特征、用户特征和社会特征等。学界也针对虚假信息操纵进行了研究,操纵类型涵盖信息真实性操纵、信道操纵、信息模态操纵、语义操纵等。但上述研究情境主要聚焦于微博、Facebook和Twitter等传统以图文为主的社交媒体平台,较少关注短视频情境下虚假信息的多模态特征,而短视频情境与其他传统社交媒体平台在内容模态、信息传播机理等方面存在显著差异。此外,当前研究较少关注内容结构操纵对用户虚假信息分享意愿的影响,而内容结构操纵下用户虚假短视频信任及分享意愿可能具有差异性。 本研究基于信息操纵理论,以“刺激-机体-反应”模型(Stimulus-Organism-Response Theory,SOR)为理论框架,构建虚假短视频情境下的“信息结构-感知可信度-用户注意力-用户分享意愿”模型。理论层面,拓展信息操纵理论至短视频情境,探究主次、因果、并列三种内容结构操纵下的用户分享意愿,揭示感知可信度经注意力影响分享意愿的机制。实践层面,从内容结构操纵视角深入剖析虚假短视频多模态内容,可对虚假短视频的虚假信息内容结构精准识别、平台管理与审核机制优化以及辟谣短视频内容结构设计提供参考,服务于短视频生态治理。 2 文献综述 2.1 虚假信息多模态特征相关研究 学界相关研究主要集中在虚假信息多模态特征的识别、检测与准确率优化,数据来源主要为微博和Twitter等平台上的多模态谣言检测数据集。关于多模态特征识别与检测,现有研究主要采用深度学习等研究方法,利用GNN、VGG-19、RESNET等神经网络抽取虚假信息的文本特征、图像特征和用户特征等,围绕融合注意力机制的多模态特征进行虚假信息的识别与检测。例如,张新生等[7]探究了融合文本和图像特征的AI生成谣言检测效果;付少雄等[8]识别了虚假短视频的文本、音频、图像及多模态关联特征。关于检测率优化,现有研究主要关注不同模态特征下虚假短视频检测率的提升。例如,陈志毅和隋杰[9]通过构建基于文本内容、图像及用户属性的多模态网络谣言检测模型将识别准确率从78.1%提升到80.3%;Xue等[10]通过提取视觉语义特征及视觉篡改特征,其实验数据集的检测准确率最高达到96.3%。 现有研究关注了图文模态下的虚假信息多模态特征检测,但缺乏对虚假短视频多模态内容结构特征的识别及检测研究。同时,现有研究多采用深度学习等计算机技术分析二手数据集,较少从用户视角探究多模态特征如何影响虚假短视频传播。为此,本研究以由多模态内容构成的虚假短视频为研究情境,采用混合研究方法,探究虚假短视频多模态内容结构操纵对短视频用户分享意愿的影响。 2.2 虚假信息情境下信息操纵相关研究 信息操纵理论由McCornack等[6]提出,用于描述以不同方式(如信息真实性、信息表达方式、信息相关性)操纵信息以实现欺骗目的,主要涉及信息内容的语义、结构与情境层面。学界目前基于虚假信息情境下的信息操纵展开大量研究,研究对象集中在Facebook、中国互联网联合辟谣平台、YouTube等平台的虚假信息,研究方法包含眼动追踪实验和脑电实验法等,结合动机推理理论、线索效用理论、ELM模型等理论,对信息真实性、信息模态、虚假信息类型等研究内容展开分析。例如,Mirhoseini等[11]采用脑电实验法探究了新闻标题的情感导向(控制、中性和极化)与新闻可信度间的关系;刘春年和陈梦秋[12]采用实验法探究了分享者信任度、观点及附加提示信息如何影响深度伪造类虚假信息的感知真实性及互动行为;付少雄等[13]基于信息操纵理论,从虚假信息语义层面剖析了杜撰、隐瞒、曲解、模糊、煽动五种操纵策略对用户信任的影响。 综上,虚假信息情境下的信息操纵相关研究常集中于纯文本及图文结构的社交媒体虚假信息,较少关注具有多模态特征的短视频虚假信息。相较于纯文本及图文结构下的虚假信息,融合多模态特性的虚假短视频更具隐蔽性,用户较难察觉与区分。此外,当前研究主要聚焦于信息质量、信息真实性及虚假信息类型等,较少关注虚假短视频的内容结构操纵。为此,本研究基于短视频情境,探究信息操纵中的多模态内容结构操纵如何影响用户注意力分布及其分享意愿,以扩展信息操纵理论的研究情境。 3 研究模型与假设 3.1 理论模型 “刺激-机体-反应”模型由刺激、机体和反应三部分组成,常用于探究社交媒体中的用户信息行为[14]。例如,付少雄等[15]基于SOR模型,围绕短视频情境,探究了警告标签的形式与内容如何影响警示效果,进而影响用户分享意愿。本研究情境下,刺激(S)维度特指虚假短视频多模态内容结构,包含主次、并列与因果结构关系;机体(O)维度特指感知可信度,即对不同内容结构刺激下的短视频感知准确性与感知一致性差异;反应(R)维度特指用户在观看不同内容结构刺激下的虚假短视频后,基于其内部心理状态所做出的决策行为,即用户注意力分布及用户分享意愿。其中,用户注意力通过文本注视次数及时长、图像注视次数及时长四个眼动指标测量。考虑到性别、年龄、学历、短视频使用经历(使用总年限、每日使用总时长、登录频率)对虚假短视频分享意愿的潜在影响,上述变量被设置为控制变量,整体研究模型见图1。