1 引言 近年来,随着国家大力推进“互联网+医疗健康”[1],我国互联网医疗平台得到了迅猛发展。据统计,截至2022年6月,我国在线医疗用户规模达到3亿,占网民整体的28.5%[2],更多患者选择在线寻医问诊,互联网医疗成为健康中国建设的突破口和新增长点[3]。然而,由于医疗知识门槛高、医疗平台的医生数量庞大且各有所长,患者往往面临着无法从海量医生库中找到合适医生的难题[4]。例如,截至2023年7月,好大夫在线(haodf.com)平台拥有注册医生27万名,如何从中找到合适的医生对患者而言变得非常困难。 在线医生推荐成为缓解该困难的有效方法[5]。借助于在线医生推荐系统,平台基于患者基本病情、医生专业领域及医患间交互等信息,为患者推荐合适的医生[6,3,7]。以机器学习模型为基础的基于内容的推荐方法和基于协同过滤的推荐方法是目前主流的推荐方法。研究者根据患者就诊记录,通过分析不同医生的表现、预约和接待信息,为患者推荐与其历史就诊医生相似的医生;或结合患者咨询文本和患者评分信息,推荐同一疾病类中,具有成功诊治类似病例经验的医生[8,9]。随着深度学习的发展,学者提出了一系列基于深度学习的协同过滤方法,用于在线医生推荐[10]。 虽然基于深度学习的推荐系统可以取得准确率高的结果[11-13],但是,学习过程本质上是一个从数据中进行归纳推理的过程,任何的深度学习模型都有不确定性,这可能源自数据本身的缺陷,也可能来自模型假设的错误,还可能来自模型求解的偏差[14]。深度学习模型固有的不确定性可能导致“致命的自负”,即只关注模型准确率的表现,而忽略推荐结果的置信度[15]。相较于一般的商品推荐,医生推荐在可靠性上有着更高的要求。然而,受这种不确定性的影响,基于深度学习模型的医生推荐方法将会产生不合适的推荐结果,最终可能引起误诊或错失最佳治疗时机,给患者带来巨大的痛苦甚至危害其生命安全。因此,如何考虑深度学习模型不确定性,为患者推荐合适的医生,成为理论和实践亟需解决的关键问题。 为解决上述问题,本文基于贝叶斯学习、深度学习和协同过滤思想,结合结构化患者反馈与非结构化医患文本数据,提出考虑深度学习模型不确定性的医生推荐方法。具体而言,本文提出多模态贝叶斯神经协同过滤模型(multi-modal bayesian neural collaborative filtering,MM-BNCF),该模型基于蒙特卡洛Dropout构建贝叶斯深度学习模型,将结构化患者反馈与非结构化医患文本数据作为输入,通过贝叶斯深度模型分别得到医生与患者表征;然后,模型基于贝叶斯深度模型分析医患双方匹配度,并评估医患匹配的不确定性,最后基于匹配度均值生成推荐结果。基于好大夫在线真实数据上的实验表明,本文提出的MM-BNCF模型能够更有效地适用于在线医生推荐。 本文创新性体现于以下两点:首先,提出了一种评估多模态深度学习推荐模型不确定性的方法。虽然多模态深度学习推荐模型已得到了广泛的应用,并取得了优异的效果,但是,其固有的不确定性问题尚未充分探索。本文融合多模态神经协同过滤模型,首次提出评估多模态深度学习推荐模型不确定性的方法,在方法上具有创新性。其次,本文首次在医生推荐领域考虑模型不确定性。虽然已有研究提出很多种不同的医生推荐方法,但是,既有研究均忽略了医生推荐过程中的不确定性问题。本文提出考虑不确定性进行医生推荐,在领域内具有创新性。 2 相关研究综述 2.1 在线医生推荐 在线医生推荐是指在互联网医疗平台中,基于患者具体病情、医生专业领域及医患间交互等信息,为患者推荐适合的医生[6,16,7]。鉴于在线医生推荐能够有效缓解患者的信息过载问题,目前学者们已对此展开广泛研究,并提出了基于内容的推荐和基于协同过滤的推荐等医生推荐方法。 基于内容的推荐方法利用患者或医生自身描述,根据患者历史就诊记录,为患者推荐与其历史就诊主治医生相似的医生。Huang等[17]提出了以曾经就诊过的医生、相同科室的相似医生、相同医院的相似医生为序列的推荐框架。熊回香等[18]基于患者咨询文本,通过Word2Vec模型和余弦相似度生成相似患者的医生推荐集合,通过TF-IDF、Word2Vec模型和余弦相似度等方法生成相似医生的医生推荐集合,最后结合这两个推荐集合生成最终的推荐列表。虽然此类方法简明直观,但未能充分利用医患交互信息。同时,该类方法易产生“信息茧房”问题[19],无法为患者推荐其他合适的医生,从而引发医疗资源分布失衡,不利于互联网医疗平台的长远发展。 基于协同过滤的推荐方法通过计算患者或医生间相似度作为权重,然后计算患者评分的加权平均,由此预测目标患者对特定医生的匹配程度,并基于此进行推荐[9]。Iftikhar等[20]通过调查问卷咨询患者在7个维度上对治疗方案的喜好,使用协同过滤方法,结合患者偏好及患者间的相似性,生成医生的个性化推荐。随着深度学习的兴起,研究者将深度学习与协同过滤思想结合,提出基于深度学习的协同过滤方法[21,22],通过神经网络模型分析患者和医生的表征,计算患者-医生匹配得分,预测医患匹配度。Yan等[10]构建了深度学习(卷积神经网络)模型,从非结构化的患者评论和医生信息中学习表征,使用概率矩阵分解方法分析结构化的患者评分信息,并结合非结构化与结构化的信息预测医患匹配度,从而生成医生推荐结果。该模型基于好大夫在线的真实数据展现了优异的性能。