PaperAgent 前天 18:01
知识增强大语言模型与传统搜索引擎用户感知信息价值对比研究
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本研究对比了以文心一言为代表的知识增强大语言模型与百度搜索引擎在不同任务复杂性和信息获取场景下,用户感知信息价值的差异。实验结果显示,在准确性、客观性等指标上,文心一言总体表现更优,但在提供参考来源方面,百度搜索更胜一筹。针对不同任务复杂性,两者在感知价值上存在交互影响,而在旅行、健康、科学等信息获取场景下,差异不显著。研究建议知识增强大语言模型优化表达、强化场景化细节、建立参考来源机制;传统搜索引擎则需优化交互、强化知识图谱、完善信息来源评估。

💡研究背景:以ChatGPT和文心一言为代表的AIGC技术迅速发展,但在用户感知信息价值方面缺乏与传统搜索引擎的对比研究。

🎯研究目的:通过实验探究在不同任务复杂性和信息获取场景下,用户使用文心一言和百度搜索后的感知信息价值差异,为两类工具的优化设计提供参考。

📊核心发现:总体而言,文心一言在准确性、客观性等感知信息价值指标上表现更优,但百度搜索在提供“参考来源或链接”方面更具优势。在不同任务复杂性下,两者的感知价值存在交互影响,而在不同信息获取场景下,差异不显著。

📝优化建议:知识增强大语言模型应优化语气表达,强化场景化细节和个性化推荐,并建立可靠的参考来源机制;传统搜索引擎则需改进检索交互体验,强化知识图谱构建,并完善信息来源的可信度评估和可视化标注。

⚠️研究局限:研究中的信息获取场景和实验平台有限,且未考虑工具、任务复杂性、场景的三重交互作用,未来的研究可以进一步扩展感知信息价值的指标体系。

2025-11-07 15:19 湖北

一、研究背景与目的

以 ChatGPT、文心一言为代表的知识增强大语言模型的出现,使得人工智能生成内容(AIGC)迅速跻身于互联网信息生成领域,弥补了专业生成内容(PGC)和用户生成内容(UGC)的不足。当前学界多关注 AIGC情境下的用户信息行为、信息质量等议题,但缺乏从用户感知信息价值角度对AIGC进行测度与评价,也缺少与传统搜索引擎的对比研究。 本研究选取文心一言(知识增强大语言模型)与百度搜索引擎(传统搜索引擎)为研究对象,通过实验探究不同任务复杂性、不同信息获取场景下,用户使用两种工具后的感知信息价值差异,为两类工具的优化设计提供参考。

二、文献综述

(一)信息价值与信息质量信息价值是衡量信息重要性和有用性的标准,具有多维性、主观性等特征,信息质量是其核心构成。准确性、客观性、相关性、完整性等评估指标被频繁的提及与应用。,且可从用户感知视角进行测度。现有研究多聚焦传统搜索工具的信息价值评估,尚未涉及 AIGC 与传统搜索引擎的对比研究。

(二)信息检索任务复杂性任务复杂性对用户信息搜索行为、结果应用行为及情绪有显著影响。随着任务复杂性提升,用户信息需求增加,搜寻成功率可能下降。然而,现有研究多关注传统搜索情境,尚未涉及大语言模型场景下的任务复杂性问题。

(三)信息获取场景信息获取场景是影响用户信息行为的关键因素,健康型、旅行型、研究型是常见的场景类型。已有研究聚焦于传统搜索工具用户在不同场景下的信息行为差异,但大语言模型与传统搜索引擎用户在不同场景下的感知信息价值对比尚属空白。

三、研究设计

(一)研究假设H1:用户使用文心一言和百度获取信息后,在感知信息价值上存在差异。 H2:面对复杂性不同的任务,用户使用两种工具获取信息后在感知信息价值存在差异。 H3:在不同信息获取场景下,用户使用两种工具获取信息后在感知信息价值存在差异。

(二)研究变量感知信息价值:选取准确性、客观性、相关性等 13 项指标,采用 Likert 7 分量表测量。 任务复杂性:分为简单任务(答案唯一、明确)、复杂任务(答案需整合验证)、开放式任务(结果多元开放)三类。 信息获取场景:设置旅行型、健康型、科学型三类场景,对应 9 项具体任务。

(三)实验对象与步骤实验对象:52 名被试,均有百度搜索和文心一言使用经验,专业背景分布广泛。 实验步骤:被试随机分为两组,分别使用两种工具完成 9 项任务;实验前填写基本情况问卷,实验中录屏记录过程,实验后填写感知信息价值测度问卷,共回收 468 份有效问卷。

四、实验结果

(一)信息获取工具对感知信息价值的影响用户在准确性、客观性、相关性等 7 项指标上存在显著差异(p<0.05):文心一言在准确性、客观性等 6 项指标上得分更高,百度搜索在 “参考来源或链接” 指标上得分更高(4.085 vs 2.201)。 在可行性、语气措辞等 6 项指标上,两种工具无显著差异(p>0.05)。

(二)信息获取工具与任务复杂性的交互影响简单任务:百度在准确性、客观性等 8 项指标上感知价值更高,两者在新颖性、启发性上无显著差异。 复杂任务:两种工具在 10 项指标上感知差异不明显。 开放式任务:文心一言在准确性、客观性等 10 项指标上表现更优。 共性:所有任务类型中,百度在 “参考来源或链接” 指标上均优于文心一言。

任务复杂性x信息获取工具变量均值图

“参考来源或链接”下信息获取工具x任务复杂性均值图

(三)信息获取工具与信息获取场景的交互影响在旅行型、健康型、科学型场景下,两种工具在 13 项感知信息价值指标上均无显著差异(p>0.05),即两者在以上场景中均能满足用户基本信息需求。

五、研究结论与优化建议

(一)研究结论用户使用文心一言或百度获取信息后,在准确性、客观性等7 项感知信息价值指标上存在显著差异,其余指标无差异。 不同任务复杂性下,除语气措辞、原创性外,用户使用文心一言或百度获取信息后,在其余 11 项指标存在显著差异。 不同信息获取场景下,用户使用文心一言或百度获取信息后,在所有 13 项指标均无显著差异。

(二)优化建议知识增强大语言模型:优化语气措辞的拟人化表达;强化场景化细节呈现与个性化推荐;建立参考来源机制,引入人工审核保障权威性。 传统搜索引擎:优化检索交互体验,支持口语化提问;强化知识图谱构建,精炼呈现核心信息;完善信息来源可信度评估与可视化标注。

(三)研究局限信息获取场景与实验平台有限,未涉及细分垂直场景。 感知信息价值指标体系可进一步扩充,如加入结果组织性等指标。 未考虑工具、任务复杂性、场景的三重交互作用。

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AIGC 知识增强大语言模型 传统搜索引擎 用户感知信息价值 信息检索
相关文章