机械荟萃山庄

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 53|回复: 0

国产大模型面对老年人的提问

[复制链接]

2万

主题

2万

帖子

19万

积分

超级版主

Rank: 8Rank: 8

积分
195545
发表于 昨天 10:28 | 显示全部楼层 |阅读模式
截至2024年底,我国60 岁及以上人口达3.1 亿(占总人口的22.0%),其中1.56 亿老年网民已深度参与数字生活。
研究者在上海的浦东新区、杨浦、宝山、青浦四个城区,共访谈40 位60-80 岁老年人(男性16 人,女性24人)。
向参与者提供安装豆包、文小言、腾讯元宝、Kimi、通义、讯飞星火、DeepSeek 等7 款国产大模型(将其随机标记为A-G)。
在征得同意后,将大模型应用安装在老年人手机上,确保安装时随机更换应用图标的排序,由每位老年人自主决定使用顺序。
在三个月里,研究者们每隔两周就会回访一次老人们。总结出来了老年人对 AI 提问的特点。

1.提问过了,还是喜欢搜索
相当一部分老年用户在试用大模型后,仍会回归传统的搜索引擎作为主要信息获取工具。
超半数(22 位)受访者在首次尝试后会逐渐减少提问频率,18 位受访者平均在三次交互后反而表示更加认可搜索引擎。
许多老年人将“提问”与“搜索”视为两种性质不同的信息获取行为。
受访者M2 将搜索比作“查字典”,将提问视为“问别人”。
对于老年人而言,搜索行为似乎更符合他们熟悉的“关键词—结果”即时反馈模式,而提问需要等待系统响应,且存在“答非所问”的风险。
“搜一下马上出结果,问它还得等回复,太麻烦。”(受访者F14)
老年人认为向搜索引擎提问得到的结果可通过页面陈列直观呈现,他们得以快速扫描筛选有效信息。而大模型的文本回复是经过筛选且包含复杂解释的答案。
受访者M13 抱怨:“(百度里)搜‘高血压饮食’能看到几十条,它却只说几条,还不如百度全。”
当大模型未能展现出超越搜索引擎的效率优势,提问便会失去动力。

2.本地化知识,还不如我自己和家门口保安知道得多
提出一般性知识类问题时,老年人对大模型的回应较为满意且会展开后续对话。
但大模型的在地化知识明显受到质疑,老年人普遍对大模型就本地化问题给出的回答感到不满意(如错误的公交路线、过时的信息),认为还没有家门口保安和自己知道的多。
他们认为,如果大模型只能回答一些简单的生活知识,还不如自己直接搜索答案,特别是现在手机上的各类本地化小程序足以满足他们的日常生活需求,由于不清楚大模型到底能帮到他们什么,老年人进而不愿意和大模型继续交互。

3.口语交流多,打字输入少
在研究的40位老人中,有33位在第一次使用时,毫不犹豫地选择了语音输入。
一位爷爷说:“我们这一代人,没怎么学过拼音,在屏幕上划半天,出来的字还不对。”
相比之下,说话,是他们用了一辈子的、最熟悉、最自然的交流方式。
曾用了十年非智能手机的受访者M10 将语音交互视为电话听筒的延伸:“以前打电话,现在对着机器说,不用看字,我就没有那种紧迫感。”

4.要简洁,不要复杂布局
你打开一些APP,是不是经常被满屏的“热门话题”、“猜你喜欢”给淹没?
对老年人来说,这简直是一场灾难。
共计18 位受访者表示过多的系统推荐会引发“信息恐慌”。
受访者F15 面对满屏的“热门问题”“功能推荐”时抱怨:“跟菜市场似的,逛一圈反而忘了自己要买啥。”
老年人的阅读习惯呈现显著的“线性扫描”特征,即先逐行读完页面既有内容,再决定操作路径,复杂布局则会导致注意力分散。
“这么多字,眼睛都花了,不看又怕错过重要信息,看完了想问啥呢我也忘了。”(受访者F7)
遵循“少即是多”原则的简洁界面更易激活老年人的提问行为。
面对界面相对简洁的大模型D,受访者普遍认为自己的提问启动速度有显著提升。(这大模型D明显就是deepseek)
受访者M5对仅有输入框和语音按钮的界面评价道:“一眼就知道该干啥,不像那些花里胡哨的,逼着人想太多。”
这种设计策略暗合老年人的“减法认知策略”,他们倾向于在清晰的交互锚点(如居中的输入框、显眼的麦克风图标)中定位自己的行为角色,而冗余信息会被视为“需要过滤的噪声”而引发老年人的反感与烦躁。
“年纪大了,脑子装不下太多选择,给个明白的地方让我知道怎么用就行。”(受访者F3)

5.把AI当成一个“有温度的交流对象”
这种现象,在学术上被称为“准社会互动”——你明知他是假的,但情感上已经把他当成了一个真实的朋友。
老年人对AI的礼貌,就是这种“准社会互动”的完美体现。
他们会不自觉地放慢语速,一位伯伯解释说:“怕它(AI)听不清,理解不了我的话。”
受访者F2在询问失眠问题时,尾音总带着试探的上扬:“最近总是睡不好,其实很烦躁,你有啥好建议吗?”
他们说话充满了“嗯…”“那个……”。
受访者F6 在提出核心问题前铺垫了大量的语气词作为缓冲:“嗯……我想问问啊……就是那个……血压高的人能不能经常吃鸡蛋?”
这种看似低效的语言表达,实则是一种老年人缓解紧张、应对认知延迟的策略。对于老年人而言,提问时使用带有停顿式功能的语气助词是他们延展思路和进行深度思考的体现。
“说得太快怕它听不懂,中间停一下,也给自己想想词。”(受访者F3)
他们对 AI 超级有礼貌, “请问”、“麻烦你”、“谢谢”是最高频的词汇。
受访者M6 的首个问题是:“麻烦你告诉我,冬天高血压患者需要注意什么?”
退休工程师受访者M12 将大模型视为“装在手机里的百科全书”:“它掌握的知识比我多,请教专家自然要客气。

7.陌生领域先试探,熟悉范围直接问:
老年用户的提问策略表现出明显的领域依赖性,在陌生领域会先迂回试探以评估模型能力,而在熟悉领域则直接提问以提升效率。
受访者M7 询问用药建议时先提及:“我老伴儿说这个季节就是容易失眠,她说的对不?”
这种“情境铺垫+核心问题”的结构既是对大模型理解能力的试探(“先说点别的,看看它能不能听懂”),也是现实社交中“先拉近关系再提需求”的习惯迁移。
但在自己足够熟悉的知识范围内,老年人的提问策略呈现出直入主题的结果导向。
如受访者F7 在询问公交线路时直接问:“去中山医院怎么坐车?”
这种简洁提问源于对高频需求的自信。当问题涉及日常生存刚需(如就医、缴费),老年人倾向于省略冗余表述而直奔主题。
无论采取哪种策略,老年人都在潜意识地进行“社交成本”计算,迂回提问是为了避免暴露无知,直入主题则是依赖经验储备带来的安全感。
这种双重逻辑本质上是老年人对人机对话“风险—收益”的本能评估,既想获取有效信息,又要维护交流中的自我形象。

8.喜欢中文名的、外表可爱的AI
在你开始和一个人聊天前,他的名字和长相会影响你对他的第一印象。对于AI来说,也是一样。
产品的命名策略与图标设计的拟人化程度,通过文化可供性与想象可供性,显著影响老年用户的初次交互意愿与心理接受度。
大模型A不仅通过中文名带来语言亲近感,更通过具象化的视觉意象(如圆润的字体、拟人化的卡通头像)构建出“能听懂话的小朋友”形象,而使用英文名称的大模型D则因认知疏离感被默认为“需要特定能力才能使用的专业软件”。(这大模型D明显是deepseek)
受访者F23 看到大模型 时会心一笑:“这个名字蛮好,像家里刚出锅的豆馍,我还挺好奇的。(这大模型A明显就是豆包)
受访者F14 在选择大模型A而非大模型D时直言:“洋名字念不出口,我也不会念,万一喊错了别人会笑我。”
受访者F17 对着大模型G面露难色:“太深奥了,不知道该问它什么,我连它的名字都不会读,感觉要懂英文才能对话。(这大模型G明显是kimi)
大模型A凭借拟人形态图标(如戴围巾的卡通头像、微笑表情)被28 位受访者理解为“会说话的小人”,这种视觉符号也完美匹配了他们对“人工智能”的想象。
受访者M3 指着图标说:“你说大模型我不懂,但你让我看到是这样有鼻子有眼的东西,我就知道这是电视里演的人工智能了。”
大模型C采用的抽象图标则引发了认知困惑。“如果你让我自己选,我可能不知道它是干什么的,应该也不会用它。”(受访者F12)(国产大模型APP图标哪个不抽象,除了豆包是采用卡通人像作图标之外)




回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|机械荟萃山庄 ( 辽ICP备16011317号-1 )

GMT+8, 2025-10-27 08:56 , Processed in 0.091944 second(s), 19 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表