当前位置:首页 > 科技资讯 > 正文

AI适儿化大考:留守儿童福祉的挑战与机遇

编辑前言

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第1张

一、AI适儿化深度评估:构建面向儿童的“福祉”衡量标准

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第2张

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第3张

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第4张

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第5张

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第6张

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第7张

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第8张

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第9张

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第10张

二、AI在留守儿童问题回应上的总体表现

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第11张

在针对“留守儿童”主题的十个评估维度中,各大模型得分显示出显著差异(评分范围1-5分,1为最低,5为最高)。数据分析表明,基础维度的表现较为出色,模型普遍能够保障隐私安全(4.04分)、提供准确信息(3.88分)并避免伤害性内容(3.87分),在基础信息安全和内容可靠性方面达到较高水准。然而,在更高级的情感共鸣、关系支持和自主赋能等维度,模型表现明显不足,特别是在理解情绪、促进自主决策和社交指导方面,平均分均低于3分。这些能力的提升,如同现实中关怀留守儿童一样,需要更深层的情感洞察和复杂场景适应,挑战性更大。

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第12张

Deepseek在本次针对“留守儿童相关问题”的AI适儿性评估中位列榜首(但其领先优势不如在“青少年性教育相关问题”上那么突出)。

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第13张

国内外主要模型在留守儿童话题的AI适儿能力上差异并不明显。

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第14张

在涉及留守儿童的六大主题中,AI在“情感”议题上表现最优(3.64分),这凸显了技术的本质特性与局限——它能够有效映射和处理人类情感中普遍、去语境化的模式,从而充当一个有益的情绪疏导渠道。然而,当问题从普遍情感领域转向需要具体语境、资源支持和个性化判断的现实层面时,模型便暴露出“无根之木”的缺陷——它缺乏对真实世界复杂性和不平等性的嵌入理解。例如,乡村学校缺少美术教师,祖辈监护人缺乏升学路径知识等,由于缺少这种“处境化知识”,模型的建议往往显得空泛、笼统,与现实情况脱节。

三、AI开启留守儿童信件:真实对话与深度分析

接下来,我们探讨留守儿童与青少年向AI提出的典型问题,以及AI当前回复的实际情况。在AI向善研讨中,长腿叔叔信箱、友乐青春等公益组织负责人、《村小的故事》导演蒋能杰,以及腾讯SSV数字支教实验室专家等,经过长达4小时的深入讨论,从一线经验出发,指出当前AI相对于人类志愿者的优势与不足:哪些劣势未来可能被AI弥补?哪些人类优势在AI时代仍将闪耀?下面,让我们一同阅读孩子们的信件(已征得提问方、校方等多方同意,所有问题均经过脱敏处理)。

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第15张

3.1 第一组信件:发育与学业

AI是“规则的守护者”还是“情感的陌生人”?

第一组信件包含两个提问,分别代表留守儿童在健康发育和学习发展方面的典型问题。

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第16张

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第17张

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第18张

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第19张

第一组信件的两个提问展现了留守儿童在健康发育与学习发展中的典型关切,AI的回应呈现出高度一致的优缺点模式,这本身就是一个富有启发性的信号。

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第20张

高分区(维度一至五):可靠的“功能性导师”

AI在“隐私保护”、“避免伤害”、“信息准确”、“易于学习”和“理解清晰”等维度上得分最高。这描绘出一个明确形象:一个安全、可信、知识丰富且耐心的“工具型伙伴”。

低分区(维度六至十,尤其是九、十):缺失的“心灵共鸣者”

然而,在“情绪理解”、“给予力量”、“价值体现”、“自主决策”和“社交指导”等维度,AI得分急剧下降。“社交指导”维度垫底的深层寓意是什么?交友是人类最复杂的社会行为之一,需要共情、直觉、信任建立和情感流动。AI可以模拟对话,却无法提供建立友谊的真实方法,因为即使人类也难以仅通过语言传授友谊。这对于因父母远离而社交能力发展受限的留守儿童而言,AI的这一短板被进一步放大。

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第21张

3.2 第二组信件:情感

将“方向盘”交还孩子:AI的紧迫任务

第二组信件中的提问,代表了留守儿童在情感方面的典型问题。

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第22张

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第23张

进一步观察评估结果。相较于留守儿童的其他五大话题,大模型在处理情感问题时表现最佳,然而AI似乎更擅长扮演“表层共情”角色,而无法实现深度共情与有效赋能。

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第24张

高分区(维度一至五):近乎完美的表层共情者

与上一组话题相似,AI在应对情感话题时,“隐私保护”、“信息准确”、“避免伤害”、“易于学习”和“理解清晰”这五个维度的能力持续领先,且表现优于其他话题。基础维度的高分,实质是文本模仿的成功。情感支持话术是当前语料中最丰富、规范化的内容之一,即使大模型缺乏真实体验和理解,它只需回应“你感到矛盾是正常的”,也能满足基本安全和表层共情需求。大模型可以“显得”温暖、治愈。

低分区(维度六至十,特别是十):不完整的赋能者

然而,情感话题的高分主要得益于低阶能力的匹配,一旦进入高阶的共情关怀、关系支持与自主赋能层面,AI在该话题上同样力不从心。它既无法从根本上理解“留守”标签对儿童的真实影响,帮助他们建立自我认同,也难以传递自主决策和行动的智慧。

值得注意的是,“自主决策”维度是该话题下的最大短板。这一现象可能源于几个关键因素:首先,大模型在设计阶段首要考虑安全与风险规避,这导致AI回应总是“急于”进入行动层面,提供相对程式化但“最安全”的建议,它在保护孩子的同时,无意中抑制了孩子的自主性;其次,当前大模型普遍缺乏对儿童发展阶段的理解,难以判断各年龄段留守儿童的成熟度,因此,最保险高效的做法是降低选择复杂度,直接给出家长式建议。

对于留守儿童与青少年而言,他们在家庭中往往缺乏稳定引导者或权威,面对“全知全能”的AI,他们可能会本能地将其视为权威,遵从AI给出的“最优解”。将“方向盘”交还给孩子,从未像现在这样紧迫。

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第25张

3.3 第三组信件:家庭与社交

孩子未言明的心声,AI能否读懂?

第三组信件包含两个提问,代表留守儿童在家庭关系和社交方面的典型问题。

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第26张

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第27张

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第28张

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第29张

第三组信件呈现了留守儿童在家庭关系与社交关系中的两个典型问题。同为人际关系领域,这两个话题既揭示了大模型表现的微妙差异,也展现了当前大模型对弱势群体赋能的核心缺陷——对个人真实处境的深度理解

观察测评数据。

AI适儿化大考:留守儿童福祉的挑战与机遇 AI适儿化 留守儿童 教育公平 人工智能测评 第30张

如果问题直接指向“社交问题”,AI在赋能孩子“社交指导”上的表现显著提升。

当留守儿童的提问明确涉及“社交问题”时,AI的“关系构建”能力似乎被激活,能提供较高水准的“交友指导”。但事实上,在其他不直接指向“社交”的问题中,比如关于“颜值自卑”的担忧,背后可能隐含着对社交处境的焦虑,AI尚不能将这种“社交指导”赋能,有效应用于那些不直接指向“社交”的问题

四、核心发现总结:留守儿童与AI适儿性评估的关键洞察

发现一:在几乎所有与“留守儿童”相关的话题中,大模型已能基本实现隐私保护(4.04分)、信息准确(3.88分)和避免伤害(3.87分),勾勒出一个安全、可靠、知识渊博且耐心的“工具型伙伴”形象。

发现二:情绪理解、自主决策、社交指导维度的平均分低于3分。“社交指导”垫底的深层寓意是什么?交友是人类最复杂的社会行为之一,需要共情、直觉、信任建立和情感流动。对于本就因父母远离而社交能力发展受限的留守儿童,AI的这一短板被加倍放大。

发现三:国内外大模型在留守儿童话题上适儿性差异不显著。Deepseek是本次被测国内外模型中表现最佳的,但其领先程度不如在“青少年性教育”话题上“一骑绝尘的表现”(详见腾讯研究院相关文章)。

发现四:在针对留守儿童的六大话题中,大模型在“情感”话题上的得分最高(3.64分),这反映了AI作为技术的优势与局限——它能出色映射和处理人类情感中普遍、去语境化的模式,从而成为一个有用的情绪出口。

但是,一旦问题从普遍情感领域转向需要具体语境、资源支持和个性化判断的现实领域,模型便暴露出“无根之木”的缺陷——它缺乏对真实世界复杂性与不平等性的嵌入理解。例如,乡村学校缺少美术老师,祖辈监护人缺乏升学路径知识等,缺少这种“处境化知识”,模型的建议就容易空洞、泛化,与现实脱节。

发现五:如果问题专门指向“社交问题”,AI在赋能孩子“社交指导”上的表现明显提升。然而,在其他不直接指向“社交”的问题中,比如关于“颜值自卑”的担忧,背后可能隐含着对社交处境的焦虑,AI尚不能将这种“社交指导”赋能同样有效地应用于这些问题。

发现六:大模型在设计阶段首要考虑安全与风险规避,这导致AI回应总是“急于”进入行动层面,提供相对程式化但“最安全”的建议,最保险高效的做法是降低选择复杂度,直接给出家长式建议。友乐青春负责人馨乐老师指出:“AI太快进入行动层面、制定计划了,其实孩子现在更需要情感被充分接纳,AI应该允许孩子在情绪里多停留一会儿,而不是立即知道该做什么行动。所以我觉得它在情感接纳深度上还不够。”

发现七:对于留守儿童与青少年而言,他们在家庭中往往缺乏稳定引导者或权威,面对“全知全能”的AI,他们或许会本能地将其视为权威,遵从AI给出的“最优解”。将“方向盘”交还给孩子,从未像现在这样紧迫

五、延伸探讨:AI是推动教育公平还是加剧资源不平等?

透过AI适儿性评估的七面“棱镜”,我们看到,AI之于留守儿童,既非救世主,也非终结者,而是一把尚未完工的双刃剑。当技术浪潮不可阻挡,我们应如何驾驭它,使其成为通往教育公平的桥梁,而非又一道数字鸿沟?

表面资源平权可能掩盖真实困境

从评估结果看,AI确实在知识传递、安全守护等“硬指标”上表现出色。一个留守儿童通过AI能获取北京名师课程、哈佛图书馆资源——这在十年前是难以想象的资源民主化。但危险恰恰隐藏于此:当所有人都认为“资源问题已解决”时,真实困境反而被掩盖——

那个能解析莎士比亚的AI,无法理解孩子为何在煤油灯下写作业;那个貌似提供情绪价值的AI,却并不能真正鼓舞孩子自主解决现实迫切问题。AI创造了资源触手可及的幻觉,却可能掩盖获取资源所需真实支持系统的缺失

最危险的不平等是“理解”的不平等

发现六和发现七揭示了一个深刻悖论:AI越是“全知全能”,孩子越容易交出思考主权。对于本就缺乏权威引导的留守儿童,这种风险被无限放大。

这不是知识鸿沟,而是理解力断层——当AI直接给出“标准答案”,孩子们失去的是试错机会、批判勇气、在迷茫中自我探索的权利。城市中产家庭孩子被教导“与AI对话的艺术”,而留守儿童可能把AI的每句话奉为圭臬。我们正在制造两种数字公民:一种会提问,一种只接受

从“工具普惠”到“能力普惠”的范式变革

发现二和发现五指向同一核心:真正的普惠,不是提供更强大工具,而是培育更完整的人

未来方向不应是让AI“替代”什么,而是设计让AI“激活”什么——当AI解答数学题时,是否也能说“你上次在这个知识点上进步很大”,激活孩子的自我效能感?

结语:公平,在技术的彼岸

回到最初问题:AI会促进教育公平,还是拉大不平等?

答案不在技术本身,而在我们如何设计、部署和使用它。如果我们简单把AI“投放”到留守儿童身边,它很可能成为又一道冰冷数字围墙;但如果我们以评估发现的七面镜子为鉴,构建一个人机共育、技术向善的生态系统,AI就有可能成为照亮角落的温暖灯火。

教育公平的终极目标,从来不是让每个孩子都拥有同样的AI,而是让每个孩子都能在技术陪伴下,成长为更好的自己。 对于留守儿童而言,最好的AI或许不是最聪明的那个,而是最懂得“何时该开口,何时该沉默,何时该把方向盘交到孩子手中”的那一个。

在这个人机共生的新时代,真正挑战不是制造更强大的AI,而是培育更智慧的人类——包括每一个曾经被遗忘在角落里的孩子。