当前位置：首页 > 科技资讯 > 正文

AI绘本的崛起：技术革新与商业新机遇

主机测评网
科技资讯
2026-01-15
426

2024年8月，一本由人工智能绘制的绘本《卡皮巴拉的自我修养》在微信读书平台上架，并迅速攀升至新书榜第五名。随着AI技术的进步，利用文本生成图像技术和人工智能协同创作绘本，已成为一种常见现象。

最近，人们只需通过自然语言描述所需故事，AI便能在短短一分钟内快速生成完整绘本，极大地降低了创作门槛。

今年夏季，Gemini推出了Nano banana模型，凭借其出色的角色一致性能力，引发了广大网友对AI图像生成的探索热潮。在该模型曝光前，Gemini AI已上线Storybook故事创作功能，用户仅需输入几句情节描述，AI即可自动生成包含10页图文内容的电子书，实现了从创意到成品的快速转化。

图像模型的不断完善，促使人们开始深入挖掘AI绘本的多样化应用。在短视频平台上，大量AI绘本视频涌现，这些视频常附有英文字幕和配音，标签设置为英语绘本、英语磨耳朵等，平均点赞量高达数千，部分视频数据甚至接近百万。点开这些博主的主页，往往可见启蒙绘本、英语绘本视频合集等购买链接，显示出潜在的商业价值。

AI绘本的崛起：技术革新与商业新机遇 AI绘本文生图技术角色一致性儿童教育定制第1张

AI一键生成的绘本能读吗？为什么这些略显抽象的幻灯片式视频能迅速走红？为了找到答案，我展开了深入的调研和产品试用。

成为绘本创作者，仅需一分钟

为了直观体验当前AI绘本技术的能力，我在Google Gemini中进行了一次测试。打开AI绘本功能，界面上出现了几条创作建议，引导用户快速上手。

AI绘本的崛起：技术革新与商业新机遇 AI绘本文生图技术角色一致性儿童教育定制第2张

我随手点击了第三个关于“小蜜蜂”的创意概述。等待不到一分钟，一个可翻页的电子绘本便呈现在眼前，过程流畅高效。

AI绘本的崛起：技术革新与商业新机遇 AI绘本文生图技术角色一致性儿童教育定制第3张

绘本共十页，讲述了一个名叫巴奇的小蜜蜂的故事。尽管提示词只提供了故事的大致轮廓，但AI生成的故事逻辑自洽：巴奇出门采蜜，遇到一朵无精打采的小花，采蜜后花儿重新抬起头，生动地表明了蜜蜂活动的益处。不过，不得不承认，AI生成的故事在吸引力和趣味性上有所欠缺，结构的“起承转合”也不明显，更偏向于“小故事大道理”的类型。

随后，我重点关注了“角色一致性”问题，这是过去AI绘本制作的最大痛点。

在Gemini生成的故事中，主角巴奇的造型整体保持得不错。虽然偶尔蜜蜂的造型和手部颜色会有细微出入，但完全没有出现“角色突变”那种令人诧异的硬伤。如果对画风不满意，操作也很简单，可以轻松调整。

当前漫画的“大眼萌”风格略带恐怖谷效应，于是我要求Gemini更改风格，新的绘本很快出炉，整体画风转变为宫崎骏动漫风格，展现了AI的灵活性。

AI绘本的崛起：技术革新与商业新机遇 AI绘本文生图技术角色一致性儿童教育定制第4张

图｜新的风格

除了点击推荐的指令生成故事绘本，我们还可以采用“先文后图”的方式。我用Gemini的文字AI功能生成了一个全新的故事脚本，再开启Storybook功能进行创作，实现了更个性化的控制。

经人工鉴别，AI生成的图画与脚本内容高度一致，显示出良好的图文匹配能力。

AI绘本的崛起：技术革新与商业新机遇 AI绘本文生图技术角色一致性儿童教育定制第5张

图｜新的绘本

在“一站式绘本”功能上线之前，我也尝试过使用多个大模型制作AI绘本，只能说这个过程需要相当的耐心和技巧。

AI创作绘本的核心在于文生图能力。从ChatGPT、DeepSeek等模型获取脚本仅是第一步，最难的环节是将脚本“喂”给文生图AI，并确保输出稳定。

如果一次性投喂长脚本，AI的多图生成能力不足，角色一致性较差，会导致“一人千面”的现象。因此，创作者需要将故事拆解成一页一页，反复修改提示词，祈祷AI能稳定发挥。如果还需要流畅的配音，更需多工具协同，调用音频AI，流程繁琐。

目前的模型“画”得越来越快，并且正在积极解决一次性生成连续故事的问题，提升了创作效率。

当然，“卷”故事绘本的不止谷歌。国内文生图模型也陆续升级，改善了多图生成的一致性问题，在生成连续故事的功能上有所完善。例如，字节跳动近期发布的AI图像生成模型Seedream 4.0，宣称其性能超越了谷歌的Gemini 2.5 Flash Image，能一口气免费输出最多20张差异化图像。这对批量生成AI绘本、视频分镜头脚本等场景至关重要。

我用相同的提示词进行了测试。该模型可以直接在豆包上使用，出图质量和图像稳定性也有所保证，只是在部分复杂图像中，角色形象仍不稳定，人像和动物特征偶尔混淆。

AI绘本的崛起：技术革新与商业新机遇 AI绘本文生图技术角色一致性儿童教育定制第6张

在这些“一站式平台”出现之前，不少AI自媒体博主将该场景拆分，兜售“AI绘本制作教程”。他们教导人们如何结合Midjourney等图像模型，再搭配ChatGPT、剪映，拼凑出一个完整的绘本。但这个模式软件切换繁琐、流程冗长、出图效果不稳定、使用成本高昂，创作依旧复杂，想要拥有自己的绘本故事仍然困难重重。

现在，只要给AI一个概述、大纲或脚本，它基本都能生成一个逻辑自洽的故事，并配上高度符合场景的图片，这使得AI绘本领域涌现出越来越多新的创意和可能性。

这个生意，卖的不是绘本

AI绘本的商业模式不止一种，但其初始形式和所有新兴AI技术一样，源自于一种对技术落地的焦虑和探索欲。

在社交平台，大量自媒体博主打出“AI学习”的标签，将AI绘本等技术作为“副业”的一部分进行推广。他们利用信息差，将精美的AI图片发帖“引流”吸引关注，再转化关注者为消费者，以19.9元等低价售卖文生图AI的插画提示词或教程等，实现了流量变现。

AI绘本的崛起：技术革新与商业新机遇 AI绘本文生图技术角色一致性儿童教育定制第7张

此外，部分博主直接将“AI绘本生意”作为宣传亮点，走的是AI卖课路线，通过教授技术应用来盈利。

我尝试联系了一个社交媒体账号，他们宣传称正在招募想要以AI绘本为副业的人。后来我加到一个企业微信号，对方自称“AI XX 老师”，发来链接和海报，要求当晚参与AI绘画技巧公开直播课，展示了典型的课程营销模式。

在AI绘本的应用中，人们除了最初的尝试，往往还有更具实用性的需求。例如短视频平台很火的英语绘本系列，主打的就是通过图文结合的方式帮助孩子更快地记住特定单词，体现了教育场景的融合。

另外，孤独症等特殊需求群体也值得关注。2024世界人工智能大会上，阿里通义展示了关照孤独症儿童的AI绘本工具“追星星的AI”。该工具可以生成常识认知、社交礼仪、心智解读和趣味故事这四类内容的绘本，并可设置3个层级的认知水平，展现了AI的人文关怀。

在儿童教育领域，AI绘本同样是一项有力工具。图文并茂的绘本可以激发小朋友的创造力和想象力，但目前市场上的传统绘本在主题上相对趋同，难以满足每一个家庭的个性化需求。

在社交媒体上，很多帖子在求助给孩子看的绘本推荐，也有批判绘本价值观充斥着刻板印象的避雷贴。一些家长希望孩子接触性别平等等更广阔的议题，担忧市面上“总在赞美妈妈勤劳，夸奖爸爸勇敢”的绘本难以起到正确引导和教育作用，这为定制化创作提供了空间。

AI绘本产品出现后，许多不会画插画的普通人能将自己的想象力和创造力落地，创作出属于自己孩子的定制绘本，实现了创作民主化。

这一定制需求，自然成为目前AI绘本的重要发展方向。在某平台，二十元一份的“AI十页绘本代做”卖出超200份。AI播客生成平台Listenhub也开发了AI绘本产品，该产品的诞生来源于公司CTO自己的需求。孩子太喜欢听故事，他便想到结合公司的AI音频能力，加上各大前沿图像模型，能够一键演绎故事，制作出有声绘本把想象传递给孩子。

AI+绘本产品童语故事的开发者则是在一次和女儿去乐园游玩的经历后，突发奇想将游玩的记录变成了绘本。女儿很喜欢，还送给了同学读，他之后便开发了这一绘本故事生成工具，提供给非专业内容创作者使用，降低了创作门槛。

随着一站式技术的完善，AI绘本的生成更加便捷，人们的需求也开始更加复杂和丰富。例如，Listenhub支持电子翻页绘本一键生成视频绘本；在童语故事小程序创作绘本时，家长能够在首页看到其他创作者的作品，在流程中可以选择孩子的年龄段，故事概要能使用AI推荐，画面风格和角色也都有很多选项。如果家长的思考并不完善，相关功能可以给予提示和帮助，提升了用户体验。

这些产品被投射的关注，来自于人们对定制儿童绘本的需求，而不是绘本本身。家长想要看到“自己讲述的故事”“孩子自己的故事”，在和AI的交互之中，那些独一无二的绘本故事得以诞生，满足了情感和价值诉求。

这种需求也在揭示一个事实，AI绘本的商业变现会开拓一种新的模式，和传统绘本出版这条路并不相交，更多侧重于服务和个人表达。

专业插画师Dream告诉刺猬公社，AI生成的绘本目前是达不到出版社要求的。一本传统绘本基础页数要求是32页，制作周期一般要一到两年。AI绘本很精致，创作速度很快，但却缺乏真实的表达；传统绘本可能会在故事开头的画面适当留白，在高潮时配合丰富的画面。绘本不只是文字与配图放在一起，两种表达会相互配合，带给读者童趣抑或是多元的感受，这背后的复杂创作是AI难以复制和展现的。

事实上，在纸媒下行的今天，绘本本身就不是一门“好生意”，许多插画师都需依靠副业才能坚持创作。因此，AI绘本生意的出现对传统绘本行业反而冲击较少，两者更多是互补关系。

多重因素叠加下，现在市场上用AI画绘本不赚钱，真正赚钱的是“教人画”以及“提供工具”。无论是卖19.9元的提示词，还是收取会员费的一站式生成平台，本质都是在售卖一种“能力”——一种在AI时代“人人皆可成为创作者”的能力，是家长们希望深度参与孩子成长的需求，这才是核心价值所在。

结语

不过，作为“定制的艺术”，AI绘本功能仍有待完善，尤其是在细节控制和伦理安全方面。

目前市场上的文生图模型已经可以做到对单个图进行修改，保持一定的稳定性。但无法对10页的绘本里单独的页面进行删改，必须重新从文字脚本和画面描述进行修改，限制了创作的灵活性。

我在实际操作中进行了尝试。当我让Gemini去掉第三页的文本时，它干脆地拒绝了我；我又让它修改封面时，它答应得爽快，但实际显示的画面并没有改变，显示出交互和执行的局限。

除此之外，AI绘本的核心使用场景是“儿童成长”，而它最大的风险，在于大模型的“黑盒问题”。和大模型合作创作内容时，模型背后的价值判断很难察觉，这些AI不是全然正确和没有偏见的。

大模型是基于海量数据训练的结果，数据中固有的不道德与偏见已经在训练里自动形成。已有研究发现，未经过规范的语言模型存在道德感缺失，在面临简单的日常情境伦理判断问题时准确率仅有60.2%，这对儿童教育来说无疑存在潜在风险。

每一个故事背后都暗含表达，无论是AI还是人类，叙述者的思考无法在故事里躲藏。在人机合作过程中，人类能否及时辨认不合理之处，也是一项不小的挑战，需要持续的关注和监管。

参考资料：

1.《ListenHub视频绘本，把每个人的想象都变成视频故事》，有机大橘子，2025年9月。

2.《3秒出标题，15秒出简介，30秒出一整本少儿绘本｜专访ImageStory》，视智未来，2023年9月。

3.《Can machines learn morality? The Delphi Experiment》，JIAN G L W, HWANG J D, BHAGAVATULA C, 2022: 2110.

性价比vps 云服务器免费vps

本文由主机测评网于2026-01-15发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260117832.html

AI绘本的崛起：技术革新与商业新机遇

成为绘本创作者，仅需一分钟

这个生意，卖的不是绘本

结语

深入Linux系统管理：yum包管理与vim编辑器实用攻略（Linux包管理精髓与vim编辑技巧）

Kali Linux TCP泛洪攻击实战教程（仅限合法测试场景）

AI绘本的崛起：技术革新与商业新机遇

成为绘本创作者，仅需一分钟

这个生意，卖的不是绘本

结语

深入Linux系统管理：yum包管理与vim编辑器实用攻略（Linux包管理精髓与vim编辑技巧）

Kali Linux TCP泛洪攻击实战教程（仅限合法测试场景）

相关文章