2024年8月,微信读书上架了一本AI绘制的绘本《卡皮巴拉的自我修养》,并迅速跻身新书榜第5名。这标志着AI在绘本创作上的重大进展,已不再令人惊讶。
近期,人们只需通过自然语言描述故事,AI便能在短短一分钟内完成绘本创作。这一突破无疑引发了广泛关注。
今年夏天,Gemini推出了Nano banana模型,凭借其卓越的角色一致性能力,吸引了众多网友对AI图像生成的探索与关注。在此模型曝光之前,Gemini AI已上线了Storybook故事创作功能,用户只需输入简短情节描述,AI便会自动生成包含10页图文内容的电子书。
AI一键生成的绘本究竟可读吗?为何这些略显抽象的幻灯片式视频能迅速走红?为了找到答案,我开始进行调研和试用。
为了直观体验AI绘本技术的能力,我在Google Gemini中进行了一次测试。点击AI绘本功能后,界面上出现了几个创作建议。
我随手点击了第三个关于“小蜜蜂”的创意概述。不到一分钟,一个可翻页的电子绘本便出现在我面前。
绘本共有十页,讲述了小蜜蜂巴奇的故事。尽管提示词仅提供了一个模糊的故事轮廓,但AI生成的故事逻辑自洽。然而,不得不承认,AI生成的故事吸引力和趣味性不高,结构也缺乏“起承转合”,更适合称为“小故事大道理”。
之后,我关注了“角色一致性”问题,这是过去AI绘本制作的最大痛点。在Gemini生成的故事中,主角巴奇的造型整体保持得不错。虽然偶尔蜜蜂的造型和手的颜色会有些许出入,但并未出现令人诧异的“角色突变”硬伤。如果对画风不满意,操作也很简单。
现在漫画的“大眼萌”风格略带恐怖谷效应,于是我要求Gemini更改风格。新的绘本很快出炉,整体画风变为宫崎骏动漫风。
除了点击推荐的指令生成故事绘本外,我们也可以“先文后图”。我用Gemini的文字AI功能生成了一个全新故事脚本,再点开Storybook功能进行创作。经我人工鉴别,AI生成的图画与脚本内容非常一致。
在“一站式绘本”功能上线之前,我也尝试过使用多个大模型制作AI绘本,但过程繁琐且需要耐心。
AI创作绘本的核心是文生图能力。从ChatGPT、DeepSeek等模型获取脚本只是第一步,最难的环节是将其“喂”给文生图AI。如果一次性投喂长脚本,AI的多图能力不足且角色一致性较差。因此,创作者需要将故事拆解成一页一页,反复修改提示词。
目前模型“画”得越来越快,并正在解决一次性生成连续故事的问题。除了谷歌外,国内文生图模型也陆续升级。例如,字节跳动近期发布的AI图像生成模型Seedream 4.0,其性能超越了谷歌的Gemini 2.5 Flash Image。
我用相同的prompt进行了测试。该模型可以直接在豆包上使用,出图质量和图像稳定性有所保证。但在部分复杂图像中,角色形象不稳定。
在这些“一站式平台”出现之前,不少AI自媒体博主将场景拆分并兜售“AI绘本制作教程”。他们教人如何结合Midjourney等图像模型再搭配ChatGPT、剪映等拼凑出完整绘本。但该模式软件切换繁琐、流程冗长且出图效果不稳定。
现在只要给AI一个概述、大纲或脚本它便能生成逻辑自洽的故事并配上高度符合场景的图片这使得AI绘本领域出现了越来越多新创意。
AI绘本的生意不止一种但其初始形式和所有新兴AI技术一样源自于一种焦虑。
在社交平台大量自媒体博主打出“AI学习”标签将AI绘本等技术作为副业的一部分。他们利用信息差将精美的AI图片发帖“引流”吸引关注再转化关注者为消费者以19.9元的价格售卖文生图AI的插画提示词或教程等。
本文由主机测评网于2026-05-07发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260543535.html