AI 快速生成的绘本,适合给孩子读吗?
如今,教人用 AI 做绘本成了一门新生意。2024 年 8 月,一本标注为 AI 绘制的绘本《卡皮巴拉的自我修养》上架微信读书,还一度排到新书榜第 5 名。在 AI 发展的当下,利用文生图技术和人工智能协同创作绘本已不足为奇。
近期,人们只需用自然语言描述想要的故事,AI 一分钟内就能完成绘本创作。今年夏天,Gemini 推出 Nano banana 模型,其出色的角色一致性能力引发众多网友对 AI 图像生成的探索与关注。在该模型曝光前不久,Gemini AI 上线了 Storybook 故事创作功能,用户输入几句话描述情节,AI 就能自动生成 10 页图文内容的电子书。
随着图像模型的不断完善,人们开始挖掘 AI 绘本功能的用途。短视频平台上有大量 AI 绘本视频,很多还附上英文字幕和配音,标签标注为英语绘本、英语磨耳朵等,平均点赞量达几千,有的视频数据近百万。点开这些博主主页,往往挂着启蒙绘本、英语绘本视频合集等购买链接。

AI 一键生成的绘本能读吗?这些类似幻灯片放映的抽象视频为何能迅速走红?为找到答案,我展开了调研和产品试用。
一分钟,变身绘本创作者
为直观感受目前 AI 绘本技术的能力,我在 Google Gemini 进行了测试。点开 AI 绘本功能,界面出现几个创作建议。

我随机点击了第三个关于“小蜜蜂”的创意概述,不到一分钟,一个可翻页的电子绘本就呈现在眼前。

该绘本共十页,讲述了小蜜蜂巴奇的故事。尽管提示词只是故事的模糊轮廓,但 AI 生成的故事逻辑自洽。故事是巴奇出门采蜜,遇到无精打采的小花,采蜜后花儿重新抬头,体现了蜜蜂活动的益处。不过,AI 生成的故事吸引力和趣味性欠佳,结构的“起承转合”不明显,更像是“小故事大道理”。
之后我关注了“角色一致性”问题,这曾是 AI 绘本制作的最大痛点。在 Gemini 生成的故事里,主角巴奇的造型整体保持较好,虽偶尔蜜蜂造型和手的颜色有细微差异,但没有出现“角色突变”这种严重问题。若对画风不满意,操作也很简单。
由于现在漫画的“大眼萌”风格有恐怖谷之感,我要求 Gemini 更改风格,很快新的绘本出炉,整体画风变为宫崎骏动漫风。

图|新的风格
除点击推荐指令生成故事绘本,我们还能“先文后图”。我用 Gemini 的文字 AI 功能生成新的故事脚本,再点开 Storybook 功能创作。经我鉴别,AI 生成的图画与脚本内容高度一致。

图|新的绘本
在“一站式绘本”功能出现前,我用多个大模型制作 AI 绘本,着实需要耐心。AI 创作绘本的核心是文生图能力。从 ChatGPT、DeepSeek 等模型获取脚本只是第一步,最难的是将脚本“喂”给文生图 AI。
若一次性投喂长脚本,AI 多图能力不足,角色一致性差,会出现“一人千面”的情况,所以创作者要将故事拆成一页页,反复修改提示词,期望 AI 稳定发挥。若还想要流畅配音,还需多工具协同,调用音频 AI。
目前模型“画”得越来越快,且正在解决一次性生成连续故事的问题。当然,不只是谷歌在“卷”故事绘本。国内文生图模型也在升级,改善多图生成的一致性问题,完善生成连续故事的功能。比如字节跳动近期发布的 AI 图像生成模型 Seedream 4.0,称其性能超越谷歌的 Gemini 2.5 Flash Image,能免费输出最多 20 张差异化图像,这对批量生成 AI 绘本、视频分镜头脚本等场景很关键。
我用相同的 prompt 测试该模型,它可直接在豆包上使用,出图质量和图像稳定性有一定保证,但在部分复杂图像中,角色形象不稳定,人像和动物形态摇摆不定。

在“一站式平台”出现前,不少 AI 自媒体博主拆解该场景,兜售“AI 绘本制作教程”。他们教人结合 Midjourney 等图像模型,搭配 ChatGPT、剪映,拼凑出完整绘本。但这种模式软件切换繁琐、流程冗长、出图效果不稳定、使用成本高,创作依然复杂,想拥有自己的绘本故事并非易事。
现在,只要给 AI 一个概述、大纲或脚本,它基本能生成逻辑自洽的故事并配上契合场景的图片,这让 AI 绘本领域涌现出更多创意。
这门生意,卖的不是绘本
AI 绘本生意形式多样,但其起源和其他新兴 AI 技术一样,源于一种焦虑。在社交平台,大量自媒体博主打着“AI 学习”的标签,把 AI 绘本等技术作为“副业”一部分。他们利用信息差,用精美的 AI 图片发帖“引流”,吸引关注后将关注者转化为消费者,以 19.9 元售卖文生图 AI 的插画提示词或教程等。

此外,部分博主以“AI 绘本生意”为宣传亮点,走 AI 卖课路线。我联系了一个宣传招募以 AI 绘本为副业人员的社交媒体账号,加到企业微信号后,对方自称“AI XX 老师”,发来链接和海报,要求当晚上线听 AI 绘画技巧公开直播课。
在 AI 绘本应用中,人们除了初步尝试,还有更实际的需求。比如短视频平台热门的英语绘本系列,通过图文结合帮助孩子更快记住特定单词。
孤独症等特殊需求群体也值得关注。2024 世界人工智能大会上,阿里通义展示了关照孤独症儿童的 AI 绘本工具“追星星的 AI”。该工具能生成常识认知、社交礼仪、心智解读和趣味故事四类内容的绘本,还可设置 3 个层级的认知水平。
在儿童教育领域,AI 绘本是有力工具。图文并茂的绘本可激发小朋友的创造力和想象力,但目前市场上传统绘本主题相对单一,难以满足每个家庭的需求。
社交媒体上,很多帖子求助给孩子看的绘本推荐,也有批判绘本价值观刻板印象的避雷贴。一些家长希望孩子接触性别平等等更广泛的议题,担心市面上“赞美妈妈勤劳,夸奖爸爸勇敢”的绘本无法起到正确引导和教育作用。
AI 绘本产品出现后,许多不会画插画的普通人能将想象力和创造力落地,为自己孩子创作定制绘本。
这种定制需求成为目前 AI 绘本的重要发展方向。某平台上,二十元一份的“AI 十页绘本代做”卖出超 200 份。AI 播客生成平台 Listenhub 开发的 AI 绘本产品,源于公司 CTO 自身需求。因孩子喜欢听故事,他结合公司的 AI 音频能力和前沿图像模型,实现一键演绎故事,制作有声绘本传递想象。
AI + 绘本产品童语故事开发者在和女儿去乐园游玩后,将游玩记录做成绘本,女儿很喜欢还分享给同学,之后他开发了这一绘本故事生成工具,供非专业内容创作者使用。
随着一站式技术的完善,AI 绘本生成更便捷,人们的需求也更复杂多样。比如 Listenhub 支持电子翻页绘本一键生成视频绘本;在童语故事小程序创作绘本时,家长能在首页看到其他创作者的作品,创作流程中可选择孩子年龄段,故事概要可使用 AI 推荐,画面风格和角色选项丰富。若家长思考不完善,相关功能会给予提示和帮助。
这些产品受关注,源于人们对定制儿童绘本的需求,而非绘本本身。家长希望看到“自己讲述的故事”“孩子自己的故事”,在与 AI 的交互中,独特的绘本故事得以诞生。
这种需求也表明,AI 绘本的商业变现会开拓新模式,与传统绘本出版不同。专业插画师 Dream 表示,AI 生成的绘本目前达不到出版社要求。传统绘本基础页数 32 页,制作周期一到两年。AI 绘本精致、创作速度快,但缺乏真实表达;传统绘本会在故事开头画面适当留白,高潮时配合丰富画面,文字与配图相互配合,带给读者童趣或多元感受,背后的复杂创作是 AI 难以复制和展现的。
实际上,在纸媒下滑的当下,绘本本身并非“好生意”,许多插画师靠副业维持创作。所以,AI 绘本生意对传统绘本行业冲击较小。
多种因素叠加,目前市场上用 AI 画绘本不赚钱,真正盈利的是“教人画”和“提供工具”。无论是卖 19.9 元的提示词,还是收取会员费的一站式生成平台,本质都是售卖一种“能力”——让人人在 AI 时代成为创作者的能力,满足家长深度参与孩子成长的需求。
结语
不过,作为“定制的艺术”,AI 绘本功能有待完善。目前市场上的文生图模型能对单个图进行修改并保持一定稳定性,但无法对 10 页绘本里的单独页面进行删改,只能重新修改文字脚本和画面描述。
我实际操作时,让 Gemini 去掉第三页文本,它直接拒绝;让它修改封面,答应得干脆但画面未改变。
此外,AI 绘本核心使用场景是“儿童成长”,最大风险在于大模型的“黑盒问题”。与大模型合作创作内容时,很难察觉模型背后的价值判断,这些 AI 并非完全正确和无偏见。
大模型基于海量数据训练,数据中固有的不道德与偏见在训练中自动形成。研究发现,未规范的语言模型道德感缺失,在日常情境伦理判断问题上准确率仅 60.2%,这对儿童教育存在风险。
每个故事都有表达,无论是 AI 还是人类,叙述者的思考会在故事中体现。人机合作时,人类能否及时辨认不合理之处,是不小的挑战。
参考资料:
1.《ListenHub 视频绘本,把每个人的想象都变成视频故事》,有机大橘子。2025.9
2.《3 秒出标题,15 秒出简介,30 秒出一整本少儿绘本|专访 ImageStory》,视智未来,2023.9
3. 《Can machines learn morality?The Delphi Experiment》, JIAN G L W,HWANG J D,BHAGAVATULA C,2022:2110.
本文来自微信公众号“刺猬公社”(ID:ciweigongshe),作者:白棉,编辑:园长,36 氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com



