30秒出图,成本直省2万元,这类AI工具成电商领域“显眼包”
- 来源:头号AI玩家公众号
- 时间:2023-08-31 00:18:56
一个对摄影、布景、后期、甚至AI都零基础的小白,有没有可能零成本产出一套完整的商品大片?
举个例子,通常制作一套20张的商品场景图,需要一个多工种设计团队至少耗费3天时间,成本超过2万元。
(相关资料图)
但如果用AI工具做电商图,单次生成消耗的算力成本不到1元,成本降低超过90%。
对于电商和品牌而言,商品图的重要性不言而喻。一张吸引眼球的商品图有时决定了消费者是否有兴趣关注并下单。
大品牌固然可以投入大量资金,产出精美的商品图,但对中小企业来说,投入和产出能否成正比,则需要反复考量。因为对效果图的要求不同,费用波动也很大。
而AI正在悄悄影响商品图市场。
在阿里、京东、亚马逊等电商大厂纷纷推出数字人、AI主播时,很多初创企业开始在“AI商品图”领域“卷”了起来。
今年4月,蘑菇街基于Stable Diffusion推出AI商拍工具Weshop,为商家提供商品实拍图和虚拟试衣图。通过简单的操作,即可快速生成多种风格的服装人台图、模特图等等。
Weshop网页提供虚拟试衣模版
专注于出海的AIGC公司ZMO.AI选择的是真实场景的图像生成。用户上传产品至zmo.ai平台,给出具体的需求指令(prompt),就能获得与产品相匹配的宣传图片。
zmo.ai提供了3个功能,直接选择模版、参考图片生成场景、用户输入指令生成商品场景,但目前暂时不支持中文指令。
zmo.ai网页页面
其实,这些AI工具在生成商品图这一功能上,操作步骤大多类似,更关键在于AI对生成图片的细节把控。
今年7月,灵动AI推出了国内首个工业级可商用的“AI商品图”生成工具,聚焦工业产品设计赛道。
“灵动AI”生成效果图
用户为商品选择一个想要呈现的角度,拍摄一张照片并上传到平台,系统就能自动识别完成抠图。
其次是添加适合的场景,我们发现“灵动AI”目前提供了“节日活动”、“街景”、“创意”等十几种场景,以提升商品图具体应用的写实性。
“灵动AI”操作页面示例
从我们的体验来看,哪怕是毫无设计经验的商家,只要正确使用灵动AI的工具,通过“傻瓜式”的操作也能获得一套完整并符合需求的商品图。AI生成的商品图更像是围绕一件商品提供的完整场景融合方案。
灵动AI创始人雷海波之前是头部视觉设计社区“视觉中国”创始人,在设计领域有20年以上的从业经验。在DALL-E2、Midjourney等AI工具浪潮席卷下,他发现AI生成的图像在质量、创意性上完全不逊于专业的设计师。
他在一个月内用Midjourney生成了1.2万张图,成功加入了Midjourney在Discord上的“一万张俱乐部”(10000-club)。
正是对Diffusion模型产品大量的尝试,雷海波意识到Diffusion模型在生成效率和图像效果方面都优于此前的GAN模型。
“打造从视觉设计行业大模型到创新应用的设计平台,应该以生成式AI为核心”,雷海波表示,这也是灵动AI成立的契机。“灵动AI”背后依托了多个达到1亿级参数规模的专用AI模型和1亿+的设计数据集。
AI是否真的能带来电商领域的“出图革命”?“灵动AI”在电商图生成领域有何特别之处?“头号AI玩家”对话了“灵动AI”创始人雷海波,和他聊一聊AI商品图的创业经验。
瞄准电商领域,抓住中小卖家制图痛点
头号AI玩家:在开发AI商品图之前,灵动AI主要专注于什么业务?
雷海波:我们之前主要聚集在开展D2C模式的大数据智能设计研究,以及研发AI编程客栈智能设计工具。
“灵动 AI”是公司旗下的核心产品。我们希望依托AIGC智能生图技术,为B端用户和设计师提供商业级视觉设计AI大模型应用、AI商品图生成及动态视觉生成工具等服务。
头号AI玩家:开发“AI商品图”的契机是什么?为什么会将目标瞄准在电商领域?
雷海波:去年生成式AI技术取得了巨大突破,伴随DALL-E2、Midjourney等基于Diffusion Model的大模型崛起,图像生成的效果已经超越人类设计师表现,并开始替代部分低端、重复和标准化的设计工作。
我们在设计领域和互联网行业积累了大量的设计图片资源和算法专利,这为我们打造AI生成应用提供了良好的技术基础。
以往设计行业对人工智能的需求主要集android中在产品链的前端,比如是否可以帮助设计师进行数据分析、快速地产出创意概念、展示设计的样稿等。
图片来源:灵动无限科技
但其实更大的应用场景应该是在产品链条的后端。因为企业老板关注的往往不是产品外观漂不漂亮,而是产品好不好卖,利润高不高。
我们深刻认识到从产品设计的前端购买点转向后端营销的卖点,对企业尤其是中小企业的帮助会更大。
头号AI玩家:“灵动AI”主要服务于哪些用户?
雷海波:灵动AI产品的主要目标用户是缺乏设计能力的中小企业,当然我们也会为品牌商提供AI智能设计的系统化解决方案。
我们正在将商品图工具植入电商平台以及一些行业头部企业的工作流,为中小企业和品牌企业解决传统设计出图效率低、成本高等问题。
我们考虑的是如何为设计师和产品设计公司赋能,帮他们带来业务增长。
头号AI玩家:“灵动AI”能够多大程度提高用户效率?
雷海波:在线上渠道,传统商品场景图制作通常采用3D渲染或影棚拍摄方式,成本高、效率低。
“灵动AI”生成效果图
相比之下,使用“灵动AI商品图”这类生成工具,单人即可完成商品图的制作,每30秒可以生成4张场景图,单次生成消耗的算力成本不到1元。
AI能够将生产效率提升10倍以上,并且降低超过90%的制作成本,从而使B端用户、设计师摆脱繁琐的工作流程。
模型架构+海量数据集,构筑技术壁垒
头号AI玩家:“灵动AI”的技术逻辑是什么?有没有技术壁垒?
雷海波:我们的核心团队是由视觉中国、THN、百度和京东等知名科技企业的开发者组成。他们曾参与了视觉中国原创设计平台、THN工业设计平台和智能设计引擎、百度文心一格视觉大模型以及京东商城文生图视觉大模型的开发。
在技术层面上,“灵动AI商品图”集成了多个特定的风格场景,依托Diffusion Model训练出LoRA模型和多个达到1亿级参数规模的专用AI模型。
专用AI模型还承担了文生图的“控制”功能。我们通过开发C-VAE商品主体生成控制和C-BG背景生成控制专用模型、MG动态视觉专用模型,以及美学评估专用模型等系列化算法对生成内容加以控制。
模型架构之外,“灵动AI”同样拥有1亿+的设计数据集。我可以说没有任何团队拥有我们这样量级的设计类数据集。这也是我们的优势所在。
头号AI玩家:开发过程中遇到了哪些问题?用户的反馈如何?
雷海波:我们的产品7月底开始内测,从目前用户的反馈来看,图片生成效果是优于市面上绝大部分AI生图工具的。
接下来需要解决的问题主要在几个方面,一是场景模版需要进一步的丰富,以适应不同行业领域的用户需求;二是AI商品图生成工具需要更加智能化,提高用户使用的操作便利性;三是产品功能能不能更加丰富,比如图片的批量生成、增加海报模版、从静态图片到动效动态的生成等,主要是产出的创意内容可以让用户直接拿来使用。
头号AI玩家:如何保证生成的图片满足电商卖家的要求?
雷海波:在生成图片的质量要求方面,产品图对生成内容的边缘精细度、生成可控性、与原图的一致性等方面均有着很高的要求。
另外,我们想让生图过程全链路智能化。简单说就是,将AI的技术能力与我们对设计、美学的知识经验、行业资源结android合起来。商家不用手动挑选适配的场景,android只要从中挑选最优效果的图片。
其实大部分的商家用户不了解AI创作的技术原理,审美能力也千差万变,也很难通过精准的文字描述达到顺畅驾驭AI的要求。
我们通过AI对商品的识别能力,智能为他们匹配适合此类商品的背景图,然后从整体审美python、商品材质与场景的适配度、整体色彩的协调性、光影融合度、商品与场景的风格契合度、构图的合理性等层面对生成图片进行评估打分。
相比国内外的通用视觉大模型,我们想在简单易用性与专业生成效果之间寻求一种平衡。
电商领域,逐渐AI化
头号AI玩家:“灵动AI”未来会往什么方向发展?
雷海波:在AI智能设计领域,前几年主要采用的是GAN对抗网络技术,未来对抗网络技术可能会得到持续优化和发展,比如加入条件对抗网络,实现基于条件的设计,增强稳定性。
多模态数据集成也是未来的趋势之一,结合文本、图像、三维建模等多种输入,生成更丰富的智能设计转换输出。未来的技术还可能会考虑用户的个性化需求,实现一定程度的个性化智能生成。另外,智能设计向智能协作转变,人机协作能力也将是未来重要发展方向。
我们计划在年底推出10亿参数专注工业产品设计领域的垂类大模型,更专注于3C数码、智能硬件、生活电器、家居日用等工业产品设计赛道,将自研垂直行业大模型和多模态AI技术结合。
“灵动AI”生成的AIGC方案案例
在此基础上开发面向具体行业的定制化应用,为广告、品牌、媒体等创意产业提供更加专业化、精细化的AIGC方案。
头号AI玩家:今年AI赛道非常火热,您对此的感受是什么?怎样看待AI To电商领域的发展?
雷海波:电商领域数据量大、种类繁多,其实为AI模型训练提供了丰富的样本,这对开发高质量的AI创作工具很有帮助。
电商中有许多项目都非常适合用AI技术来支持,比如商品分类、推荐系统,营销策略优化等,AI给予这类任务提供了一个很好的应用平台。
我们看到今年以来,一些头部电商平台纷纷参与大模型的训练,利用AI来改进用户体验、提高运营效率。未来,主流电商领域的AI应用方向应该是能够真正解决用户痛点、提升购物体验。毕竟以用户利益为中心,才能获得长足发展、带来长效增长。
关键词: