• 电子产品世界网
  • 关于我们|
  • 网站合作|
  • 联系我们
  • 主页 > 行业 > 正文

    全球报道:AI 绘画,正在逐渐取代中底层画师 ?

    2023-03-19 20:23:05  |  来源:人人都是产品经理社区  |

    The following article is from 产品零感 Author 葛零零


    【资料图】

    关注并将「人人都是产品经理」设为星标

    每天早 07 : 45 按时送达

    在过去的几年里,人工智能取得了极快的发展,其中包括基于机器学习和深度学习的「图像生成技术」。运用该技术,只需输入文本语句就可输出具有独特风格和想象力的图像。面对AI绘图这个势不可挡的趋势,设计从业者们,是否做好准备了呢?

    作者:葛晓玲

    来源微信公众号:产品零感(feelingPM)

    题图来自Unsplash,基于CC0协议

    全文共8156 字,阅读需要 17 分钟

    —————— / BEGIN / —————

    在过去的几年里,人工智能(AI)取得了极快的发展。

    ChatGPT和GPT-4对话上的智能程度在不断刷新常人的认知,给大众带来了惊人的体验与惊叹。

    同期发展的AI技术,还有基于机器学习和深度学习的「图像生成技术」。

    该技术能够让计算机在一定程度上模拟人类进行绘画,用户只需输入文本语句(prompt提示)就可输出具有独特风格和想象力的图像。

    文本->图像,AI绘画,指的就是这个过程。

    随着大众对于AI绘画关注度的升温,相关的争议不断,有人开始提出「AI取代画师」的观点。

    面对AI绘画这个势不可挡的趋势,设计从业者们,是否做好了准备?

    AI绘画,高效无情的出图机器

    2022年8月,在美国科罗拉多州艺术博览会上一幅名为《太空歌剧院》的画作在数字艺术类别比赛中获得了第一。

    由AI绘制的《太空歌剧院》

    人们也很快得知,这个画作并非真人绘制,而是由游戏设计师使用一个叫Midjourney的AI工具生成而来。

    随着这则新闻的传播,AI绘画也开始进入更多人的视野。

    1. 国外知名的AI绘画工具

    下面先介绍几个国外具有代表性的AI绘画工具:

    1)DALL·E2

    DALL·E2 是一个由 OpenAI 公司开发的模型,也是一个在线服务。它通过输入一个文本描述(prompt提示)生成多个精准匹配文本的图像。

    DALL·E2 结合"CLIP 预训练模型"和"Diffusion扩散模型"来实现了文本->图像(text-to-image)的生成。

    扩散模型运行时的成像过程,就是一个"Diffusion 扩散"的过程——

    从有噪声开始->逐渐改善图像->直到完全没有噪声->图像越来越接近所提供的文本描述。

    DALL·E2 还有一个的特别的功能是"AI编辑",可以在生成的图片上涂抹某些部分再让 AI 直接修改。

    DALL·E2 只使用了已获授权的图片集来进行训练。

    2)Stable Diffusion

    Stable Diffusion 模型,前身是谷歌开源的 Disco Diffusion 模型。

    Stable Diffusion 模型也结合了CLIP技术(OpenAI发布的技术)和Diffusion扩散模型,同样是通过输入文本(prompt提示)来生成图像。

    比较特别的是, Stable Diffusion 是一个开源的模型,很多开发者基于这个开源模型开发训练出了更多不同的生成模型。

    Stable Diffusion 的母公司Stability AI 在2022年10月宣布获得1.01亿美元融资,投后估值达10亿美元。

    3)Midjourney

    Midjourney由同名实验室开发,和大部分市面上的AI绘画应用采用的是同一个模型,但是模型使用了大量图像数据来训练。

    Midjourney在生成图片的一致性和连贯性上做了很多努力,它生成的图像风格十分独特。

    Midjourney几乎所有的生成和交互都发生在Discord社区里,使用其Discord机器人来接收请求和发送生成结果。

    3种绘画工具的对比:我们进行测试,对于同样一句文本(其他参数默认的情况下),这3种绘图工具的图片生成效果。

    输入文本:

    An old man rowing a boat on a lake.

    AI生成的图片:

    收费标准:

    3种绘画工具的体验地址:

    ①Stable Diffusion

    Dream Studio:https://beta.dreamstudio.ai/dream

    Hugging Face(免费): https://huggingface.co/spaces/stabilityai/stable-diffusion

    ②DALL·E2

    https://openai.com/dall-e-2/

    CLIP:https://openai.com/blog/clip/

    ③Midjourney

    https://www.midjourney.com/home/

    (注:某些服务只对部分国家开放)

    Midjourney的效果更具艺术感:

    对比生成效果可以明显看出,Midjourney生成的图像不太像照片,似乎更像一幅艺术画作。

    在Discord社区里运作的Midjourney社区 ,因为其具有艺术感且画面注重细节的生成效果,收获了全球近千万用户,在线用户也是百万等级。

    在社区频道里,用户仅仅需要使用/唤起命令行操作,在/imagine命令下输入prompt文本发送即可。

    以下是输入简单文本后,Midjourney生成的图像:

    效果如此惊艳的生成图片,只需几十秒内就能得到。

    2. 国内的AI绘画产品

    国内也相继出现了类似的AI绘画产品,几乎都有免费尝试的额度,通常支持多种风格/艺术家/模型。

    以下是国内提供AI绘画服务的一些产品:

    随着技术的逐渐普及和越来越高的热度,AIGC似乎就不再是大众试水画图画着玩儿的一个小工具。

    这个"高效无情的出图机器",似乎已经开始在影响和撬动设计行业的变革。

    设计行业 X AIGC

    1. 游戏制作× AIGC

    很多游戏项目,开始利用AIGC生产游戏相关素材。

    1)国外游戏工作室 Lost Lore《Bearverse》游戏

    国外游戏工作室 Lost Lore 出品的主打 NFT 集换概念的F2P游戏《Bearverse》包含了大量的角色设计。

    游戏工作室直言:采用AI画图节省了80%美术成本!

    ①17名角色的调整:

    开发成本:从5万美元压缩至1万美元;

    工时耗费:从6个月大幅减少至1个月。

    ②创作一张场景概念图:

    工时耗费:从1-2周压缩至1天以内。

    设计总监最后也坦言:

    95%的效果和概念图呈现仍是由团队真人创作。

    2. 商业设计 ×AIGC

    大厂团队已经不甘观望,开始了AIGC在商业设计工作流中的实践。

    1)腾讯-ISUX团队

    腾讯的ISUX团队2023年3月1日刚刚发表其官网的文章《运用AIGC人工智能生产内容》。

    https://isux.tencent.com/articles/aigc-design.html

    文中提到了腾讯的ISUX团队运用AIGC进行商业设计的好几个案例,并进行了结合使用AIGC后设计团队的全新工作流的方法总结。

    2)百度-AIGC营销赋能业务

    百度也在试图利用AIGC满足商业设计上的需求。

    百度发布了AIGC方向的产品负责人岗位,负责比如"商业广告平台部的内容生产相关工具的规划和落地"。

    3. 个人头像设计× AIGC

    1)国外的AI美图软件Lensa「魔法头像」功能

    「魔法头像」是Lensa基于Stable Diffusion技术开发的头像生成功能,用户上传10-20张自拍照,能生成50~200张不同风格的AI自画像/头像。

    生成50/100/200张的价格分别是:3.99/5.99/7.99 美元。

    2)美图秀秀「百变 AI 头像 」功能

    同样是美图软件的国内团队——美图秀秀,也随机发布了相似的功能。

    从产品定位来看,也是输入真人头像就能批量地获得多种风格的头像。

    和国外的AI美图软件Lensa相比,美图秀秀对于用户的输入门槛要求更低一些,只需要提供3张正脸无遮挡自拍照即可。

    3)抖音「AI绘画」特效

    继2021年的「漫画脸」特效(基于GAN技术)后,2022年抖音又上线了特效玩法「AI绘画」(基于Stable Diffusion技术)。

    用户只要输入一张图片,AI就会根据图片生成一张动漫风格的图片。

    抖音「AI绘画」功能的的峰值QPS(每秒请求量)一度达到1.4w。

    4)QQ小世界AI画匠

    腾讯QQ上线了"QQ小世界AI画匠"活动,主题为"异次元的我"。

    用户上传1张个人照片,即可一键生成专属异次元形象。

    4. 动画背景× AIGC

    1)国产志怪类动画《神弦曲:猫儿与时光铃铛》

    由十九号动漫出品的国产志怪类动画《神弦曲:猫儿与时光铃铛》将于明年上映。官方在2022年12月发布了预告片。

    主创团队称,预告片三分之二的背景都是结合AI制作完成的。

    制作预告片中的30多个背景,工时耗费从3个月降到2个月,效率上提升了至少30%。

    主创在采访中提到:"有了这样的一个技术,把我们的预算从一个标准动画电影预算直接减半,我们就快速地获得了一些投资机会。"

    5. 视频制作× AIGC

    除了绘画领域外,AIGC也在动态的视频生成上有了很多突破。

    1)Runway 新功能:视频转风格生成器 GEN 1

    Runway AI 是一家图片和视频AI编辑软件提供商,为设计师、艺术家和开发人员提供一系列工具的平台,帮助他们利用人工智能技术创建作品。

    Runway 平台推出了新功能 —— 把视频转换成任意风格的生成器 GEN 1。

    GEN 1 这个能力和图生图功能(image-to-image)类似,只是变成了从视频到视频(video-to-video)的生成。

    https://research.runwayml.com/gen1

    看起来, GEN 1 是一个支持用户可订制化的视频滤镜的能力。

    而定制化的方式极为简单,只需一张具有风格的图片。

    2)Wonder Studio:一键替换真人为CG角色

    这款由一家人工智能初创公司Wonder Dynamics推出的AI工具Wonder Studio,声称可以实现「一键把视频中的真人替换为CG角色」,简化电影制作流程。

    https://wonderdynamics.com/

    整个工具的使用流程大概是:

    真人先替代CG机器人进行表演

    视频拍摄完成,导入进软件

    选择想要的CG角色,安装在实拍的真人身上

    目前官方网站上开放了内测申请。

    AI绘画的争议

    在设计行业中,很多人的对于AI绘画的态度,都是不怎么正面的,主要集中在几点:

    从业者的担忧

    版权

    学习信心的打击

    争议1:从业者的担忧

    在AIGC生成绘画能力效率和质量皆可的前提下,中底层画师好像确实慢慢就不需要那么多了……

    论出图速度:人赶不上机器的出图速度;

    论出图创意:AI 可以生成出关键元素外的细节,似乎更为惊喜;

    论风格效果:AI 能训练出不同的绘画模型,对应不同画风;

    输入相同的一段prompt文本后,不同的模型可以生成出不同风格的图片,且速度极快,通常是几秒~20秒内不等:

    一个戴着黑框眼镜的美女,抱着一只小兔子

    A beautiful girl in black-rimmed glasses, holding a bunny in her arms

    Midjourney 模型

    画面注重细节

    Niji 模型

    Midjourney 模型的二次元版

    Novel AI 模型更偏日漫的二次元风格

    LoRA 模型

    真人写实照片风格

    除了想要的关键元素外,生成图片中还包含更多精彩的细节描绘。

    结合AI批量生成的能力,很多绘画需求,似乎只靠AI就都被高效地满足了。

    随着AI作画的部署成本逐渐降低,一些中小企业和初创团队,也开始有能力在通用大模型的基础上进行模型的调教、设计师岗位的精减。

    令从业者最担心的事情就是:

    当AI绘画工具具备了一定绘画能力,也就同时具备了"抢人类设计师饭碗"的能力。

    争议2:版权

    我们在AI绘画出的作品中能看到很多有明显风格的影子。

    也可以直白地说,一些AI绘画模型的训练数据中,有着很多未经明确授权的画师作品。

    AI绘画侵犯了画师的版权,也开始遭到画师们的集体抵制。

    2022年8月29日,一个名叫mimic的AI绘画网站上线了测试版,主攻日系二次元画风头像,允许用户上传15-200张图像让AI学习并输出相同画风的AI画作。没想到刚发布便遭到大量日本画师的抵制,画师们集体发表了"禁止将我的作品用于AI作画"的声明。有的画师为了防范于未然,甚至删除了发在推特上的画作,怕有心之人盗用上传至平台使用。

    2022年12月,全球知名CG视觉艺术网站 Art Station也被上千名画师发起了联合抵制,画师们认为,任由系统学习模仿自己的画作是在侵犯版权。网站画师纷纷上传一张名为"NO TO AI GENERATED IMAGES(拒绝AI绘画)"的图片表明态度,首页一度被此图片占领。

    对于画师们来说:

    自己的画风,是独属于自己的独特标志和可贵财产。如果让AI简单地模仿自己画风来作画,那无疑是对独有艺术的糟蹋。

    即便有的画师愿意提供自己的绘画作为模型的训练数据,但似乎他/她们也没有收到任何版权上的收益。

    AIGC产出的画作的版权归属于谁,成了关注和争议的话题。

    争议3:打击小白学绘画的信心

    AI 绘画的强势碾压的能力,似乎也打击到了不少绘画小白从零开始学绘画的信心。

    有的人会感叹:

    既然AI几天就能学到做到那么好的效果了,自己再花费数年去学习,还有没有必要…

    AI 绘画的短板

    AI绘画当然不是全能的,也永远不会是。至今的AI绘画也还存在着众多短板。

    短板1:AI 无法准确还原想象中的创意

    AI绘画的确具有非常强大的创造力和想象力。但这样的创造力和想象力,其实是一种「快速随机」的结果。

    效果既受限于算法、数据的质量和数量,也受限于用户对于prompt的运用。

    人类的创造力和想象力仍然具有独特的价值,想要AI生成还原出来十分贴合人脑想象中的创意,是很有难度的。

    不少尝试了MidJourney进行AI绘画的人表示:

    AI生成的图片效果确实是不错,但都并不是我脑海中想象的那个样子。

    甚至,AI会理解失误,生成"离谱图片":

    输入的文本是:一个小女孩,一手拿着冰淇淋,一手牵着气球,走在公园里。

    AI生成出的却是——"冰淇淋气球"。

    短板2:AI 绘图还不足够满足个性化需求

    AI 绘图是很强,但是还不足以满足个性化需求。比如:

    针对不同场景类型进行统一且又独具个性的设计;

    稳定一个主体使之在每一次生成结果中都保持成套效果;

    以上能力的欠缺,使得AI无法高效地完成"成系列的商业设计"。

    AI绘画的未来

    尽管很多设计从业者对于AI绘画表示焦虑,但作者判断:未来很长一段时间内,大部分行业可能只会把AI绘画当成一个「辅助工具」来用。

    前期,大家在拼AI的效率;后期,则是拼人工优化AI的能力。

    人工优化AI能力,可以从以下3个方向出发。

    优化AI方向1:AI 模型的定制

    想要模型更稳定地产出特定风格的绘画图片,可以定制出一个AI模型。

    但AI模型的定制的门槛比较高,通常至少需要一个设计师搭配一个算法工程师来实现,而涉及到模型训练的过程,则需要工程部署能力、硬件显卡的支持。

    模型训练出的效果也取决于多个因素,比如:训练素材、模型选型、参数设置、训练方法等。

    优化AI方向2:会用 prompt "咒语"

    我们可以把"prompt"理解为"送给AI模型的文本指令"。

    输入高质量有效的prompt,可以大幅度提升AI绘图的稳定度,让成图更加接近我们的描述。

    prompt输入的格式通常可以是以下内容的一个组合:

    prompt文本输入=[形容词+主语 / 主语+状语],[背景],[画面类型],[风格/艺术家],[灯光/色调],[视角/修饰词],[细节],[画面质量]

    因为这一体验过于神奇,很多人不禁将prompt形容为"咒语"。

    在市场上,还出现了买卖prompt词的平台:一家初创公司PromptBase,允许用户在该平台买卖提示词(Prompt),售价约为1.99美元~9.99美元不等。PromptBase将向卖家抽成20%。

    平台上目前已上架不少提示词,适合不同模型、不同种类。

    而在学术上,也有所谓"prompt engineering" 即" prompt 工程"的说法。

    提示工程(prompt engineering):如何同人工智能交流,并得到你要的结果。

    https://learnprompting.org/docs/intro

    优化AI方向3:灵活组合模型,优化工作流

    因为AI绘画工具的介入,现有设计的工作流程将随之而改变,整合诞生了全新的工作流:

    AI绘画先进行生成-> 再从AI生成的十几张结果中挑选用作局部素材->再利用PS或其他工具精修处理

    随着AI绘画相关的新技术不断出现,其AI绘画的工作流也需要随着新的技术来优化,进化为更适合的工作流。

    比如,当发现了「根据图片提取prompt」的新技术后,可结合这个新技术优化设计工作流。

    结合了「提取prompt」的设计工作流,也许就变成了这样:

    再比如,当发现了出现「ControlNet插件」的新技术后,可结合这个新技术再次优化设计工作流。

    ControlNet插件:可以完成对人物骨骼走势、形态、动作、姿势的精确控制。

    结合了「ControlNet插件」OpenPose模块的设计工作流,也许就变成了这样:

    以上提到的"人工优化AI能力",第1点"AI模型定制"门槛较高,需要一定技术和硬件。

    但"prompt实践"、"设计流程优化",都是现今设计从业者可以探索和实践的方式。

    画师的命运

    等着被取代,还是转型?

    我们经常看到一些新的AI技术应用的效果出现后,很多人立马开始感叹:AI抢饭碗了、AI取代设计师、失业倒计时+1……

    AI绘画的能力不容忽视,但它也不是万能的。

    AI解决了生成效率,能在一定流程上减少一部分工作量。但又因为AI绘画引入了新的工作流,同时会创造新的工作量。

    相应地,一些新的就业岗位也会增加,比如现在就有俗称为"AI调教师"的一种存在。

    在某些绘画领域中,也已经有了"AI插图绘制师"、"AI绘图师"的人力需求:

    以下,也许是"AI绘图师"可以贡献的能力:

    绘制优质的训练素材供模型学习

    高效地使用prompt,测试出稳定的生成效果

    将"生成结果的质量好坏"准确地反馈给算法(人类反馈强化学习RLHF)

    结合AI技术,优化设计工作流

    AIGC势不可挡,那些率先学习如何用AI进行美术工作的人,将会发现自己处于行业的顶端。

    毕竟,差异化竞争的关键,就是让自己掌握"差异化的优势"。

    截图源自Aisocia.com平台的AI对话

    结语

    借用一段"腾讯ISUX团队"文章中的结语:

    随着AI模型能力的飞速迭代升级,现有的短板能力也会不断补齐,因此我们可以相信在不远的将来,设计师利用AI模型来开脑洞并辅助出图是趋势所向,但并不是说我们需要完全依赖AI,因为设计本身是理性而浪漫的工作,仅靠随机性做设计是完全不可取且不靠谱的。更合适的思路应该是,设计师首先定义好规则与框架,从AI模型提供的成百上千个结果中寻找到最匹配我们诉求的结果,从而辅助我们更快更好的达成目标。

    另外面对日新月异的的智能工具,我们应该保持终生学习的心态,做好时刻接受新事物的挑战,才能在越来越激烈的竞争中立于不败之地。

    ——《运用AIGC人工智能生产内容》

    AI绘画,还仅仅是AI技术应用的其中一环。

    未来,AI将涉足3D模型生成、AI视频创作、AI作曲等领域。

    更多AI能力也会发展,就像现在的AI绘画一样,影响和撬动相关行业的变革。

    AI绘画会取代所有画师吗?不可能。

    AI绘画会逐渐取代中底层画师吗?不无可能。

    留给从业者的忠告,还是那句话:保持终生学习的心态,做好时刻接受新事物的挑战。

    最后,送给所有打工人的心声:

    参考文章:

    https://www.marktechpost.com/2022/11/14/how-do-dall%C2%B7e-2-stable-diffusion-and-midjourney-work/ How Do DALL·E 2, Stable Diffusion, and Midjourney Work?

    https://www.thepaper.cn/newsDetail_forward_21420325

    https://finance.sina.com.cn/blockchain/2023-03-03/doc-imyiqhat7670720.shtml

    https://baijiahao.baidu.com/s?id=1759154697131925527

    https://mp.weixin.qq.com/s/pkzXaW_-77zXLKQqx2nlcA

    ——————/ E N D /——————

    产品经理培训|产品运营培训|企业内训服务

    请在公众号后台回复「培训」了解更多

    ▼ 喜欢请分享&收藏,满意点个赞,最后点「在看」 ▼

    关键词:

    上一篇:   下一篇: