官方服务微信:dat818 购买与出租对接

AI绘画工具DDv5.6大幅提升人脸生成效果,突破创意内容局限

7281

主题

2

回帖

2万

积分

管理员

积分
21993
发表于 2024-12-1 06:44:58 | 显示全部楼层 |阅读模式
    上个月,它只是被我用来作为例子来证明AI在创意内容方面的局限性,因为它是直接用来生成人脸和动物的,而且它仍然存在缺陷,需要人类处理。但AI绘画工具的迭代升级远远超出了我的想象。 DDv5.6新更新的模块大大提高了人脸生成效果。虽然在某些角度还是会出现变形,或者可能看起来像“玻尿酸”,但它正在变得越来越“人性化”。

    (文中配图除附加注释和水印外均由西侨生成)

    虽然在AI发展的时间线上,训练AI画画并不是什么新鲜事。谷歌早在2015年就推出了它,初步测试AI的“艺术创作能力”。但到了2022年,以DD为代表的最新一批AI绘画工具的出现,不仅是技术上的突破,更在于生成图像的视觉冲击力。

    人们越来越认真地讨论AI绘画是否会对艺术行业产生影响——尽管它可能无法真正取代人类艺术家,但它目前所展现出的生产力足以有效辅助人类创作,成为一稿、一幅画。材料和灵感。

    AI绘画除了成为设计师、插画师的工具之外,也向普通人打开了画布。不需要艺术基础。通过对比教程、编写描述符、调整参数,你可以用文字想象来交换图像结果。它也有一些“平易近人”的应用,比如和菜头用它来画公众号的封面。两个月的时间,封面图的来源已经从某库/版权变成了“和菜头的小肉手”。

    鉴于业内已经有专业相应的文章来普及技术原理,介绍各种AI绘画工具和使用教程。我更好奇的是人工智能绘画给人们带来了哪些变化,以及人们在变化过程中的行为方式。

    带着这些疑问,我找到了西樵。她是一名设计师,也是漫画《神秘程序员》的创作者。今年5月以来,她几乎全身心投入到AI绘画的实验中。每天除了画画,她还看论文、写科普。她对AI绘画抱有很大期待,认为“AI对艺术和插画的影响相当于又一次‘相机的发明’,艺术史可以分册”。

    如果你想找到“什么是AI绘画工具?”的答案,建议阅读更专业、更系统的文章,比如西桥公众号里的教程(神秘的程序员:)。但如果你好奇“AI绘画跟我有什么关系”、“我能用它做什么”、“它会带来什么”,不妨继续读下去。

    中国互联网上关于AI绘画的讨论主要集中在今年4月。随着美术圈、编程圈从业者的使用和交流,AI绘画工具DD正逐渐被更多人所熟知。这是一个尚未打包的开源项目。它在  Colab 中以代码的形式呈现。绘图过程可以简单概括为输入关键字生成图像。与早期AI绘画缺乏整体美感、完成度较差的死板风格相比,DD在构图、色彩、氛围等方面都有了很大的突破。

    与此同时,CLIP今年4月提出的DALL·E 2等工具,结合扩散模型和DD作者所在的公司,也开始进入人们的讨论和使用。设计师和插画师开始制作“从零开始学习AI绘画”的教程。比如@JZ_在B站发布教学视频,@Awen在微博上持续更新AI绘画信息,或者人们在知乎上讨论“像迪斯科这样的AI绘画会对艺术行业产生什么影响?”

    和大多数专业画家一样,西樵之所以被人工智能绘画所震撼,是因为它的“可能性”。这种“可能”不仅能够彻底改变PS、3D辅助软件等工具带来的创作过程,还能带来内容上的解放。 “它可以帮助我创造出以前无法甚至不敢创造的东西。创造风格。”

    但西乔认为,与其将人工智能视为“创造者”,更合适的说法是人工智能是她画布上的另一只手。有时你可以“放手”,让AI自行运行,这会带来很多意想不到的惊喜。例如,在她的系列作品《西藏往事》中,艾伊在雪山之巅放置了一台塔吊。

    除了(迅速)设计和无尽的参数分析机器调整之外,还有另一个高度可控的玩法。当艺术家对生成图片的结果有了预期的目标时,他可以通过设计底图并设置底图中的跳过步骤数来提供手动指导(跳过的步骤越多,AI生成的地图越接近)是到底图)。或者获取生成过程中的中间步骤,修改中间步骤并放回到AI中继续生成。还可以调整参数,根据同一个提示输出多组结果,并在后期手动选择更符合创作者期望的部分进行合成甚至重绘进行二次创作。

    两只手画画给她带来了创作的解放,带来了探索和学习新知识的乐趣,也带来了几乎像打开盲盒一样的快乐。 “晚上写队列,早上起来等着取照片,只是浪费了一点电,收获的快乐是一样的。” “而与盲盒有限的选择相比,AI绘画可以完成的组合理论上是无限的。

    依托专业爱好者整理的中文资料、保姆式教程、打包程序以及支持中文描述符的AI绘画工具,AI绘画正逐渐显现出“出圈”迹象,进入大众讨论语境。比如,和菜头今年5月以来就多次发推介绍AI绘画。

    技术的向后兼容,让AI绘画为更多普通人开启了绘画的可能性。毕竟,对于大多数人来说,绘画要么是一扇从未打开过的门,要么就是有着极高的门槛。但通过人工智能,一些从未尝试过绘画的人无需依靠多年的学习和经验积累就可以创造图像。

    “人对于创造图像的直觉是与生俱来的,你会发现很多人绘画的巅峰其实是在小时候。随着他长大并接受越来越多现有的视觉绘画模式,后天的输入就变成了覆盖这种直觉。”

    当与生俱来的图像创作直觉受到现实的规训时,“大多数人尝试的创作并不是依靠直觉去画出自己脑海中的东西,而是尽量让自己画的东西符合现有的绘画,比如模仿照片,我会模仿别人的画和涂色书,然后当我逐渐发现自己在模仿方面落后时,我就会放弃绘画。”

    当“绘画”可以像“自拍”一样用来分享和满足成就感时,AI绘画工具或许可以帮助普通人找到被偷走的自由,享受创作带来的快乐。为此,一些AI绘画平台也在利用这一价值来实现商业回报,比如提供将AI生成的画作打印成挂画供用户购买实物的服务。

    DD等从文本生成图像的AI绘画工具都无法避免一个名为“CLIP”的模型,这是AI如何“理解”人类语义的关键。 CLIP(-Image Pre-)是一种基于对比图文学习的跨模态预训练模型,于去年1月发布。同时发布的还有第一代DALL·E图像生成模型。

    DD使用CLIP来“理解”用户输入的文本,然后使用扩散模型生成图像。这个过程可以理解为:向AI输入文本关键词。基于训练数据集的学习,它从一堆噪声点中推导出图像。通过不断匹配文本和图像,检查搜索结果是否与文本描述匹配。 ,然后逐渐消除噪声,添加细节,最后生成图像。

    “宇航员骑马”和“骑马宇航员”是解释人工智能理解语义的常见例子。 AI有能力描绘前者,但由于后者的“反经验”,并不是那么容易实现。

    人工智能能够生成风格化的图像,这些图像也源自巨大的训练数据集灌输的绘画风格。以DD为例,影响生成图像的重要因素包括作品的媒介、描绘的对象或主题、各种风格和纹理的修饰者、参考艺术家等。

    基于西桥的实验和理解,AI会提炼出艺术家画作的特征,比如整体创作的主题和对象、笔触、质感、明暗、调色板等。它的学习结果也受到流行程度的影响以及一些画家作品的题材多样性。例如,AI理解的塞尚、雷诺阿等画家的特征可能来源于所有作品,但如果某些画家有特别著名的作品,那么该画的特征权重就会比较高。

    比如西樵使用DD生成了一幅蓝色海洋的风景画,将画家设定为 David (大卫),发现很多生成的作品背面都有黑色的人物。她从弗里德里希的《雾海上的旅人》中推演了这个元素。

    (左为西樵AI生成画,右为《雾海行者》)

    除了研究艺术品之外,画家的国籍和文化背景也会影响AI的理解。比如说,如果你用一个中国艺术家来画一座建筑,它看起来就会非常有中国风格。如果用画师画日本漫画来输出肖像,角色很可能会有锥子脸和比正常人大的眼睛。

    上图是基于相同基础图像生成的人像实验。除了对艺术家的引用之外,铭文和参数都是相同的。左图的参考艺术家是anime girls,右图的参考艺术家是陈逸飞。

    了解AI如何“思考”,调整描述符的书写方式和技巧,也是为了让AI更好地“理解”创作者的意图。

    (如何编写描述符是教程的主要部分)

    从目前行业应用来看,AI绘画工具将在“绘画”上产生系统性的改变——作为创作过程中的生产工具提供新的技能点;成为艺术品中的新变量,影响作品的创作风格和价值;以NFT、拍卖画作等形式直接参与艺术品市场交易。

    在AI绘画工具辅助创作维度,可用于生成底图,可供画家作为草稿进行二次创作,也可直接用作透视图。

    艺术家还可以通过简单的色块勾勒出草图,让AI生成“幻想生物”作为灵感材料。

    随着AI绘画工具的介入,工具链或将面临重新整合。从AI生成的十几种结果中进行选择,作为插画创作的部分素材,然后使用PS或其他鼠标绘画工具进行光线调整和调整。颜色、边缘处理、纹理整合等

    另一方面,人工智能也正在成为影响艺术评价的新变量。

    “判断艺术品价值的标准是非常主观的,这种评价也不是一成不变的。一个新流派或者新媒介诞生之初,必然有一个接受和过渡的时期。”人们对AI绘画的评价,目前肯定面临很多争议。

    但随着AI绘画的普及,人们是否会继续使用现有的评价体系来看待AI绘画,或者是否会出现一套适合AI绘画的评价标准,目前还很难说。西樵认为,这或许会成为未来几年艺术史研究和艺术评论家的话题。学者们会找到一套他的评价体系,公众也会选择自己的标准。

    (AI生成图片的偏光评价)

    在她看来,虽然AI绘画工具展现出了不错的生产力,但与实际应用场景仍存在较大差异。例如,AI特别擅长制作场景概念图。这一功能将使其在游戏、动画、设计等领域表现出色,辅助创作。但如果用于工业设计、产品生成或者服装设计,目前还没有展现出足够的应用能力。

    此外,判断一项技术是否投入商用还需要考虑两个因素。第一个是是否满足需求,第二个是衡量投入产出比。目前来看,AI输出的图片尺寸还比较小。由于切片算法和模型的限制,当DD生成宽度超过1280的图片时,布局会非常不理想。 ,最大值为(1664,1664),DALL·E 2 (1024,1024)。如果要使其成为可以打印的尺寸,则需要稍后放大或重新生成。

    至于人工智能生成的画作直接用于销售,已经有行业先例。 2018 年,巴黎一个艺术团体使用 GAN(生成对抗网络)制作的一幅肖像以 1 美元的价格售出。

    也有AI绘画平台和创作者将生成的绘画作品铸造成NFT,但这笔交易也面临很大的不确定性。与其通过 NFT 赚大钱,人工智能挑战照片画廊业务可能更为现实。

    随着AI绘画工具的普及,一些功能可能会被盗用,造成负面影响。例如,通过添加“蒙版”,您可以重新绘制部分图像,将大象的背视图更改为正视图,或者将苹果自然地放在空咖啡桌上。

    这个工具是开放给大家想象的,这意味着它可以用于艺术创作和表达,但也可以被别有用心的人利用来成为伪造图像、制造假新闻的“武器”。

    过去的教训是,“”可以替代视频中的视觉和音频内容。曾被用于伪造名人色情视频、诈骗勒索、假新闻等,其使用已被限制。 2019年,在国内一夜爆红的AI换脸应用“ZAO”也受到用户隐私、信息安全等问题的质疑。

    除了用户使用造成的可见“垃圾内容”之外,AI的图像学习过程也不可避免地吸收了人类认知中关于性别、职业、种族的刻板印象和偏见,并潜移默化地体现在AI绘画的生成中。结果正在进行中。

    为了应对上述可能产生的负面影响,AI绘画工具的开发者采取了谨慎的开放态度、更长的内部测试周期、对图像描述符的调试过滤器以及控制等措施。

    国内某开发者设计的AI绘画工具在解释为何内测周期较长时向用户写道,“AI生成艺术是一个相对敏感且全新的领域,具有不可控性、合规性和用户体验性。都需要我们多次迭代,包括云部署、模型调整等,我们也希望TIA尽快和大家见面,但客观技术不允许。 ”

    订阅邮件显示,在最近的更新中,DALL·E“减少了种族偏见,更准确地反映了世界人口的多样性”。未来将根据用户反馈和评分进一步优化。

    至于开发者对过滤器的调试,目前还处于探索阶段。从西乔的亲身经历来看,她多次被滤镜“绊倒”。

    (系统似乎将“悬崖边祈祷”判定为“负面内容”)

    对AI绘画的另一大诟病是“侵权边界”。目前来看,这是一个灰色地带,行业还没有定论。

    以DD为例,该工具遵循MIT开源许可,理论上生成的图可以免费商业使用。但在实际使用中也可能存在,因为描述符的使用导致画风相似,很容易引发抄袭纠纷。另外,“如果使用别人的作品作为底图,然后将跳跃值设置得很高,那么最终的结果将很难判断是否构成作品侵权。”

    事实上,对于真正的画家是否抄袭、是否构成侵权,存在着各种复杂的争议。当谈到AI绘画的侵权问题时,可能还需要足够的经验和案例来形成行业意识。

    最后,西桥还补充道,AI绘画也可能面临“负反馈”的可能,即人们使用AI绘画工具生成的图像被进一步用于AI的优化和训练。 “AI模型可能会表现出类似放大器的效果,最终会发生什么,我们现在还不知道。”

    西桥喜欢用“相机”来比喻AI绘画。 “相机刚诞生的时候,成像速度很慢,暗室处理也很麻烦,设备携带和使用不方便,成像效果也不一定好。”当时的肖像画家,对于用相机拍摄肖像有很多批评和嘲笑。

    “但我们知道,几十年后,画家在绘画时几乎总是会使用相机照片作为参考。因为一天中光线变化如此之快,所以你的模特不太愿意坐在那里几个小时。”

    不仅是肖像、风景,还有基于照片等进行后期处理的数字绘画等,都或多或少地被相机的应用所改造,带来了艺术形式的变化。

    在社会层面,“摄影”也从特定阶层支撑的特定生活方式走向公民阶层,记录社会变迁和普通人的日常生活。这种技术力量的解放和扩散随着当今智能手机的发展尤其蓬勃发展。普通人可以以更低的成本、更方便的使用掌握相机的摄影能力。

    可以预见的是,AI绘画工具的技术迭代不会花费“相机”发展所需的数十年、数百年的时间。除了上面提到的DD、DALL·E 2等工具外,各大互联网公司也纷纷入局,比如谷歌的/Parti、Meta的Make a scene、微软的NUWA等。国内开发者也纷纷投入赶上全球人工智能艺术浪潮。比如,目前正在举办的“千人共创——人工智能艺术创作大赛”。

    人们对AI绘画的使用和认知还很短暂,其影响力目前更多存在于艺术圈和编程圈。但未来,AI绘画能否超越阶层、圈子,像“相机”一样渗透到普通人的生活中,是一个值得引发足够想象的事情。

    本文来自微信公众号,作者:智贝BB集团双桥君,36氪经授权发布。
您需要登录后才可以回帖 登录 | 立即注册

Archiver|手机版|小黑屋|关于我们

Copyright © 2001-2024, Tencent Cloud.    Powered by Discuz! X3.5    京ICP备20013102号-30

违法和不良信息举报电话:86-13718795856 举报邮箱:hwtx2020@163.com

GMT+8, 2024-12-21 07:56 , Processed in 0.063069 second(s), 18 queries .