分享好友 最新动态首页 最新动态分类 切换频道
AI 绘画神器 Stable Diffusion 玩法大测评
2024-12-26 08:53

AI 绘画神器 Stable Diffusion 玩法大测评


转载来源于“码上跃见”,感谢趣丸媒体算法团队倾力奉献!

写在前面作者:自然语言探索家字数:2759字;阅读时间:约9分钟人工智能创作内容(AIGC)大家一定都不陌生,它绝对是2022年AI领域最热门的话题之一。在ChatGPT出现之前,AI绘画就凭借其独特的创意与便捷的创作工具迅速走红,让AIGC 火爆出圈,广受关注。22年以来,以 Stable Diffusion、Midjourney、NovelAI 等为代表的文本生成图像的跨模态应用相继涌现。基于 Stable Diffusion 生成人和场景的效果都比较好,本文就带大家深入体验这款绘画软件。(一定要看到最后,笔者汇总了多个版本的体验地址等着你)


码上跃见码上致知,跃见非凡。10篇原创内容公众号阅读之前,先➕个关注呗~Stable Diffusion 是什么?Stable Diffusion是2022年发布的深度学习文生图模型。它主要用于根据文本的描述产生详细图像,此外它也可以应用于其他任务,如内补绘制、外补绘制,以及在提示词(prompt)指导下产生图生图的翻译。它是一种潜在扩散模型,由慕尼黑大学的CompVis 研究团体开发的各种生成性人工神经网络。它是由初创公司StabilityAI,CompVis与Runway合作开发的,并得到EleutherAI和LAION的支持。截至2022年10月,StabilityAI筹集了1.01亿美元的资金。Stable Diffusion的代码和模型权重已公开发布,可以在大多数配备有适度GPU的电脑硬件上运行。简单说下,Stable Diffusion可以实现:文本生成图像、基于Prompt的图像生成图像、基于Prompt的图像修补。用户使用痛点对于刚接触Stable Diffusion不久的用户而言,通常会存在以下一些痛点:1. 怎么玩?刚了解不久,这玩意到底应该怎么玩呢?2. 不好玩?会玩一点了,但出图的效果也就那样吧?3. 玩不转?比较会玩了,它还有啥有趣的功能应用?对于用户以上的痛点,本文将结合具体的案例进行针对性解答,为深感迷茫的你指点迷津。怎么玩?这个比较简单,输入自定义prompt,也就是任意你想生成的图像内容,然后点击生成就好了。如果不满意,可以再次点击,每次将随机生成不同的图片,总有一些你感兴趣的。

不好玩?玩了好久了,用户的审美也进一步提升了,对AI绘画的要求也进一步提高,但是总感觉AI生成的图像也就那样,10张里面可能就1张能够上眼,其余的就有点辣眼睛了,比如下面这种:

或是,这种(梅老板的球迷求轻喷):

造成生成效果不理想的原因有很多,本文列举主要的三点原因,跟大家逐一分析。1. 没有选择正确的模型版本不同stable diffusion版本由于finetune了不同的数据,所以各有所长,下面简单罗列下:模型版本特性总结

从上可以看出,不同版本的AI绘画各有所长,使用时可以挑选合适的版本进行使用。2. 输入的prompt不够明确从模型的角度而言,它生成的图像和用户输入的prompt相关。但从用户的角度而言,AI虽然生成了相关的图像,但是生成的图像艺术性不佳(个人主观),不够惊艳,不具美感,有些有明显的细节错误,完全不是用户想要的。这个矛盾的根源来源于:用户潜在地带入了个人的审美(比较心理),希望AI生成的图像能更好看些,至少没有明显的绘画细节错误。但训练的数据里却没有告诉AI哪些图片才更好看,只是采用CLIP的对比损失,这样就注定了AI绘画的定位就类似搜索里的语义初召。正如引入强化学习的ChatGPT,经过pairwise排序学习后,模型才能更好的把握生成的质量,也就有了更惊艳的效果。所以,对stable diffusion改进引入排序学习后,相信AI绘画基本具备给生成的图像进行艺术性打分了,但至少目前还不行。使用AI绘画现阶段的建议如下:输入更加详细的prompt,让AI更加了解你具体想生成什么,想达到什么效果,也就是限制AI绘画的发挥空间,避免它随意乱发挥。不知道prompt奥妙的,可以参考下面这个网站,里面收集了各式各样的AI艺术绘画,喜欢的可以研究捣鼓下:https://lexica.art/(复制到浏览器打开)

3. 生成的参数未调好一般生成都是有些参数可以调节的,比如:生成的图像高度(Width)和宽度(Height),生成迭代步数(Steps),图文相关性(CFG Scale),采样算法(Sampler),随机种子(Seed)等。TT-SD的生成参数调节:

InvokeAI的生成参数调节:

参数总结Steps-生成迭代步数一般取50即可,若采样算法选DPMSolve++,此处取25就可取得50步的效果;CFG Scale-图文相关性一般在6~20之间,太高了的话生成的艺术性太差,可以多设置看看;Sampler-采样算法不做推荐,针对不同需求可以多试试;Seed-随机种子设定随机种子后,每次将生成相同的图像,无随机性,可方便复现;Width-生成的图像宽度一般取512就好了,不建议1024x1024的大图,可以upscale实现高分辨重建;Height-生成的图像高度一般取512就好了,不建议1024x1024的大图,可以upscale实现高分辨重建;诀窍小结诀窍:选择正确的stable diffusion版本 + 输入合适的prompt + 生成参数调节 + 三分运气总的来说,就算比较了解AI绘画,也几率会出残图,所以还看三分运气了,不想看运气的,每次批量生成10张+,从中选几个好的就完事了。玩不转?迈入这个境界,用户已经对AI绘画有了初步的理解和掌握,也能根据调整自定义的prompt生成不错的样图。当然了,人对艺术的追求是无止境的,用户会苛求更完美的作品,同时也会衍生一系列其他的需求,比如:它能不能对已有的图片进行修改,进行风格迁移,或者说对图片进行变脸等有趣应用。为了满足笔者自己,以及广大科技爱好者的好奇心,下面简单介绍下AI绘画的一些进阶的有趣玩法和推荐:图像生成图像1、风格迁移把原图进行动漫风格化,同时也可以通过prompt进行额外调整。

关键生成参数调节:

注意:使用风格迁移,除了指定风格,也可以多添加些额外描述词,这样出图的效果更稳定些,主要是人物的脸部细节较复杂,需要prompt约束下AI绘画,生成我们真正想要的。2、高级美颜把原图进行脸部精修,达到不错的效果。

3、角色替换例如将一只贵宾替换成一只哈士奇或是一只猫。

图像修补图像修复属于图像精调的范畴,可以看作简单的局部图像生成图像,好处是只对特定部分进行修改,其余地方维持原样。(PS看了都说绝!)操作如下:任意选定(或涂抹)图像一些部分进行遮罩处理,然后输入自定义的prompt进行修改。下面简单示例下:1、图像内补

2、图像外补

文本生成图像1、剪纸画艺术生成剪纸画风格的图片,首选版本:papercut-1.0,prompt增加额外关键词:papercut。

2、风格类风景

栗子1:meadow, valleys, rivers, blue skies, castles, magnificent, magical, birdie, light effect

栗子2:beautiful landscape photograph of snow-covered Rocky mountains, a dead intricate tree

3、美食生成

4、二次元头像生成首选版本:waifu-diffusion栗子1:girl, purple eyes, detailed eyes,   red hair,   short hair, closed mouth, blue shirt, cute face, looking at the viewer, solo, upper body, simple background

栗子2:boy, purple eyes, detailed eyes,   blue hair, short hair, closed mouth, yellow shirt, looking at viewer, solo, portrait, universe background, highly detailed

5、古诗词绘画首选版本:Taiyi-Stable-Diffusion-1B-Chinese-v0.1栗子1:空山新雨后,天气晚来秋

栗子2:日出江花红胜火,春来江水绿如蓝

6、超分辨率重建(工具箱功能)以InvokeAI为例,可以很方便一键进行超分辨重建,图像分辨率直接拉到4K。

功能太多了,写不完了,只要你会玩prompt,就能玩出新花样!马上玩!在上文「模型特性总结」部分已经给大家总结了 Stable Diffusion 各个版本的特性,有兴趣想体验一把的朋友,关注本公众号,在后台回复「Stable Diffusion」,获得汇总的源码链接。当然,不想下载本地版的朋友,也可以打开 Stable Diffusion 的网页版:https://beta.dreamstudio.ai/ (复制到浏览器打开)无痛在线体验。 除了国外的几款AI绘画软件,国内大厂如百度也推出了自己的 AI 画画产品:文心一格。不同的 AI 画画平台的技术实现虽有差异,但其核心能力都是输入巨量训练集,大量分类、识别已有图像,再根据关键词匹配和“缝合”,最终生成一幅随机的、世界上独一无二的AI画作。本期玩法大测评是不是很过瘾,广大对AIGC感兴趣的朋友请期待我们后续的测评和技术原理分析!

最新文章
电商和淘宝有什么区别
电商(电子商务)是一个行业,淘宝是这个行业里一个很大的网站。淘宝网是电子商务领域的一个平台,电子商务是以信息网络技术为手段,以商品交换为中心的商务活动;也可理解为在互联网、企业内部网(Intranet)和增值网上以电子交易方式进行
长沙百度搜索排名优化
摘要:长沙百度搜索排名优化是针对企业在百度搜索引擎中提高关键词排名的一种服务。通过优化网站结构、内容优化、外部链接等手段,提高网站在百度搜索结果中的曝光率和点击率,从而增加网站的流量和用户转化率。优化过程中需注意关键词的选
还有什么其他搜索引擎可以替代百度?
上一篇: 推荐一个站点 Apache 的 Glyptodon (福利自行挖掘)下一篇: rabbit 教程,可以多人在线观看视频(内含福利)本文最后更新时间为 2019-1-31,可能会因为未及时更新导致部分内容失效。本文为原创文章,未经授权,禁止转载。上周一篇文
上云上平台优秀案例丨湘凡科技:“数字营销”企业级销售大模型
深圳市湘凡科技有限公司:“数字营销”企业级销售大模型Company Profile深圳市湘凡科技有限公司成立于2013年,是一家专业研发、生产、销售和服务电脑周边(网卡、HUB、视频转换器)及移动数码(蓝牙、线材、TYPE-C、充电器)产品的制造商。
百度导航不见了怎么办?有效的恢复方法和大家一一道来 环球即时
我们在打开百度首页的时候,都会看到一个清新简洁的页面。随着百度首页推出新版以来,新的界面和人性化的设置着实让不少人喜爱,我们可以在新版百度首页中设置我的导航。但是最近有不少网友反应,自己先前设置好的百度首页中我的导航突然就
超逼真美女写真生成:用AI技术打造你的AI女友
ArtbreederArtbreeder则是一款着重用户创造力的工具,允许用户通过简单的滑动条调整图像特征,创造出不同的美女形象。其混合特性让用户能够产生独一无二的视觉效果,极富趣味性。但由于需要一定的美学基础,可能不适合所有初学者。搜狐简单
魔众课程管理系统PHP源码 v6.4.0
魔众在线课程系统采用PHP+Mysql架构,是一款对SEO非常友好、功能全面、安全稳定、支持多终端展示并且使用起来极其简单的在线报名管理系统。魔众课程报名系统发布v5.3.0版本,新功能和Bug修复累计7项,常规迭代,编辑器数据表格优化。2021年1
第三季度豪华品牌中型车质量排行沃尔沃S60第一DS9垫底
第三季度豪华品牌中型车质量排行:沃尔沃S60第一,DS9垫底如果打算买豪华中型车,其实应该多关注车型质量情况,毕竟车型如果质量不靠谱,加上维修成本高,这样养车就难了。我们可以参考一下第三季度豪华品牌中型车质量排行,其中排名第一位
移动搜索引擎SEO优化策略与实践
我们先来讲一下为什么要对微网站、进行SEO的优化,以及优化的原则有哪些吧。首先,大家都知道,传统的PC网站做了SEO优化之后,所获得的流量和转化的效果比起没有做的要强一些。那么,同样的在移动搜索方面也
银行卡多长时间逾期会有什么后果
在日常生活中采用银行卡实施消费和借贷已经成为了一种普遍现象。在享受便利的同时也必须留意按期还款否则可能将会带来一系列严重的影响。本文将详细介绍银行卡逾期的不同情况及其可能产生的结果。当银行卡逾期在一个月内时,这类情况被称为
相关文章
推荐文章
发表评论
0评