【即梦AI教程】2.即梦AI图片生成讲解
这节课我们充分利用其提供的功能来尝试完成几个综合性案例。在这里我需要强调一下,极梦AI在免费的情况下也是可以直接使用的。它每天在使用完成后会自动复位60点的生成点数。通常来说我们生成一张图片会消耗一个点,生成一条视频会消耗12个点。所以说如果是轻量级的使用,基本上是够用的。当然如果大家使用的比较频繁,也可以进入到开通会员的页面。通常基础会员每个月有1000左右的积分,能够生成四千多张图片和300多条视频,对于普通创作者大多数情况下都是绰绰有余。
我们回到首页,然后点击左侧的这个图标生成选项。进入到生成页面之后,我们先从图片生成开始讲起。因为刚刚我们所提到的图生视频是一种更加可控的视频生成方式。所以在生成视频之前,我们先从最基本的文生图开始了解。我们当前的页面非常的简洁,其中上方这片区域就是图片生成之后的展示预览区域。而在输入窗口当中就是我们设置图片生成参数以及生成模式的区域。
极梦AI的图片生成集合了stable diffusion on和made journey的特点。我们要生成图片,首先需要在输入窗口输入一段提示词描述。例如一只橘猫在打篮球,黄昏的球场丰富的细节。我们输入这些最基本的提示词,然后我们看这里有一个图片选项,我们点击将它展开。这里提供了不同的视频模型选项,在小字部分还说明了这个模型生成时的特性,大家可以在生成不同风格图片时选择更加适配的模型。通常版本越新的模型效果也越好,所以我们就保持默认。
然后在右侧选项的比例这里,我们点击将其展开,可以看到这里有很多我们熟悉的比例设置,通常横版的就是16比9,而竖版的就是9比16。除此之外下方还可以选择分辨率,我们通常选择标清就够用了。如果想要提升图片的清晰度,像ComfyUI的工作流或者外部UI有很多的免费手段,就能很好的提升画质的清晰度和细节。我们这里还是选用一个一比一的比例来生成11328乘1328分辨率的图片。当然这些尺寸也可以手动的进行修改。
我们现在直接点击右下方的生成,可以看到当前的画面,就是在展示生成的过程。极梦AI在默认的条件下会一次生成四张图片,这样即便有某些图片生成的效果不好,我们也能从中挑选一张生成效果较好的进行保存。可以看到生成的结果还是挺让人满意的,对于提示词的把握也是比较准确的那可能有些小伙伴会说,如果说我连提示词都想不出来那该怎么办?其实也很简单,让AI给你一点启发就好了。所以这里我也提前准备好了一些AI帮我写出来的提示词所使用的语言模型,也是字节旗下的豆包大模型。我告诉他帮我写几段适合极梦AI生成图片以及生成视频的提示词。因为都是自家产品,所以他也没有啰嗦,很快就理解了我的意图。
在这些提示词当中我们来找一段,就比如这一段看起来十分梦幻,我们直接把它复制过来,然后回到图片生成页面,粘贴在下方的模型选项中,我们也可以选择其他风格的模型。例如我们选择这里的2.0 pro描述是极具想象力,擅长写真摄影,我们就选择这个,可能生成的结果就会更加贴合模型所描述的摄影风格。我们点击生成,不过AI虽然生成的效果不错,但还是建议大家自己开动脑筋,通过自己的构思来写提示词。毕竟创作的灵魂是要由我们自己来把控的。
可以看到我们生成的结果已经出来了,果然是非常的梦幻。不过同时也不能否认,旧版的模型在生成的细腻程度上,和我们刚刚使用的3.0模型依然存在一定的差距。好在图片生成的成本不高,对于同一段描述我们可以尝试切换不同的模型,找到最适合这段描述的模型版本。
那么完成了这几幅图片基本的生成流程后,我们下面更进一步。比如当我们的鼠标悬停在某一张图片的上方时,这张图片的下面就会弹出很多分选项。例如第一个分选项是做超清化处理,增强这张图片的清晰度。第二个选项细节修复,可以修复画面当中可能生成时失真的细节。
第三个选项局部重绘。相信对于熟悉stable diffusion sion或者made journey的同学,这个选项就很熟悉了。可以选择画面当中的某一样物品,选中之后配合提示词去重新生成。第四个选项扩图,使用后可以生成取景框之外的画面。第五个选项生成视频,可以直接将这张图片导入到视频生成页面。第六个选项消除笔,可以消除画面当中我们选中的物品。最后一个选项对口型,其实就是AI配音功能,可以让我们上传的音频与生成的视频口型相对。
我们这里就选择局部重绘进行一个简单的尝试。点击之后会弹出一个窗口,在这个位置我们可以调节选区笔的粗细。确认好之后,我们可以选中篮球所在的位置,对篮球进行修改。如果对选区的范围不够满意的话,在左下方还有橡皮擦工具,用来擦除我们选择的区域。这里我们就以这个篮球为例,选中之后再提示词窗口,我们就仅描述选中区域想要生成的内容就可以。例如这里我描述一个金色的篮球,然后直接点击右下方的生成,可以看到生成的结果,非常准确的理解我们提示词的含义,生成了一个金灿灿的篮球,包括我们之前生成的图片,也是可以进行一定的修改的。比如在这个图片当中,主要的场景是一片大海,所以我们点击局部重绘,选择天空的区域,我们可以在天空中生成一些海鸥。写好提示词之后,直接点击生成,可以看到局部重绘不仅可以替换画面当中的内容,也能够凭空的生成一些内容,效果还是不错的。
我们下面换一种玩法,在提示词输入窗口这里,除了直接输入提示此来生成图片之外,在左侧还有一个上传参考图的位置。在上传参考图之后,极梦AI会对上传的图片做一个信息的提取。我们下面就来演示一下。例如现在我们导入这样一张图片,导入后会弹出一个新的窗,这个窗口当中为我们提供了这样几个选项,比如智能参考、主体识别、边缘轮廓、景深等等。相信有SD基础的小伙伴已经发现了,这个部分和control net的操作逻辑非常相似。我们下面选择人物姿势这个选项,此时在原图的右侧就会输出一张检测图,这就是由吉梦AI提取的人物姿势。我们点击右下方的保存,在人物姿势参考的基础上,我们再写入一段描述人物造型的提示词。画面比例方面我们最好跟原图保持接近,我们就选择9比16这个比例。
最后点及生成可以看到总的来说生成的结果对人物姿势的提取还是比较准确的,但同时我们也不难发现,部分人物生成的肢体伴随着一定的残缺,这和country night功能在stable diffusion中的表现比较类似,算是一个control t open pose功能的通病了。所以这也提醒我们在选择人物姿势参考时,尽量避免那些肢体之间有穿插交叉情况的姿势,这样才有可能生成更好的结果。我们将参考图的模式换为人像写真,然点击保存重新生成一次。可以看到这次生成的结果就比上一次要好上很多,因为我们只要求了人物长相特征的一致性,对于其他部分的生成并没有做太大的限制。因此图片参考功能的不同选项效果依然有参差,同时也伴随着一些随机性,在生成时依然需要我们进行一定后期修改或者寻找比较适配的参考图。
我们的目光移到左边的分选项,在这个位置有一个叫智能画布的功能,我们点击打开智能画布,相关的操作其实和我们刚刚讲解的内容差不多,但是可以自由选择画布的尺寸。另外这个功能还可以实现抠图,我们下面上传一张带有背景的人物图片,然后我们选择右上方的抠图选项,它就会自动识别我们所上传图片当中的人物主体,基本上不需要我们做什么额外的操作。不过偶尔会有抠图不全情况,我们也可以用这个选区比来增加选择的范围。确认无误之后,我们点击下方的抠图,这就是我们抠图之后的效果,看起来效果还是不错的。
如果想要获取抠图之后的PNG文件,我们可以直接点击当前页面右上方的导出。在这里将格式更改为PNG格式。尺寸方面我们可以选择以二倍的图片尺寸导出,不过这个操作并不能让图片变清晰。如果想先让图片变清晰再导出的话,我们在导出之前可以先选择这里的HD超清,将图片做清晰化处理,然后再将图片导出下载。在完成后我们来到PS来查看一下这张抠好图的图像。可以看到抠图的效果还是非常不错的,精确到了每根发丝都清晰可见。
完成这些操作之后,我们回到首页,在左侧的分选项当中有一个叫资产的选项,图标是一个文件夹的图标,我们点击打开这个选项,实际上就是给我们提供了一个统一的我们生成作品的一个管理页面。我们也可以点击右上方的批量操作,对这些生成过的图片进行批量处理。例如选择内容之后,我们批量将其删除、下载、收藏或者去剪映,直接编辑,这样操作起来会非常的方便,特别是之后生成的视频片段,可以在这个页面直接导入到剪映当中,就无需先下载后导入了。有了生成图片这样的基础操作,我们下节课讲解视频生成就是水到渠成的事情了。