【即梦AI教程】3.即梦AI视频生成讲解
首先点击左侧的生成分页,我们将下方对话框当中的图片生成点击切换为视频生成。视频生成的操作逻辑同样很简单,和图片生成类似,分为文生视频和图生视频。我们先来看文生视频,我们可以利用豆包AI帮我们提供一段文生视频的提示词。我们复制这段提示词粘贴到输入框当中,在下方可以选择视频生成的相关参数,这个位置我们可以选择视频生成所使用的视频模型。在模型名称的下方也描述了这个视频模型的特性。同样是版本标耗越高的模型通常效果越好,所以我们保持默认。
右侧的这个选项是调节生成的宽高比的,常用的两个宽高比分别是16比9和9比16,分别适配于电脑和手机。而最后一个选项是调节生成视你的时长的。这里不是很建议大家生成10秒钟的视频,因为无论是文生视频还是图片视频,都伴随着一定的随机性。时间越久,可能出现的突发状况出现的概率就越高。因此十秒钟的视频往往不会出现很好的效果。我们选择5秒维持默认,最后我们直接点击生成,稍待片刻后视频就生成好了,我们来一起看一下视频的效果。
可以看到视频的效果还是挺惊艳的,画面当中人物的运动场景和人物造型的稳定性,以及画面当中建筑人物的结构逻辑都非常的不错。目前我们可以设置的5秒钟的时长,作为素材或者说一个分镜头来说,通常是可以满足视频剪辑的需求的。而且生成这个频大约只用了10秒钟左右,因此生成视频的时间成本不高。即便生成的有些问题,我们也能以较低的时间成本去快速的修改。
我们下面再来尝试用人物的照片进行图生视频的操作。点击输入框左侧的加号,以这张图片为参考,我们制作一个视频。提示词方面我们同样可以借助豆包AI将需要参考的图片上传到豆包AI上,这里直接拖拽就可以了。提示词方面我们就要求豆包AI给这张图片写一段用与图生视频的提示词。我们点击发送,稍待片刻我们就获得了一段提示词,直接将提示词复制粘贴到图生视频的提示词输入窗口。此时我们可以看到上传图片以后,宽高比设置的位置会自动匹配宽高比生成的视频在宽高比上也会与我们上传的图片保持一致。因此这里就不需要再手动设置了,我们直接点击生成,大约10秒钟之后,这段视频就生成好了,我们来看一看效果如何吧。可以看到极梦对人物的生成效果还是非常强大的,即便是对于这种骑自行车的复杂画面,也依然能够轻松驾驭。
除了从电脑中上传图片,制作AI视频,在先前我们生成的图片当中,我们点击这张图片展开,可以看到右下方有将这张图片生成为视频的便捷选项。我们点击之后会快捷的将这张图片添加到图生视频左侧的图片窗口当中。此时我们只需要修改提示词,描述画面的内容和动态,就可以快捷的将我们生成好的图片生成为一个视频了。例如我们书写猫在打篮球,然后点击生成。这里需要说明的是,通常图生视频在提示词的描述上不需要过于复杂,因为图片能够展现全部的画面信息,因此往往提示词无需再描述画面内容,更多的是在描述运镜以及画面当中需要做出动态的部分。
我们来看一看生成的效果如何。可以看到虽然物理效果还有一些缺失,但大体的方向是对的这也提醒我们在视频生成时,一些日常生活中难以见到的场景。和图片生成一样,视频生成也是难以生成出好的效果的。
我们回到生成页面来讲解一下数字人功能。点击下方的切换分页,将功能切换为数字人。可以看到切换好之后,在聊天窗口左侧出现了两个上传窗口。其中第一个上传窗口是上传人物图像的,也就是数字人的形象。需要注意我们上传的数字人最好是正脸且足够的清晰。因为在上传之后,他会先识别画面当中的人物,如果识别失败的话是不可以上传的。
然后在人物的右侧是音频上传窗口,我们既可以通过文本直接生成音频,也可以直接上传一段我们自行录制的音频。这里我们就直接生成一段音频,输入我们想要数字人朗读的音频,下方可以选择数字人的音色,点击这个音色可以对音色进行试听。海星没有大脑和血液,其身体主要依靠海水循环完成营养输送和呼吸。
海星没有大脑和血液,其身体主要依靠海水循环完成营养输送和呼吸。在音色的右侧还有一调节选项,大部分音色都可以调节说话的速度,而有一些音色还可以调节说话时的语气,例如这个音色可以看到下方的情绪,有开心、愤怒、害怕、惊讶,我们选择开心。海星没有大脑和血液,其身体主要依靠海水循环完成营养输送和呼吸。能够明显感受到人物说话时的情绪变得不同了。确认好音色以及相关参数后,我们直接点击确认,最后点击右下方的生成,我们现在来看一看生成的效果如何。海星没有大脑和血液,其身体主要依靠海水循环完成营养输送和呼吸,可以看到生成的效果还是比较稳定的,人物的口型与我们输入的文本也比较匹配。
我们最后再来看动作模仿功能,点击下方的切换按键,切换到动作模仿。这里同样有两个窗口,其中第一个窗口是上传角色的,第二个窗口是选择动作的。其中角色图片可以是半身的,也可以是全身的,但是要尽量保持正面且肢体之间没有交叉。而右侧的动作选项我们点击之后可以看到这里目前一共提供了四个模板。也可以我们自行上传参考视频,比如一段人物的舞蹈或者是动作。这里我们就以这张全身的人像为例,上传之后我们选择右边的动作模板,我们可以将鼠标悬置在动作模板右下方的扩展箭头上,此时就可以预览这个动作模板的视频。我们点击之后选择,然后直接点击右下方的生成OK,我们下面就来看一看生成的效果如何。
可以看到人物最终的动态还是十分自然的,不过和原图相比,在比例方面人物稍微有一些扭曲。我们只能期待在将来的更新当中,动作模型能够解决人物比例的问题。我们最后回到极梦AI的首页,在左侧的选择菜单当中有一个叫做故事创作的功能。对于这个功能我们简单讲解一下,它其实就是一个在线版简单视频生成加剪辑软件。在下方左侧的这个选项中,我们点击之后可以从本地或者从我们生成过的图片当中选择一些图片或者是视频片段。在左下方可以继续添加素材或者添加音频,而上方还有对应的视频延长对口型、视频补帧、视频超清化等功能。
我个人不是很建议大家使用这个功能对AI视频或者图片进行编辑或剪辑。因为相比于专业的剪辑软件来讲,它的功能还是太少了,在编辑时会遇到诸多不便。想要获取更好的视频编辑体验,还是建议大家使用剪映这种专业的视频剪辑软件。上面不只支持视频剪辑,我们想要对视频进行配音、配乐,还有非常便利的在线搜索、配音、配乐的功能。除此之外,像特效、转场、字幕、贴纸,包括我们之前演示的数字人效果,在剪映上一样可以制作。所以我们今天讲解的视频生成、私人和动作模仿这三个功能,我主要还是推荐大家使用视频生成功能。后期剪辑也使用剪映PR等相对专业的剪辑工具。好了,本次分享就先到这里。
不知道大家会不会有这样一个感受,就是每一轮科技革新带来的变革往往包含两个方面。其一是为了提升行业的下限,AI目前已经开始大面积取代较为初级和要求不高的内容产出岗位,也就是之前成本相对较低的制作已经被AI压得更低。其二也就是为行业的上限提供了更广阔的发展空间,在追求更亮眼的创意、更高端的品质的同时,也由于新工具的使用而对生成效率提出了更高的要求。简而言之,AI时代是一个更容易诞生超级个体的时代,繁琐枯燥的工作被AI接管之后,人的价值会更加突出。因此如何让自己的思维能力和学习能力在更深更广的维度上实现突破,这才是我们需要聚焦的问题。