大家好,我是萧霄老师,今天我们将一起探索AI技术在视频领域的创新应用。
我们将从AI技术的大环境介绍开始,逐步深入到如何利用这些技术制作一个属于自己的AI视频。
AI技术的发展带来了文生图技术,它能够根据文本描述生成相应的图像。
Midjourney和Stable Diffusion等工具通过深度学习算法,将文本转化为视觉图像,极大地丰富了创意表达的方式。
图生视频技术能够将静态图像转化为动态视频,简化了视频制作的流程。
抖音的“即梦”和快手的“可灵”等平台,通过AI技术,实现了从图像到视频的快速转换。
文字转声音工具,通过模拟真人语音,为信息传递提供了新的途径,提高了信息传递的效率。
接下来,我们将看到AI技术在游戏领域一个精彩的案例——沙威玛传奇。
这款游戏完全由AI生成,从故事情节到角色设计,再到游戏环境的构建,全部由AI技术完成,展示了AI在游戏开发中的潜力。
AI技术在游戏设计中的优势在于其能够快速生成大量的内容,并且可以根据玩家的行为和反馈进行实时调整,使得游戏设计更加灵活。
现在,让我们来到期待已久的教学环节,我将教大家如何运用上述提到的AI工具生成一个自己的AI视频。
第一步:分镜设计。利用ChatGPT等文字ai工具提出简单的要求让他生成一个分镜描述,提示词为:创作一个给五岁小孩的绘本故事脚本设计,以主题“山东淄博的蓝天”设计一个小故事,故事充满想象力、童趣、通俗易懂,吸引小孩子的兴趣。
主角是一个可爱的小男孩,情节包含新旧动能转换前,新旧动能转换后,体现出新旧动能转换前后的对比,结尾引人深思,包含六个分镜。(情节部分可以替换成自己的故事设定)。
要在ChatGPT生成的结果中挑选一个最具有画面感的且人物动作较为简单的脚本,以便在图生视频时不出现较大且难以控制的问题。
接着让ChatGPT生成对应的画面描述,并转换为英文。关键词为:生成以上分镜的画面描述,以便后续用ai工具进行文本生成图片。
第二步:文生图。这里用到的ai工具为midjourney,具体使用两个关键技巧来提升画面的艺术性和可控性:风格一致性和人物一致性。
首先要控制风格一致性,需要先确定画面风格。最简单的方法就是使用风格引用图。这里我在midjourney的首页找到以下图片作为风格参考。
把这张图片上传到midjourney中,右键可以获得图片链接,这个图片链接将被用作生成图像时的风格引用参数。
接着把之前ChatGPT中生成的画面描述复制到mj中作为主题提示词,然后加上风格引用参数--sref 粘贴上刚才的图片链接。注意--sref和图片链接之间要有一个空格。后发送给midjourney生成图片。
接着就是控制人物一致性,主角要有明确的特征且能让观众印象深刻。
根据这个原则我们可以让ChatGPT来生成人物设计,提示词为:描述故事中的人物形象,特点明显,可爱。用同样的方法翻译为英文后,提炼关键词,丢给mj生成形象。
可以看到,在有了关键特征之后人物形象立刻就有了记忆点。金色卷发、橙色衣服、大眼睛、短裤,这些特征可以帮助快速识别角色。
接下来将场景描述,风格一致性和人物一致性的提示词组合在一起,以这个方式为每个分镜生成图像,保证风格和人物的一致性。
整个创作时长不超过二十分钟。
第三步:图生视频。
打开ai视频创作工具,这里用到的是海螺。上传图片,再将分镜中的情节描述粘贴过来,点击生成,就获得了对应的视频片段。
第四步:剪辑配音。将生成的视频导入到剪辑软件中,以剪映为例,添加转场和文字等。剪映中自带的ai配音的音色已经很不错。
想进一步有感情的话,可以使用我推荐的网站。在这里可以调整人物的音色、感情语速还有停顿等。将生成的音频下载下来导入到剪映中,拖动位置进行卡点等操作。
对版权意识比较强的同学也可以加上自己的水印。
提到版权,在这里插一句题外话。在AIGC时代,版权归属仍然是一个有争论的问题。随着AI技术的发展,越来越多的内容是由AI生成的,这给版权的归属和保护带来了新的挑战。有想法的同学可以在课后找我来讨论哦。
回归正题,最后将制作好的视频导出就完成了我们自己ai视频的初体验。一起来看一看吧
最后,希望大家能从本次教学中得到启发制作出更多反映现代化山东风貌的创意ai视频,刻画山东在新时代背景下的蓬勃发展态势,展现出山东作为全国重要经济文化强省的独特风采与无限潜力。
好啦,本次教学就到这里了。我是萧霄,我们下期节目再见。