人工智能/Stable Diffusion 镜头控制

在 AI 绘图的上下文中, "控制镜头"可能不是一个直接的概念, 因为 Stable Diffusion 在创作画面的时候并没有实际的物理镜头. 但是, 可以使用一些类似于电影拍摄中的概念来描述要生成的图像. 镜头有两个方面组成, 分别是镜头距离和镜头角度.

  • 镜头距离: 确定你的绘图中的主体位置. 是特写, 还是远景?
  • 镜头角度: 考虑以哪种视角呈现场景, 这可以改变观众对画面的感知. 例如, 俯视, 仰视, 还是其他角度?

在本文中, 我们使用 meinamix_meinav10.safetensors 模型来演示如何控制镜头. 我们采用的基准 prompt 如下. 后续的示例只在此基础 prompt 增加一个新的用以描述镜头的单词.

prompt: realistic, 1girl, pink hair, purple eyes, miko, nontraditional miko, light particles, light rays, wallpaper
negate: worst quality, low quality, zombie, sketch, interlocked, fingers, comic

镜头距离

extreme close-up

大特写镜头并不难发现. 这种镜头通常会把很小的东西(或人物脸上的小特征)放得很大. 这种类型的镜头通常用于引起观众对特定物体或动作的注意. 这些镜头背后没有隐藏的暗示, 导演基本上只是在告诉观众往哪看.

img

close-up

特写镜头是最适合用来表现充满情绪和戏剧张力场景的镜头, 能将人物的想法传达给观众. 视景框应贴近头部和脸部, 头顶应碰到视景框上方. 你可以使用任何焦距为50mm或更长的镜头来拍摄特写镜头. 焦距更短的镜头可能造成一些镜头压缩, 使得影像稍微扭曲.

img

medium close-up

中景镜头是从腰部以上拍摄, 而特写镜头是贴近人物的脸, 近景镜头则是从身体以上拍摄. 这种镜头非常适合用来捕捉反应. 把它想像成将人物和观众的情绪带到高潮的一种镜头. 这种取景方式是一种感受贴近人物和主体的好方法, 有限的移动空间有助于让观众更入戏.

img

medium shot

中景是标准的对话性镜头, 从人物腰部以上取景. 这是拍摄演员时最常用到的镜头. 此镜头以观众的视角作为对话的取镜距离. 在拍摄采访或对话场景时, 一定要使用中景镜头.

img

与之类似的提示词是 upper body.

long shot

远景镜头非常适合各种动作场景. 拍摄远景镜头的目的是为了尽可能捕捉细节, 将人物的世界呈现给观众. 你可以透过远景镜头来增加制片价值和景深并充分地展现场景和地点.

img

这张图的绘制结果其实不太符合我的预期效果, 正常来讲 long shot 是要绘制出全身照的, 也就是 full body.

extreme long shot

将远景镜头放大 10 倍拍摄就是大远景. 大远景镜头的用意在于让观众惊艳, 让视觉效果令人印象深刻. 大远景可以是空拍, 也可以是推轨镜头, 在拍摄时人物必须是镜头中最小的一部分. 拍摄手法完全取决于故事中事件的规模和范围. 无人机是最适合用来捕捉最令人印象深刻, 极大远景镜头的工具.

img

这张图的绘制结果其实不太符合我的预期效果.

镜头角度

front view 正面

img

bilaterally symmetrical 左右对称

img

我尝试生成不少图片, 暂时看不出来它和 front view 的区别.

side view 侧面

img

back view 后面

img

from above 从上拍摄

img

from below 从下拍摄

img

from behind 后拍

img

效果和 back view 很接近.

wide angle view 广角镜

img

fisheyes view 鱼眼镜

img

macro view 微距

img

效果不明.

overhead shot 俯视

img

top down 由上向下

img

bird's eye view 鸟瞰

img

high angle 高角度

img

slightly above 微高角度

img

straight on 水平拍摄

img

hero view 英雄视角

img

low view 低视角

img

worm's eye view 仰视

img

selfie 自拍

img

参考