Midjourney 是什么?AI绘画完整攻略 – wiki基地


开启无限创意之门:Midjourney 是什么?你的AI绘画完整攻略

在数字创意领域,一场由人工智能驱动的革命正在以前所未有的速度展开。曾经只有少数艺术家能够驾驭的复杂创作过程,如今正变得触手可及。而在这场革命的浪潮中,Midjourney 无疑是最耀眼、最具影响力的弄潮儿之一。它不仅仅是一个工具,更是一个通向无限想象空间的入口。

本文将带你深入了解 Midjourney:它究竟是什么?它是如何工作的?以及如何从零开始,掌握使用 Midjourney 进行 AI 绘画的完整攻略。无论你是完全的新手,还是希望提升技巧的进阶用户,都能从中找到宝贵的知识和灵感。

第一部分:认识 Midjourney – AI 绘画的领航者

1. Midjourney 是什么?

简单来说,Midjourney 是一个基于人工智能的生成艺术工具。它的核心功能是根据用户输入的文字描述(称为“Prompt”或“提示词”),自动生成高质量的图像。与传统的绘画软件不同,Midjourney 不要求用户拥有专业的绘画技能或复杂的软件操作知识。你只需要用文字描述你想要的画面,Midjourney 的强大算法就能将其转化为视觉作品。

Midjourney 于2022年年中开始流行,凭借其令人惊叹的图像生成质量、独特的艺术风格以及易于上手的操作方式(主要通过 Discord 平台),迅速捕获了全球创意人士、设计师、艺术家和爱好者的心。它能够创造出从写实摄影到抽象艺术、从奇幻场景到科技未来等各种风格的图像,其生成的图像往往具有强烈的艺术感和电影感。

2. Midjourney 的核心理念与特点

  • 文本到图像(Text-to-Image): 这是 Midjourney 的基本工作模式。你的创意始于文字。
  • 高质量与艺术性: 相较于其他一些 AI 绘画工具,Midjourney 以其生成图像的美学质量和独特的艺术风格而闻名。它更倾向于创造具有叙事感和视觉冲击力的作品。
  • 迭代与探索: Midjourney 的工作流程鼓励用户通过反复修改提示词和参数,探索不同的可能性,逐步逼近理想的图像。它是一个发现和惊喜的过程。
  • 社区驱动: Midjourney 的主要操作平台在 Discord 上,这构建了一个庞大的用户社区。用户可以很容易地看到别人生成的图片和使用的提示词,相互学习、启发和交流。
  • 快速迭代: Midjourney 团队持续对模型进行更新和优化,不断推出新的版本和功能,提升生成图像的质量和多样性。

3. Midjourney 在 AI 绘画领域的地位

AI 绘画工具层出不穷,除了 Midjourney,还有 Stable Diffusion、DALL-E 2、Leonardo AI 等知名平台。每种工具都有其独特的优势和擅长领域。

  • Midjourney: 强项在于生成具有高度艺术性、美学价值和创造力的图像,尤其擅长奇幻、科幻、概念艺术、插画等风格,其生成的画面往往自带一种独特的电影感或梦幻感。对于追求艺术表现力和视觉冲击力的用户来说,Midjourney 是一个非常优秀的选择。
  • Stable Diffusion: 开源且灵活度高,可以在本地运行,提供更多的控制权和定制性,适合需要深度技术探索和个性化模型训练的用户。
  • DALL-E 2: 擅长理解概念组合,生成更接近用户描述的图像,尤其在处理物体组合和现实场景方面表现不错,也提供了图像编辑功能(如 Outpainting 和 Inpainting)。

Midjourney 凭借其出色的图像质量和友好的社区环境,成为了许多非技术背景用户入门 AI 绘画的首选平台,并在专业创意领域得到了广泛应用。

第二部分:Midjourney 入门与基础操作

使用 Midjourney 主要通过 Discord 平台。如果你还没有 Discord 账号,需要先注册一个。

1. 加入 Midjourney Discord 服务器

  • 访问 Midjourney 官方网站 (midjourney.com)。
  • 点击 “Join the Beta” 或类似的按钮,你会被邀请加入 Midjourney 的 Discord 服务器。
  • 接受邀请,进入服务器。

2. 了解 Discord 界面

进入服务器后,你会看到左侧是频道列表。

  • #general#newbie 频道: 这些是供新用户开始尝试的公共频道。你可以在这里输入指令生成图片。但要注意,这些频道非常活跃,你的图片很快会被其他用户的图片刷下去。
  • #member-support#rules 等频道: 提供帮助、规则说明等信息。
  • 私聊 Midjourney Bot: 一旦你熟悉了基本操作并可能订阅了付费计划,强烈建议你直接与 Midjourney Bot 进行私聊。这样你生成的图片只对你可见,更方便管理和查找。

3. 订阅计划

Midjourney 提供免费试用(通常有数量限制),但要进行持续创作和享受更多功能,需要订阅付费计划。付费计划通常按月或年付费,提供不同数量的“快速模式”(Fast Mode)生成时间。快速模式下,你的指令会优先处理,生成速度快。超出快速模式时间后,会进入“放松模式”(Relax Mode),生成速度较慢,但在某些计划下是无限量的。

订阅后,你可以在任何频道或私聊中与 Bot 互动。

4. 第一个指令:/imagine

Midjourney 的所有图像生成都始于 /imagine 指令。

  • 在聊天框中输入 /imagine prompt:
  • 输入冒号后,会出现一个提示框,你可以在这里输入你的文字描述(Prompt)。
  • 例如:/imagine prompt: a cat sitting on a roof, starry night, anime style
  • 按下 Enter 发送指令。

Midjourney Bot 会接收你的指令,并在几秒钟或几分钟后(取决于服务器负载和你的模式)开始生成图像。它会先生成一个包含四张小图的网格。

5. 理解生成的图片网格与按钮

Midjourney 最初生成的四张图片是一个2×2的网格。图片下方会出现几排按钮:

  • U1, U2, U3, U4: U 代表 “Upscale”(放大)。点击 U 后面的数字(对应网格中的图片位置:左上U1,右上U2,左下U3,右下U4),会将对应的图片进行放大,生成一个更高分辨率的单张图片。
  • V1, V2, V3, V4: V 代表 “Variations”(变体)。点击 V 后面的数字,会基于对应的图片风格和构图,生成一个新的四张图片网格,这些新图片是原图的变体。
  • 🔄 (Refresh/Reroll): 重复执行当前的 /imagine 指令,生成一组全新的四张图片。

当你点击 U 按钮放大一张图片后,下方会出现更多按钮:

  • Make Variations: 基于放大的图片生成新的变体网格。
  • Upscale to Max / Beta: 生成更高分辨率的图片(根据你的设置或版本不同)。
  • Web: 在 Midjourney 网站上查看这张图片。
  • 🔎 (Zoom Out) / ⬅️➡️⬆️⬇️ (Pan): 这些是较新的功能,允许你在放大后的图片基础上,向特定方向扩展画面(Pan)或缩小视角并填充画面空白(Zoom Out)。Custom Zoom 允许你自定义缩放比例和 Prompt。
  • Vary (Subtle) / Vary (Strong): 基于放大后的图片生成变体,可以选择微弱或强烈改动。
  • Vary Region (🖌️): 选择图片中的特定区域进行修改(需要重新输入 Prompt)。

这些按钮构成了 Midjourney 的核心互动流程:想法 -> 尝试 -> 变体 -> 放大 -> 精炼 -> 迭代。

第三部分:核心技巧 – 掌握提示词 (Prompt) 的艺术

高质量的 AI 绘画很大程度上取决于你的提示词写得有多好。Prompt 就像是与 AI 沟通的语言,你需要清晰、准确、富有想象力地描述你想要的画面。

一个有效的 Midjourney Prompt 通常包含以下元素:

1. 主题 (Subject): 你想要画什么?人物、动物、物体、风景?要具体。
* 示例:一只在太空中的小猫

2. 风格 (Style): 你希望图片是什么风格?写实、油画、水彩、赛博朋克、蒸汽朋克、动漫、电影截图?可以模仿特定艺术家或摄影师的风格。
* 示例:油画风格, 宫崎骏动画风格, 赛博朋克, 由Greg Rutkowski绘制

3. 细节 (Details): 添加修饰词来丰富画面。材质、颜色、环境、服装、情绪等。
* 示例:穿着宇航服, 背景是遥远的星云, 毛茸茸的, 充满好奇的表情

4. 构图 (Composition/Perspective): 你希望画面的视角是怎样的?近景、远景、特写、鸟瞰、仰视?
* 示例:特写, 广角镜头, 鸟瞰图

5. 光照 (Lighting): 光线如何?柔和、强烈、逆光、聚光灯、霞光、霓虹灯?光线对画面氛围至关重要。
* 示例:戏剧性的电影光照, 柔和的霞光, 霓虹灯下的阴影

6. 氛围/情绪 (Mood/Atmosphere): 你希望画面传达出怎样的感觉?宁静、神秘、紧张、喜悦、忧伤?
* 示例:宁静的, 神秘而忧郁的, 充满活力的

将这些元素组合起来,一个更完整的 Prompt 可能是:

/imagine prompt: 一只穿着黄色宇航服的毛茸茸小猫,坐在漂浮在太空中的巨大披萨上,背景是壮丽的螺旋星系和彩色星云,由Greg Rutkowski和Simon Stålenhag共同风格绘制,戏剧性的逆光,特写镜头,充满好奇而又宁静的表情,超现实主义 --ar 16:9 --v 5.2

提示词的进阶技巧:

  • 使用描述性强的形容词和名词: “壮丽的”、“璀璨的”、“蒸汽朋克飞艇”通常比“好看的”、“飞机”效果更好。
  • 模仿艺术家风格: 提及著名艺术家(如 Van Gogh, Monet, Dali, H.R. Giger, Moebius, Greg Rutkowski 等)或特定风格(如 Baroque, Art Deco, Cyberpunk, Steampunk, Fantasy Art, Concept Art)能很大程度地影响生成结果的风格。
  • 结合不同的概念: Midjourney 擅长将看似不相关的概念结合在一起,产生意想不到的创意火花。
  • 指定渲染方式: 可以加入 digital painting, oil on canvas, watercolor, 3D render, photography, cinematic shot 等词语来指定输出类型。
  • 负面提示词 (--no): 使用 --no 参数加上你不希望出现在画面中的元素。例如,--no text, blurry, low quality 可以减少文字、模糊或低质量的出现。
  • 图片提示词: 在 Prompt 的开头加入图片的 URL,Midjourney 会参考这张图片的风格或构图来生成新的图片。这对于保持风格一致性或基于现有图像进行创作非常有用。/imagine prompt: [图片URL] 一只龙
  • 权重 (::): 使用双冒号 :: 可以为 Prompt 中的不同部分设置权重,影响 Midjourney 对其重视程度。例如:cat::2 astronaut::1 表示更强调“猫”这个主题。
  • 排列组合提示词 ({}): 使用大括号 {} 和逗号 , 可以在一个 Prompt 中尝试多种变体。例如:/imagine prompt: A {cat, dog, rabbit} in a hat 会生成三组图片,分别是戴帽子的猫、狗和兔子。这对于快速实验不同主题非常方便。

第四部分:掌握参数 – 控制生成结果

参数是附加在 Prompt 末尾的指令,以 -- 开头。它们用来控制图像的宽高比、风格化程度、混乱度等各种属性。

以下是一些常用的 Midjourney 参数:

  • --ar <宽高比> (Aspect Ratio): 设置图片的宽高比。常见的有 --ar 1:1 (正方形), --ar 16:9 (宽屏), --ar 9:16 (竖屏), --ar 3:2, --ar 2:3 等。不同版本支持的宽高比范围不同。
  • --v <版本号> (Version): 指定使用哪个版本的 Midjourney 模型。不同版本有不同的风格和能力。例如,--v 5.2 是当前(写作本文时)主流版本,以高质量和细节著称;--v 4 风格更独特;--niji 5 是专门用于生成动漫和插画风格图片的模型。
  • --s <数值> (Stylize): 控制 Midjourney 的“风格化”程度。较高的值会让 Midjourney 更多地发挥自己的美学判断,生成更具艺术性、更“Midjourney”风格的图片,但也可能偏离你的 Prompt 描述;较低的值会更严格地遵循 Prompt。范围通常是 0-1000,默认值取决于版本(v5.2 默认 100)。--s 50, --s 750 等。
  • --c <数值> (Chaos): 控制结果的多样性或“混乱度”。较高的值会使生成的四张图片差异更大,更具探索性;较低的值则使四张图片更相似。范围通常是 0-100。--c 0 会让四张图非常相似,--c 100 则差异巨大。
  • --seed <数值> (Seed): 设定一个随机种子。使用相同的 Prompt 和相同的 Seed 值,通常会生成非常相似的图片。 Seed 值是一个介于 0 和 4294967295 之间的整数。这对于想要在某个特定生成结果的基础上进行微调非常有用。如果你没有指定 --seed,Midjourney 会随机生成一个。你可以通过对已生成的图片点击“Add Reaction”(添加表情),选择信封表情 ✉️,Bot 会把这张图片的 Seed 值私发给你。
  • --q <数值> (Quality): 控制生成图片的质量和细节水平,同时也影响生成速度和消耗的快速模式时间。较高的值 (--q 2--q 5) 生成更精细,但慢且贵;较低的值 (--q 0.25--q 0.5) 速度快,消耗少,但细节较少。默认值通常是 --q 1。不是所有版本都支持所有质量值。
  • --stop <数值>: 在生成过程的中间停止。数值范围 10-100。--stop 50 会生成更模糊、更抽象的结果,可能适合某些艺术效果。
  • --tile: 生成可以平铺以创建无缝图案的图像。对于创建纹理或背景非常有用。
  • --weird <数值> (--w): (v5.2 及更高版本)控制结果的“怪异度”或非传统程度。较高的值会生成更出人意料、更抽象或超现实的图像。范围通常是 0-3000。
  • --niji <版本号>: 启用 Niji 模型,这是 Midjourney 与 Spellbrush 合作开发的模型,专门用于生成动漫、插画和风格化角色。支持 --niji 5,并可以结合 --s--weird 参数来调整风格。
  • --no: 前面已提过的负面提示词。

如何使用参数:

将参数放在 Prompt 的最后,用空格隔开。

  • 示例:/imagine prompt: a cozy living room, cinematic lighting --ar 3:2 --v 5.2 --s 250 --q 1 --no furniture

第五部分:进阶功能与工作流程

除了基础的 /imagine 指令和参数,Midjourney 还提供了许多进阶功能,可以帮助你更精细地控制和优化生成过程。

1. Vary Region (局部重绘):
这是一个强大的编辑工具。在你放大一张图片后,点击 🖌️ (Vary Region) 按钮。会弹出一个编辑器界面,你可以选择图片中的特定区域,然后在弹出的 Prompt 框中输入新的描述。Midjourney 会尝试仅修改你选择的区域,同时尽量保持其他部分的风格和构图。这对于修复细节、替换对象或添加元素非常有用。

2. Pan (平移):
在你放大一张图片后,可以使用下方的左右上下箭头按钮。点击后,Midjourney 会将原图向指定方向平移,并利用 AI 生成填充平移后露出的空白区域。这可以用来扩展画布、改变构图或增加环境细节。

3. Zoom Out (缩放):
在你放大一张图片后,可以使用 Zoom Out 2x, Zoom Out 1.5xCustom Zoom 按钮。这会将原图缩小,并在周围生成新的内容来填充画面。Custom Zoom 允许你输入一个自定义的缩放比例(例如 --zoom 1.2)和修改 Prompt,可以在缩小的同时改变周围新生成的内容。

4. Blend (混合):
使用 /blend 指令,你可以上传 2 到 5 张图片,Midjourney 会将它们的视觉概念和风格混合在一起,生成一张新的图片。这是一种探索图像元素组合的有趣方式。

5. Describe (描述):
使用 /describe 指令,你可以上传一张图片,Midjourney 会分析这张图片,并为你生成四个可能的 Prompt 描述。这对于学习如何用文字描述图像、理解 Midjourney 如何“看”图,或者为自己的图片寻找灵感非常有用。

6. Stealth Mode (隐身模式):
对于 Pro 计划的用户,可以开启 Stealth Mode。在此模式下,你在公共频道和网站上的生成记录不会对其他用户可见。

7. Fast Mode vs Relax Mode:
你的订阅计划决定了你可以使用的快速模式时间。Fast Mode 下任务会优先处理,生成速度快,消耗你的快速时间。Relax Mode 下任务会在后台排队,生成速度慢,但不消耗快速时间(某些计划无限量)。可以使用 /fast/relax 命令切换模式。

工作流程建议:

  • 从简单开始: 不要一开始就写极其复杂的 Prompt。先用简单的描述生成基础图片,然后逐渐增加细节和参数。
  • 利用变体 (V 按钮): 如果第一轮生成的四张图都不完全满意,但其中有一张的方向不错,多使用 V 按钮基于它生成更多变体。
  • 使用种子 (--seed) 进行迭代: 找到一张你喜欢的图后,获取它的 Seed 值,然后结合 --seed 参数修改 Prompt 的其他部分(如风格、光照、颜色等),在保持大致构图或主体的情况下进行精细调整。
  • 利用 Vary Region 进行局部修改: 对于细节不满意的地方,或者想在特定位置添加/修改元素,Vary Region 是非常有效的工具。
  • 学习和借鉴: 多看看其他人在社区中分享的作品和 Prompt,学习他们的描述方式和参数运用。Midjourney 网站上的 Explore 或 Community Showcase 页面是很好的学习资源。
  • 勤于保存和整理: Midjourney 会自动在你的网站账户中保存所有生成记录。定期去网站上查看、收藏和下载你喜欢的作品。

第六部分:伦理、版权与未来

AI 绘画的兴起带来了一些重要的伦理和版权问题,值得我们关注。

  • 版权归属: Midjourney 对用户生成的图像的版权政策有所规定。通常情况下,付费订阅用户对他们生成的图像拥有所有权。但请务必查阅 Midjourney 最新的服务条款,因为政策可能会更新。同时,由于 AI 是通过大量现有图像训练而来,关于 AI 艺术原创性和版权的法律讨论仍在进行中。
  • 艺术家与 AI: AI 绘画并非要取代人类艺术家,而更应被视为一个新的创意工具。许多艺术家正在探索如何将 AI 融入他们的工作流程,将其作为概念探索、灵感生成或辅助创作的手段。
  • 训练数据的偏见: AI 模型是在庞大的数据集上训练的,如果数据集本身存在偏见(例如,某些主题、风格或人群的代表性不足或带有刻板印象),AI 生成的结果也可能体现这些偏见。了解这一点有助于在使用时保持批判性思维,并尝试通过 Prompt 进行修正。
  • 虚假信息: AI 生成的高度逼真的图像也可能被滥用于创建虚假信息或深度伪造。负责任地使用这项技术至关重要。

AI 绘画的未来:

Midjourney 和其他 AI 绘画工具正以前所未有的速度发展。未来的 AI 绘画工具可能会:

  • 提供更精细的控制能力,允许用户对画面的特定元素进行更精确的调整。
  • 更好地理解复杂的叙事和情感描述。
  • 支持更丰富的互动方式,不仅仅是文本。
  • 与其他创意软件(如 Photoshop, Blender)更紧密地集成。
  • 在生成速度、分辨率和效率上持续提升。

AI 绘画的未来充满无限可能,它正在以前所未有的方式降低艺术创作的门槛,赋能更多人将脑海中的奇思妙想转化为可见的图像。

结论

Midjourney 是当前最强大、最受欢迎的 AI 绘画工具之一。它通过简单的文字指令,开启了通向视觉创意新世界的大门。掌握 Midjourney 的关键在于:

  1. 理解其工作原理(文本到图像,迭代过程)。
  2. 熟悉基本操作(Discord 平台,/imagine 指令,U/V 按钮)。
  3. 精炼你的提示词(清晰、具体、富有想象力地描述主题、风格、细节、光照、构图和氛围)。
  4. 善于运用参数(调整宽高比、风格化、混乱度、版本等)。
  5. 探索进阶功能(Vary Region, Pan, Zoom 等进行精细修改)。
  6. 持续学习和实践(参考社区作品,不断尝试新的 Prompt 和组合)。

AI 绘画不是简单地输入几个词就能得到完美结果的魔法,它更像是一种全新的创意合作方式。Midjourney 是那个拥有惊人绘画天赋的AI伙伴,而你则是那个提供创意、指导方向并进行最终判断的艺术家。通过不断地实验、调整和学习,你将能够驾驭 Midjourney 的强大力量,将你的想象力以前所未有的方式呈现出来。

现在,就去 Midjourney,开始你的 AI 绘画之旅吧!无限的创意世界正在等你探索。


发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部