Midjourney 是什么？AI绘画完整攻略 – wiki基地

开启无限创意之门：Midjourney 是什么？你的AI绘画完整攻略

在数字创意领域，一场由人工智能驱动的革命正在以前所未有的速度展开。曾经只有少数艺术家能够驾驭的复杂创作过程，如今正变得触手可及。而在这场革命的浪潮中，Midjourney 无疑是最耀眼、最具影响力的弄潮儿之一。它不仅仅是一个工具，更是一个通向无限想象空间的入口。

本文将带你深入了解 Midjourney：它究竟是什么？它是如何工作的？以及如何从零开始，掌握使用 Midjourney 进行 AI 绘画的完整攻略。无论你是完全的新手，还是希望提升技巧的进阶用户，都能从中找到宝贵的知识和灵感。

第一部分：认识 Midjourney – AI 绘画的领航者

1. Midjourney 是什么？

简单来说，Midjourney 是一个基于人工智能的生成艺术工具。它的核心功能是根据用户输入的文字描述（称为“Prompt”或“提示词”），自动生成高质量的图像。与传统的绘画软件不同，Midjourney 不要求用户拥有专业的绘画技能或复杂的软件操作知识。你只需要用文字描述你想要的画面，Midjourney 的强大算法就能将其转化为视觉作品。

Midjourney 于2022年年中开始流行，凭借其令人惊叹的图像生成质量、独特的艺术风格以及易于上手的操作方式（主要通过 Discord 平台），迅速捕获了全球创意人士、设计师、艺术家和爱好者的心。它能够创造出从写实摄影到抽象艺术、从奇幻场景到科技未来等各种风格的图像，其生成的图像往往具有强烈的艺术感和电影感。

2. Midjourney 的核心理念与特点

文本到图像（Text-to-Image）： 这是 Midjourney 的基本工作模式。你的创意始于文字。
高质量与艺术性： 相较于其他一些 AI 绘画工具，Midjourney 以其生成图像的美学质量和独特的艺术风格而闻名。它更倾向于创造具有叙事感和视觉冲击力的作品。
迭代与探索： Midjourney 的工作流程鼓励用户通过反复修改提示词和参数，探索不同的可能性，逐步逼近理想的图像。它是一个发现和惊喜的过程。
社区驱动： Midjourney 的主要操作平台在 Discord 上，这构建了一个庞大的用户社区。用户可以很容易地看到别人生成的图片和使用的提示词，相互学习、启发和交流。
快速迭代： Midjourney 团队持续对模型进行更新和优化，不断推出新的版本和功能，提升生成图像的质量和多样性。

3. Midjourney 在 AI 绘画领域的地位

AI 绘画工具层出不穷，除了 Midjourney，还有 Stable Diffusion、DALL-E 2、Leonardo AI 等知名平台。每种工具都有其独特的优势和擅长领域。

Midjourney: 强项在于生成具有高度艺术性、美学价值和创造力的图像，尤其擅长奇幻、科幻、概念艺术、插画等风格，其生成的画面往往自带一种独特的电影感或梦幻感。对于追求艺术表现力和视觉冲击力的用户来说，Midjourney 是一个非常优秀的选择。
Stable Diffusion: 开源且灵活度高，可以在本地运行，提供更多的控制权和定制性，适合需要深度技术探索和个性化模型训练的用户。
DALL-E 2: 擅长理解概念组合，生成更接近用户描述的图像，尤其在处理物体组合和现实场景方面表现不错，也提供了图像编辑功能（如 Outpainting 和 Inpainting）。

Midjourney 凭借其出色的图像质量和友好的社区环境，成为了许多非技术背景用户入门 AI 绘画的首选平台，并在专业创意领域得到了广泛应用。

第二部分：Midjourney 入门与基础操作

使用 Midjourney 主要通过 Discord 平台。如果你还没有 Discord 账号，需要先注册一个。

1. 加入 Midjourney Discord 服务器

访问 Midjourney 官方网站 (midjourney.com)。
点击 “Join the Beta” 或类似的按钮，你会被邀请加入 Midjourney 的 Discord 服务器。
接受邀请，进入服务器。

2. 了解 Discord 界面

进入服务器后，你会看到左侧是频道列表。

#general 或 #newbie 频道: 这些是供新用户开始尝试的公共频道。你可以在这里输入指令生成图片。但要注意，这些频道非常活跃，你的图片很快会被其他用户的图片刷下去。
#member-support 或 #rules 等频道: 提供帮助、规则说明等信息。
私聊 Midjourney Bot: 一旦你熟悉了基本操作并可能订阅了付费计划，强烈建议你直接与 Midjourney Bot 进行私聊。这样你生成的图片只对你可见，更方便管理和查找。

3. 订阅计划

Midjourney 提供免费试用（通常有数量限制），但要进行持续创作和享受更多功能，需要订阅付费计划。付费计划通常按月或年付费，提供不同数量的“快速模式”（Fast Mode）生成时间。快速模式下，你的指令会优先处理，生成速度快。超出快速模式时间后，会进入“放松模式”（Relax Mode），生成速度较慢，但在某些计划下是无限量的。

订阅后，你可以在任何频道或私聊中与 Bot 互动。

4. 第一个指令：/imagine

Midjourney 的所有图像生成都始于 /imagine 指令。

在聊天框中输入 /imagine prompt:
输入冒号后，会出现一个提示框，你可以在这里输入你的文字描述（Prompt）。
例如：/imagine prompt: a cat sitting on a roof, starry night, anime style
按下 Enter 发送指令。

Midjourney Bot 会接收你的指令，并在几秒钟或几分钟后（取决于服务器负载和你的模式）开始生成图像。它会先生成一个包含四张小图的网格。

5. 理解生成的图片网格与按钮

Midjourney 最初生成的四张图片是一个2×2的网格。图片下方会出现几排按钮：

U1, U2, U3, U4: U 代表 “Upscale”（放大）。点击 U 后面的数字（对应网格中的图片位置：左上U1，右上U2，左下U3，右下U4），会将对应的图片进行放大，生成一个更高分辨率的单张图片。
V1, V2, V3, V4: V 代表 “Variations”（变体）。点击 V 后面的数字，会基于对应的图片风格和构图，生成一个新的四张图片网格，这些新图片是原图的变体。
🔄 (Refresh/Reroll): 重复执行当前的 /imagine 指令，生成一组全新的四张图片。

当你点击 U 按钮放大一张图片后，下方会出现更多按钮：

Make Variations: 基于放大的图片生成新的变体网格。
Upscale to Max / Beta: 生成更高分辨率的图片（根据你的设置或版本不同）。
Web: 在 Midjourney 网站上查看这张图片。
🔎 (Zoom Out) / ⬅️➡️⬆️⬇️ (Pan): 这些是较新的功能，允许你在放大后的图片基础上，向特定方向扩展画面（Pan）或缩小视角并填充画面空白（Zoom Out）。Custom Zoom 允许你自定义缩放比例和 Prompt。
Vary (Subtle) / Vary (Strong): 基于放大后的图片生成变体，可以选择微弱或强烈改动。
Vary Region (🖌️): 选择图片中的特定区域进行修改（需要重新输入 Prompt）。

这些按钮构成了 Midjourney 的核心互动流程：想法 -> 尝试 -> 变体 -> 放大 -> 精炼 -> 迭代。

第三部分：核心技巧 – 掌握提示词 (Prompt) 的艺术

高质量的 AI 绘画很大程度上取决于你的提示词写得有多好。Prompt 就像是与 AI 沟通的语言，你需要清晰、准确、富有想象力地描述你想要的画面。

一个有效的 Midjourney Prompt 通常包含以下元素：

1. 主题 (Subject): 你想要画什么？人物、动物、物体、风景？要具体。
* 示例：一只在太空中的小猫

2. 风格 (Style): 你希望图片是什么风格？写实、油画、水彩、赛博朋克、蒸汽朋克、动漫、电影截图？可以模仿特定艺术家或摄影师的风格。
* 示例：油画风格, 宫崎骏动画风格, 赛博朋克, 由Greg Rutkowski绘制

3. 细节 (Details): 添加修饰词来丰富画面。材质、颜色、环境、服装、情绪等。
* 示例：穿着宇航服, 背景是遥远的星云, 毛茸茸的, 充满好奇的表情

4. 构图 (Composition/Perspective): 你希望画面的视角是怎样的？近景、远景、特写、鸟瞰、仰视？
* 示例：特写, 广角镜头, 鸟瞰图

5. 光照 (Lighting): 光线如何？柔和、强烈、逆光、聚光灯、霞光、霓虹灯？光线对画面氛围至关重要。
* 示例：戏剧性的电影光照, 柔和的霞光, 霓虹灯下的阴影

6. 氛围/情绪 (Mood/Atmosphere): 你希望画面传达出怎样的感觉？宁静、神秘、紧张、喜悦、忧伤？
* 示例：宁静的, 神秘而忧郁的, 充满活力的

将这些元素组合起来，一个更完整的 Prompt 可能是：

/imagine prompt: 一只穿着黄色宇航服的毛茸茸小猫，坐在漂浮在太空中的巨大披萨上，背景是壮丽的螺旋星系和彩色星云，由Greg Rutkowski和Simon Stålenhag共同风格绘制，戏剧性的逆光，特写镜头，充满好奇而又宁静的表情，超现实主义 --ar 16:9 --v 5.2

提示词的进阶技巧：

使用描述性强的形容词和名词： “壮丽的”、“璀璨的”、“蒸汽朋克飞艇”通常比“好看的”、“飞机”效果更好。
模仿艺术家风格： 提及著名艺术家（如 Van Gogh, Monet, Dali, H.R. Giger, Moebius, Greg Rutkowski 等）或特定风格（如 Baroque, Art Deco, Cyberpunk, Steampunk, Fantasy Art, Concept Art）能很大程度地影响生成结果的风格。
结合不同的概念： Midjourney 擅长将看似不相关的概念结合在一起，产生意想不到的创意火花。
指定渲染方式： 可以加入 digital painting, oil on canvas, watercolor, 3D render, photography, cinematic shot 等词语来指定输出类型。
负面提示词 (--no)： 使用 --no 参数加上你不希望出现在画面中的元素。例如，--no text, blurry, low quality 可以减少文字、模糊或低质量的出现。
图片提示词： 在 Prompt 的开头加入图片的 URL，Midjourney 会参考这张图片的风格或构图来生成新的图片。这对于保持风格一致性或基于现有图像进行创作非常有用。/imagine prompt: [图片URL] 一只龙
权重 (::)： 使用双冒号 :: 可以为 Prompt 中的不同部分设置权重，影响 Midjourney 对其重视程度。例如：cat::2 astronaut::1 表示更强调“猫”这个主题。
排列组合提示词 ({})： 使用大括号 {} 和逗号 , 可以在一个 Prompt 中尝试多种变体。例如：/imagine prompt: A {cat, dog, rabbit} in a hat 会生成三组图片，分别是戴帽子的猫、狗和兔子。这对于快速实验不同主题非常方便。

第四部分：掌握参数 – 控制生成结果

参数是附加在 Prompt 末尾的指令，以 -- 开头。它们用来控制图像的宽高比、风格化程度、混乱度等各种属性。

以下是一些常用的 Midjourney 参数：

--ar <宽高比> (Aspect Ratio): 设置图片的宽高比。常见的有 --ar 1:1 (正方形), --ar 16:9 (宽屏), --ar 9:16 (竖屏), --ar 3:2, --ar 2:3 等。不同版本支持的宽高比范围不同。
--v <版本号> (Version): 指定使用哪个版本的 Midjourney 模型。不同版本有不同的风格和能力。例如，--v 5.2 是当前（写作本文时）主流版本，以高质量和细节著称；--v 4 风格更独特；--niji 5 是专门用于生成动漫和插画风格图片的模型。
--s <数值> (Stylize): 控制 Midjourney 的“风格化”程度。较高的值会让 Midjourney 更多地发挥自己的美学判断，生成更具艺术性、更“Midjourney”风格的图片，但也可能偏离你的 Prompt 描述；较低的值会更严格地遵循 Prompt。范围通常是 0-1000，默认值取决于版本（v5.2 默认 100）。--s 50, --s 750 等。
--c <数值> (Chaos): 控制结果的多样性或“混乱度”。较高的值会使生成的四张图片差异更大，更具探索性；较低的值则使四张图片更相似。范围通常是 0-100。--c 0 会让四张图非常相似，--c 100 则差异巨大。
--seed <数值> (Seed): 设定一个随机种子。使用相同的 Prompt 和相同的 Seed 值，通常会生成非常相似的图片。 Seed 值是一个介于 0 和 4294967295 之间的整数。这对于想要在某个特定生成结果的基础上进行微调非常有用。如果你没有指定 --seed，Midjourney 会随机生成一个。你可以通过对已生成的图片点击“Add Reaction”（添加表情），选择信封表情 ✉️，Bot 会把这张图片的 Seed 值私发给你。
--q <数值> (Quality): 控制生成图片的质量和细节水平，同时也影响生成速度和消耗的快速模式时间。较高的值 (--q 2 或 --q 5) 生成更精细，但慢且贵；较低的值 (--q 0.25 或 --q 0.5) 速度快，消耗少，但细节较少。默认值通常是 --q 1。不是所有版本都支持所有质量值。
--stop <数值>: 在生成过程的中间停止。数值范围 10-100。--stop 50 会生成更模糊、更抽象的结果，可能适合某些艺术效果。
--tile: 生成可以平铺以创建无缝图案的图像。对于创建纹理或背景非常有用。
--weird <数值> (--w): （v5.2 及更高版本）控制结果的“怪异度”或非传统程度。较高的值会生成更出人意料、更抽象或超现实的图像。范围通常是 0-3000。
--niji <版本号>: 启用 Niji 模型，这是 Midjourney 与 Spellbrush 合作开发的模型，专门用于生成动漫、插画和风格化角色。支持 --niji 5，并可以结合 --s 和 --weird 参数来调整风格。
--no: 前面已提过的负面提示词。

如何使用参数：

将参数放在 Prompt 的最后，用空格隔开。

示例：/imagine prompt: a cozy living room, cinematic lighting --ar 3:2 --v 5.2 --s 250 --q 1 --no furniture

第五部分：进阶功能与工作流程

除了基础的 /imagine 指令和参数，Midjourney 还提供了许多进阶功能，可以帮助你更精细地控制和优化生成过程。

1. Vary Region (局部重绘):
这是一个强大的编辑工具。在你放大一张图片后，点击 🖌️ (Vary Region) 按钮。会弹出一个编辑器界面，你可以选择图片中的特定区域，然后在弹出的 Prompt 框中输入新的描述。Midjourney 会尝试仅修改你选择的区域，同时尽量保持其他部分的风格和构图。这对于修复细节、替换对象或添加元素非常有用。

2. Pan (平移):
在你放大一张图片后，可以使用下方的左右上下箭头按钮。点击后，Midjourney 会将原图向指定方向平移，并利用 AI 生成填充平移后露出的空白区域。这可以用来扩展画布、改变构图或增加环境细节。

3. Zoom Out (缩放):
在你放大一张图片后，可以使用 Zoom Out 2x, Zoom Out 1.5x 或 Custom Zoom 按钮。这会将原图缩小，并在周围生成新的内容来填充画面。Custom Zoom 允许你输入一个自定义的缩放比例（例如 --zoom 1.2）和修改 Prompt，可以在缩小的同时改变周围新生成的内容。

4. Blend (混合):
使用 /blend 指令，你可以上传 2 到 5 张图片，Midjourney 会将它们的视觉概念和风格混合在一起，生成一张新的图片。这是一种探索图像元素组合的有趣方式。

5. Describe (描述):
使用 /describe 指令，你可以上传一张图片，Midjourney 会分析这张图片，并为你生成四个可能的 Prompt 描述。这对于学习如何用文字描述图像、理解 Midjourney 如何“看”图，或者为自己的图片寻找灵感非常有用。

6. Stealth Mode (隐身模式):
对于 Pro 计划的用户，可以开启 Stealth Mode。在此模式下，你在公共频道和网站上的生成记录不会对其他用户可见。

7. Fast Mode vs Relax Mode:
你的订阅计划决定了你可以使用的快速模式时间。Fast Mode 下任务会优先处理，生成速度快，消耗你的快速时间。Relax Mode 下任务会在后台排队，生成速度慢，但不消耗快速时间（某些计划无限量）。可以使用 /fast 和 /relax 命令切换模式。

工作流程建议：

从简单开始： 不要一开始就写极其复杂的 Prompt。先用简单的描述生成基础图片，然后逐渐增加细节和参数。
利用变体 (V 按钮)： 如果第一轮生成的四张图都不完全满意，但其中有一张的方向不错，多使用 V 按钮基于它生成更多变体。
使用种子 (--seed) 进行迭代： 找到一张你喜欢的图后，获取它的 Seed 值，然后结合 --seed 参数修改 Prompt 的其他部分（如风格、光照、颜色等），在保持大致构图或主体的情况下进行精细调整。
利用 Vary Region 进行局部修改： 对于细节不满意的地方，或者想在特定位置添加/修改元素，Vary Region 是非常有效的工具。
学习和借鉴： 多看看其他人在社区中分享的作品和 Prompt，学习他们的描述方式和参数运用。Midjourney 网站上的 Explore 或 Community Showcase 页面是很好的学习资源。
勤于保存和整理： Midjourney 会自动在你的网站账户中保存所有生成记录。定期去网站上查看、收藏和下载你喜欢的作品。

第六部分：伦理、版权与未来

AI 绘画的兴起带来了一些重要的伦理和版权问题，值得我们关注。

版权归属： Midjourney 对用户生成的图像的版权政策有所规定。通常情况下，付费订阅用户对他们生成的图像拥有所有权。但请务必查阅 Midjourney 最新的服务条款，因为政策可能会更新。同时，由于 AI 是通过大量现有图像训练而来，关于 AI 艺术原创性和版权的法律讨论仍在进行中。
艺术家与 AI： AI 绘画并非要取代人类艺术家，而更应被视为一个新的创意工具。许多艺术家正在探索如何将 AI 融入他们的工作流程，将其作为概念探索、灵感生成或辅助创作的手段。
训练数据的偏见： AI 模型是在庞大的数据集上训练的，如果数据集本身存在偏见（例如，某些主题、风格或人群的代表性不足或带有刻板印象），AI 生成的结果也可能体现这些偏见。了解这一点有助于在使用时保持批判性思维，并尝试通过 Prompt 进行修正。
虚假信息： AI 生成的高度逼真的图像也可能被滥用于创建虚假信息或深度伪造。负责任地使用这项技术至关重要。

AI 绘画的未来：

Midjourney 和其他 AI 绘画工具正以前所未有的速度发展。未来的 AI 绘画工具可能会：

提供更精细的控制能力，允许用户对画面的特定元素进行更精确的调整。
更好地理解复杂的叙事和情感描述。
支持更丰富的互动方式，不仅仅是文本。
与其他创意软件（如 Photoshop, Blender）更紧密地集成。
在生成速度、分辨率和效率上持续提升。

AI 绘画的未来充满无限可能，它正在以前所未有的方式降低艺术创作的门槛，赋能更多人将脑海中的奇思妙想转化为可见的图像。

结论

Midjourney 是当前最强大、最受欢迎的 AI 绘画工具之一。它通过简单的文字指令，开启了通向视觉创意新世界的大门。掌握 Midjourney 的关键在于：

理解其工作原理（文本到图像，迭代过程）。
熟悉基本操作（Discord 平台，/imagine 指令，U/V 按钮）。
精炼你的提示词（清晰、具体、富有想象力地描述主题、风格、细节、光照、构图和氛围）。
善于运用参数（调整宽高比、风格化、混乱度、版本等）。
探索进阶功能（Vary Region, Pan, Zoom 等进行精细修改）。
持续学习和实践（参考社区作品，不断尝试新的 Prompt 和组合）。

AI 绘画不是简单地输入几个词就能得到完美结果的魔法，它更像是一种全新的创意合作方式。Midjourney 是那个拥有惊人绘画天赋的AI伙伴，而你则是那个提供创意、指导方向并进行最终判断的艺术家。通过不断地实验、调整和学习，你将能够驾驭 Midjourney 的强大力量，将你的想象力以前所未有的方式呈现出来。

现在，就去 Midjourney，开始你的 AI 绘画之旅吧！无限的创意世界正在等你探索。