如何使用FFmpeg？一份面向新手的快速入门教程 – wiki基地

FFmpeg终极入门指南：从零到一，精通音视频处理的瑞士军刀

引言：什么是FFmpeg，为何它如此强大？

在数字媒体的世界里，如果你需要处理音频或视频文件，几乎无法绕开一个名字——FFmpeg。它被誉为音视频处理领域的“瑞士军刀”，这个比喻恰如其分。FFmpeg 是一个开源、免费、跨平台的计算机程序库和命令行工具的集合，能够录制、转换、裁剪、合并、流化以及播放几乎所有格式的音视频文件。

想象一下，你遇到了以下这些场景：

一个.mov格式的视频无法在你的Windows电脑上顺畅播放，你想把它转换成兼容性更好的.mp4格式。
你下载了一部电影，但只想把其中最精彩的5分钟片段剪辑出来，分享给朋友。
你想从一个视频文件中提取出背景音乐，保存为.mp3文件。
你需要将多个短视频片段合并成一个完整的视频。
你想把一个视频的分辨率从4K压缩到1080p，以节省存储空间。
你想为一个视频硬编码（嵌入）字幕。
你想从视频中截取一段制作成高清的GIF动图。

所有这些需求，以及成千上万种其他你能想到的音视频操作，都可以通过FFmpeg的一行命令来完成。它之所以强大，是因为：

无与伦比的格式支持：它支持的编码器、解码器、容器格式、滤镜和协议之多，令人瞠目结舌。几乎没有你处理不了的媒体文件。
跨平台：无论你使用 Windows、macOS 还是 Linux，FFmpeg 都能完美运行。
命令行驱动：虽然没有图形界面（GUI）对新手来说可能有些令人生畏，但这正是其强大之处。它使得自动化、批量处理和精确控制成为可能，是专业人士和开发者的首选。
效率与性能：FFmpeg 经过高度优化，处理速度极快，资源占用相对较低。

本指南将带你从零开始，一步步揭开FFmpeg的神秘面纱。我们将从安装开始，理解其核心概念，并通过大量实用案例，让你真正掌握这个强大的工具，让你从一个音视频处理的“小白”变成一个能够自如应对各种需求的“高手”。

第一部分：安装 FFmpeg —— 迈出第一步

在施展魔法之前，我们首先需要获得这根“魔杖”。

1. Windows 系统

Windows 上的安装相对复杂一些，因为它需要手动配置环境变量。

下载：访问 FFmpeg 官方网站的下载页面 (https://ffmpeg.org/download.html)。找到 Windows 的图标，你会看到两个推荐的构建来源：gyan.dev 和 BtbN。对于新手，推荐从 gyan.dev 下载。进入其网站后，找到 release 版本（更稳定），下载 ffmpeg-release-full.7z 或 .zip 压缩包。
解压：将下载的压缩包解压到一个你喜欢的位置，例如 D:\Tools\ffmpeg。解压后，你会看到一个名为 bin 的文件夹，里面包含了 ffmpeg.exe, ffprobe.exe, ffplay.exe 这三个核心程序。
配置环境变量：这是关键一步，目的是让你可以在任何路径下直接运行 ffmpeg 命令。
- 右键点击“此电脑” -> “属性” -> “高级系统设置” -> “环境变量”。
- 在下方的“系统变量”区域，找到并双击名为 Path 的变量。
- 在弹出的窗口中，点击“新建”，然后将你刚才解压的 bin 文件夹的完整路径（例如 D:\Tools\ffmpeg\bin）粘贴进去。
- 一路点击“确定”保存设置。
验证安装：打开一个新的命令提示符（CMD）或 PowerShell 窗口（注意：一定要是新开的窗口），输入以下命令并回车：
bash ffmpeg -version
如果你看到一长串关于 FFmpeg 版本、配置和库的信息，那么恭喜你，安装成功！

2. macOS 系统

在 macOS 上，最简单的方式是使用包管理器 Homebrew。

安装 Homebrew（如果尚未安装）：打开“终端”（Terminal）应用，粘贴并运行以下命令：
bash /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
安装 FFmpeg：在终端中运行以下命令：
bash brew install ffmpeg
验证安装：同样，在终端输入 ffmpeg -version 来确认安装成功。

3. Linux 系统

大多数 Linux 发行版都可以通过其自带的包管理器轻松安装。

Debian / Ubuntu:
bash sudo apt update sudo apt install ffmpeg
Fedora / CentOS / RHEL:
bash sudo dnf install ffmpeg # 或 sudo yum install ffmpeg
Arch Linux:
bash sudo pacman -S ffmpeg
验证安装：在终端输入 ffmpeg -version。

第二部分：理解核心概念 —— FFmpeg 的“语法”

要使用 FFmpeg，你需要理解它的基本命令结构和几个核心术语。一个典型的 FFmpeg 命令看起来像这样：

ffmpeg [全局选项] [输入文件选项] -i [输入文件] [输出文件选项] [输出文件]

让我们来拆解这个“配方”：

ffmpeg: 这是调用程序本身的命令。
[全局选项]: 这些选项会影响整个 FFmpeg 的操作，例如 -y（无需确认，直接覆盖输出文件）。
-i [输入文件]: 这是最重要的部分，-i (input) 标志着其后跟随的是一个输入文件。你可以有多个输入文件，每个前面都要有 -i。
[输入文件选项]: 这些选项仅作用于紧随其后的那个输入文件。例如，-r 30 如果放在 -i 前面，就是指定输入文件的帧率为30。
[输出文件选项]: 这些选项作用于其后的输出文件。这是我们最常操作的部分，比如指定编码器、码率、分辨率等。
[输出文件]: 你希望生成的文件名。FFmpeg 会根据文件扩展名（如 .mp4, .mkv, .mp3）来猜测你想要的容器格式。

三个必须理解的术语：

容器 (Container)：可以把它想象成一个“盒子”（如 .mp4, .mkv, .avi, .mov）。这个盒子里装了各种东西，但盒子本身并不决定里面东西的“质量”或“语言”。它主要负责将视频、音频、字幕等数据流同步地打包在一起。
流 (Stream)：这是盒子里的“内容物”。一个视频文件通常至少包含一个视频流和一个音频流。也可能包含多个音频流（如不同语言的音轨）和多个字幕流。
编码器/解码器 (Codec)：这是用来压缩和解压流的“语言”或“算法”。
- 视频编码 (Codec): 比如 H.264 (AVC), H.265 (HEVC), VP9。它们决定了视频画面的压缩方式，直接影响视频的清晰度和文件大小。H.264 是目前兼容性最好的。
- 音频编码 (Codec): 比如 AAC, MP3, Opus。它们决定了音频的压缩方式。

理解了这些，你就明白了为什么“将 MOV 转为 MP4”这个说法不完全准确。更准确的说法是：“将一个使用某种视频编码（如ProRes）和某种音频编码（如PCM）并封装在 MOV 容器里的文件，重新编码为使用 H.264 视频编码和 AAC 音频编码，并封装在 MP4 容器里的新文件。”

第三部分：常见实用场景演练 —— 让魔法发生

理论知识足够了，现在让我们通过具体的例子来学习。准备一个你自己的视频文件，命名为 input.mp4，然后跟着下面的命令进行操作。

场景1：查看媒体信息

在对文件进行任何操作之前，最好先了解它的“底细”。

命令：
bash ffmpeg -i input.mp4

解析：
这个命令不会产生任何输出文件。它会读取 input.mp4 并将其详细信息打印在控制台中。你会看到文件时长、码率、容器格式，以及最重要的——它包含了哪些流。例如，你可能会看到：

Stream #0:0(und): Video: h264 (High) (avc1 / 0x31637661), yuv420p, 1920x1080 [SAR 1:1 DAR 16:9], 5000 kb/s, 29.97 fps, ... Stream #0:1(eng): Audio: aac (LC) (mp4a / 0x6134706D), 48000 Hz, stereo, fltp, 128 kb/s

这告诉你：视频流（Stream #0:0）是 H.264 编码，1080p分辨率，29.97帧率。音频流（Stream #0:1）是 AAC 编码，48kHz采样率，立体声。这些信息对于后续操作至关重要。

场景2：格式转换（最常用）

任务： 将一个 input.mov 视频转换成兼容性更强的 output.mp4。

命令 (简单版):
bash ffmpeg -i input.mov output.mp4

解析：
这是最简单的用法。FFmpeg 会自动为你选择合适的编码器（通常是 libx264 视频编码器和 aac 音频编码器）来创建 MP4 文件。但这可能会导致质量损失，因为视频和音频都被重新编码了。

命令 (精确控制版):
bash ffmpeg -i input.mov -c:v libx264 -c:a aac output.mp4

解析：
* -c:v libx264: -c:v (codec for video) 指定视频编码器为 libx264，这是 H.264 的高质量开源实现。
* -c:a aac: -c:a (codec for audio) 指定音频编码器为 aac，是 MP4 格式的标配。

“无损”转换 (如果可能):
如果源文件 input.mp4 的视频流和音频流已经是 H.264 和 AAC，而你只是想把它从 .mkv 容器换到 .mp4 容器，你可以使用“流复制”（Stream Copy），这会极快且无任何质量损失。

bash ffmpeg -i input.mkv -c copy output.mp4

解析：
* -c copy: 告诉 FFmpeg 不进行任何重新编码，直接将原始的视频和音频流从输入容器“复制”到输出容器。这就像把瓶子里的水倒进罐子里，水本身没有变化。

场景3：调整视频分辨率

任务： 将一个 4K 视频 input.mp4 压缩成 1080p。

命令：
bash ffmpeg -i input.mp4 -vf scale=1920:1080 output_1080p.mp4

解析：
* -vf: video filter 的缩写，表示要对视频应用一个或多个滤镜。
* scale=1920:1080: scale 是缩放滤镜。这里指定输出分辨率为 1920×1080。
* 保持宽高比：如果你不知道具体高度，只想指定宽度为 1280，可以这样写：scale=1280:-1。-1 会让 FFmpeg 自动计算高度以保持原始宽高比。

场景4：提取音频或视频

任务1： 从 input.mp4 中提取音频，保存为 output.mp3。

命令：
bash ffmpeg -i input.mp4 -vn -c:a mp3 -q:a 2 output.mp3

解析：
* -vn: no video，告诉 FFmpeg 忽略视频流。
* -c:a mp3: 指定音频编码器为 mp3。
* -q:a 2: -q:a (quality for audio) 用于控制可变码率（VBR）的质量，对于 MP3 来说，0-9 是一个范围，数字越小质量越好，2 通常是高质量的选择。

任务2： 从 input.mp4 中移除音频，只保留视频（静音视频）。

命令：
bash ffmpeg -i input.mp4 -an -c:v copy output_silent.mp4

解析：
* -an: no audio，告诉 FFmpeg 忽略所有音频流。
* -c:v copy: 复制视频流，不重新编码，速度飞快。

场景5：剪辑视频

任务： 从 input.mp4 中剪辑出从第1分30秒开始，到第2分30秒结束的片段。

命令 (快速但不精确版):
bash ffmpeg -i input.mp4 -ss 00:01:30 -to 00:02:30 -c copy output_clip.mp4

解析：
* -ss 00:01:30: seek start，指定开始时间点。
* -to 00:02:30: 指定结束时间点。也可以用 -t 00:01:00 表示从 -ss 开始持续1分钟。
* -c copy: 流复制模式，非常快。但缺点是 FFmpeg 会从 -ss 时间点附近的关键帧开始剪辑，所以开始时间可能不是绝对精确的。

命令 (精确但较慢版):
bash ffmpeg -ss 00:01:30 -i input.mp4 -to 00:02:30 -c:v libx264 -c:a aac output_clip_precise.mp4

解析：
将 -ss 放在 -i 前面，FFmpeg 会先跳转（seek）到指定时间点再开始解码，这会更精确。由于需要重新编码，所以速度会慢一些。

场景6：合并视频

任务： 合并 clip1.mp4, clip2.mp4, clip3.mp4 三个视频。
前提： 这三个视频的分辨率、帧率、编码格式最好一致，否则合并可能会出问题。

方法： 使用 concat demuxer，这是最可靠的方法。

创建一个文本文件 mylist.txt，内容如下：
file 'clip1.mp4' file 'clip2.mp4' file 'clip3.mp4'
运行 FFmpeg 命令：
bash ffmpeg -f concat -safe 0 -i mylist.txt -c copy output_merged.mp4

解析：
* -f concat: -f (format) 强制使用 concat 格式读取输入。
* -safe 0: 由于文件名包含在文本文件中，出于安全考虑 FFmpeg 默认不允许。-safe 0 解除这个限制。
* -i mylist.txt: 输入文件是我们的列表文件。
* -c copy: 如果源文件格式一致，使用流复制是最理想的。

场景7：为视频添加字幕

任务： 将 subtitles.srt 字幕文件“硬编码”到 input.mp4 中。硬编码意味着字幕会成为视频画面的一部分，无法关闭。

命令：
bash ffmpeg -i input.mp4 -vf "subtitles=subtitles.srt" output_subtitled.mp4
解析：
* -vf "subtitles=subtitles.srt": 使用 subtitles 视频滤镜，并指定字幕文件路径。如果路径或文件名包含特殊字符，最好用双引号括起来。

软字幕（Soft subtitles）：将字幕作为独立的流封装进容器（如MKV, MP4），播放时可选择开启或关闭。

bash ffmpeg -i input.mp4 -i subtitles.srt -c copy -c:s mov_text output_softsub.mp4

解析：
* -i subtitles.srt: 添加第二个输入源，即字幕文件。
* -c copy: 复制视频和音频流。
* -c:s mov_text: -c:s (codec for subtitles) 指定字幕的编码。mov_text 是 MP4 兼容的格式。如果是输出到 MKV，可以使用 -c:s srt。

场景8：制作高质量 GIF

任务： 从 input.mp4 的第10秒开始，截取3秒内容制作成一个高质量的 GIF。

制作高质量GIF通常需要两步，因为GIF的色彩限制（256色）会导致画质严重下降。我们需要先生成一个优化的调色板，再用这个调色板来制作GIF。

第一步：生成调色板
bash ffmpeg -i input.mp4 -ss 10 -t 3 -vf "fps=15,scale=480:-1:flags=lanczos,palettegen" palette.png

解析：
* -ss 10 -t 3: 截取从10秒开始，时长3秒的片段。
* -vf "...": 应用一个滤镜链。
* fps=15: 将帧率降到15，GIF不需要太高帧率。
* scale=480:-1: 将宽度缩放到480像素，保持宽高比。
* flags=lanczos: 使用高质量的缩放算法。
* palettegen: 生成一个代表这段视频最佳色彩的调色板，并保存为 palette.png。

第二步：使用调色板生成GIF
bash ffmpeg -i input.mp4 -i palette.png -ss 10 -t 3 -filter_complex "[0:v]fps=15,scale=480:-1:flags=lanczos[x];[x][1:v]paletteuse" output.gif

解析：
* -i palette.png: 将上一步生成的调色板作为第二个输入。
* -filter_complex "...": 使用复杂的滤镜图。
* [0:v]...[x]: 对第一个输入（[0:v]，即视频）应用滤镜链，并将输出命名为 [x]。
* [x][1:v]paletteuse: 将处理过的视频 [x] 和第二个输入（[1:v]，即调色板）一起送入 paletteuse 滤镜，该滤镜会使用这个调色板来创建颜色最优的GIF。

第四部分：进阶技巧与注意事项

质量控制 -crf：在使用 libx264 编码时，控制质量的最佳方式是使用 -crf (Constant Rate Factor) 参数。它是一个从0到51的数值，数字越小，质量越高，文件越大。
- -crf 23: 默认值，一个很好的平衡点。
- -crf 18: 视觉上可能接近无损，文件会很大。
- -crf 28: 质量较低，但文件很小。
- 用法示例：ffmpeg -i input.mp4 -c:v libx264 -crf 22 -c:a aac -b:a 128k output.mp4
预设 -preset：这个参数控制编码速度和压缩率的平衡。速度越快，压缩效果越差（文件越大）。
- 可选值：ultrafast, superfast, veryfast, faster, fast, medium (默认), slow, slower, veryslow。
- 用法：一般使用 medium 或 fast 就足够了。如果你不赶时间且追求极致压缩，可以用 slow。
- 用法示例：ffmpeg -i input.mp4 -c:v libx264 -preset slow -crf 22 output.mp4
硬件加速：如果你的电脑有支持的显卡（NVIDIA, AMD, Intel, Apple M系列），可以利用硬件加速来极大提升编码速度。但这配置起来更复杂，例如 NVIDIA 需要使用 -c:v h264_nvenc 编码器。这是更高级的主题，新手可以先专注于CPU编码。
善用文档：FFmpeg 的功能远不止于此。当你遇到新的需求时，最好的老师是它的官方文档。虽然是英文且非常详尽，但你可以通过搜索 ffmpeg <你想做的事> 来找到无数的教程和论坛讨论，例如 ffmpeg crop video（裁剪画面）。

结语

恭喜你！你已经完成了FFmpeg的入门之旅。从安装、理解核心概念，到亲手实践了8个最常见的应用场景，你已经掌握了开启音视频处理大门的钥匙。

FFmpeg的学习曲线确实存在，但它的回报是巨大的。你不再受限于各种视频编辑软件的功能和格式限制，而是拥有了随心所欲、精确控制任何音视频文件的能力。记住，命令行工具的精髓在于组合与创造。今天学习的每一个参数、每一个滤镜，都可以像乐高积木一样自由组合，去解决你未来遇到的各种新问题。

现在，去找到一个视频文件，开始你的实验吧！将它转换、剪辑、添加效果，不断尝试，不断查阅，你会在这个过程中发现一个充满无限可能的数字媒体新世界。