S3 CP：AWS 命令行文件传输工具详解

AWS S3 (Simple Storage Service) 是一款高度可扩展、安全且经济高效的对象存储服务，是云计算领域中不可或缺的组成部分。对于开发者和系统管理员来说，高效地管理和操作 S3 存储桶至关重要。AWS Command Line Interface (CLI) 提供了一系列强大的工具，用于与 AWS 服务交互。其中，aws s3 cp 命令是用于在本地文件系统和 S3 存储桶之间传输文件和目录的关键命令，本文将深入探讨 aws s3 cp 的用法、选项、最佳实践以及一些高级技巧，帮助你充分利用这个强大的工具。

1. aws s3 cp 的基本语法和用法

aws s3 cp 命令的基本语法如下：

bash aws s3 cp <source> <destination> [options]

其中，source 指定要复制的文件或目录的路径，destination 指定复制的目标路径，options 则是可选的参数，用于修改命令的行为。

1.1. 从本地文件复制到 S3 存储桶

这是最常见的用法之一，用于将本地文件上传到 S3 存储桶。

bash aws s3 cp my_local_file.txt s3://my-bucket/path/to/

这条命令会将本地文件 my_local_file.txt 复制到名为 my-bucket 的 S3 存储桶中的 path/to/ 目录下。如果 path/to/ 目录不存在，S3 会自动创建该目录。

1.2. 从 S3 存储桶复制到本地文件

该用法用于从 S3 存储桶下载文件到本地文件系统。

bash aws s3 cp s3://my-bucket/path/to/my_s3_file.txt my_local_destination.txt

这条命令会将 S3 存储桶 my-bucket 中的 path/to/my_s3_file.txt 文件下载到本地，并保存为 my_local_destination.txt。

1.3. 在 S3 存储桶之间复制文件

aws s3 cp 也可以用于在不同的 S3 存储桶之间复制文件。

bash aws s3 cp s3://source-bucket/source/file.txt s3://destination-bucket/destination/

这条命令会将 source-bucket 存储桶中的 source/file.txt 文件复制到 destination-bucket 存储桶的 destination/ 目录下。

1.4. 复制整个目录

aws s3 cp 配合 --recursive 选项可以复制整个目录及其子目录。

bash aws s3 cp my_local_directory s3://my-bucket/path/ --recursive

这条命令会将本地目录 my_local_directory 及其所有内容复制到 S3 存储桶 my-bucket 的 path/ 目录下。

1.5. 复制多个文件

可以使用通配符复制多个文件。

bash aws s3 cp *.txt s3://my-bucket/documents/

这条命令会将当前目录下所有以 .txt 结尾的文件复制到 S3 存储桶 my-bucket 的 documents/ 目录下。

2. aws s3 cp 的常用选项

aws s3 cp 命令提供了许多选项，用于控制复制的行为。以下是一些最常用的选项：

--recursive: 指示命令递归地复制目录和子目录。
--exclude: 从复制操作中排除指定的文件或目录。可以使用通配符。

bash aws s3 cp my_local_directory s3://my-bucket/path/ --recursive --exclude "*.log" --exclude "temp/"

这条命令会将 my_local_directory 及其内容复制到 S3，但会排除所有 .log 文件和 temp/ 目录。
--include: 只包含指定的文件或目录进行复制。可以使用通配符。

bash aws s3 cp my_local_directory s3://my-bucket/path/ --recursive --include "*.txt"

这条命令只会将 my_local_directory 目录下的 .txt 文件复制到 S3。
--storage-class: 指定 S3 对象的存储类别。常用的存储类别包括 STANDARD, STANDARD_IA, ONEZONE_IA, GLACIER, DEEP_ARCHIVE。选择合适的存储类别可以降低存储成本。

bash aws s3 cp my_local_file.txt s3://my-bucket/path/ --storage-class STANDARD_IA

这条命令会将文件上传到 S3，并将其存储类别设置为 STANDARD_IA (Standard Infrequent Access)。
--acl: 设置 S3 对象的访问控制列表 (ACL)。例如，public-read 允许所有人读取该对象。

bash aws s3 cp my_local_file.txt s3://my-bucket/path/ --acl public-read

注意：谨慎使用 public-read ACL，确保你了解其安全影响。通常，更推荐使用 IAM 角色和存储桶策略来控制访问权限。
--sse: 指定服务器端加密 (SSE) 的类型。常见的选项包括 AES256 (S3 托管密钥) 和 aws:kms (KMS 托管密钥)。

bash aws s3 cp my_local_file.txt s3://my-bucket/path/ --sse AES256

这条命令会将文件上传到 S3，并使用 AES256 算法进行服务器端加密。
--sse-kms-key-id: 当使用 KMS 托管密钥进行 SSE 时，需要指定 KMS 密钥 ID。

bash aws s3 cp my_local_file.txt s3://my-bucket/path/ --sse aws:kms --sse-kms-key-id your-kms-key-id
--content-type: 设置 S3 对象的 Content-Type 元数据。这对于浏览器正确处理文件非常重要，例如，确保浏览器将 .html 文件识别为 HTML。

bash aws s3 cp my_local_file.html s3://my-bucket/path/ --content-type "text/html"
--metadata: 设置 S3 对象的自定义元数据。

bash aws s3 cp my_local_file.txt s3://my-bucket/path/ --metadata "key1=value1,key2=value2"
--cache-control: 设置 S3 对象的 Cache-Control 元数据，控制浏览器或 CDN 如何缓存该对象。

bash aws s3 cp my_local_file.txt s3://my-bucket/path/ --cache-control "max-age=3600"

这条命令会设置 Cache-Control 为 max-age=3600，指示浏览器或 CDN 缓存该对象 3600 秒 (1 小时)。
--dryrun: 模拟复制操作，但不实际执行。这对于测试复制命令非常有用。

bash aws s3 cp my_local_directory s3://my-bucket/path/ --recursive --dryrun
--progress: 显示复制进度。

bash aws s3 cp large_file.zip s3://my-bucket/path/ --progress

3. 高级技巧和最佳实践

使用 IAM 角色进行身份验证: 尽量避免在命令行中直接使用 AWS 访问密钥和密钥，而是使用 IAM 角色。如果你的 EC2 实例或容器运行在 AWS 上，可以分配一个 IAM 角色给它，允许它访问 S3 存储桶。这可以提高安全性，避免密钥泄露的风险。
配置 AWS CLI: 使用 aws configure 命令配置 AWS CLI，设置默认的区域、输出格式和身份验证信息。这将简化 aws s3 cp 命令的使用，避免每次都指定这些参数。
利用多线程复制: AWS CLI 会自动使用多线程进行文件传输，提高速度。可以通过调整 max_concurrent_requests 和 multipart_threshold 等配置项来优化多线程复制的性能。这些配置项可以在 ~/.aws/config 文件中设置。
使用 Lifecycle 策略: 对于长期存储的文件，可以考虑使用 S3 Lifecycle 策略，自动将文件从 STANDARD 存储类别移动到更便宜的存储类别 (例如 STANDARD_IA, GLACIER)。
启用版本控制: 在 S3 存储桶上启用版本控制可以保留文件的历史版本，防止意外覆盖或删除。
监控和日志: 使用 CloudWatch 监控 S3 的使用情况，并启用 S3 服务器访问日志，记录所有对 S3 对象的访问请求。
使用预签名 URL: 对于需要临时授权访问 S3 对象的情况，可以使用预签名 URL。预签名 URL 允许用户在一定时间内访问 S3 对象，而无需提供 AWS 凭证。可以使用 aws s3 presign 命令生成预签名 URL。

bash aws s3 presign s3://my-bucket/path/to/my_file.txt --expires-in 3600

这条命令会生成一个有效期为 1 小时的预签名 URL，可以用于下载 my_file.txt 文件。
处理大型文件: 对于大型文件，建议使用分段上传 (multipart upload)，将文件分成多个部分并行上传。AWS CLI 会自动处理分段上传。
错误处理: 仔细检查 aws s3 cp 命令的输出，确保文件成功复制。如果发生错误，可以查看 AWS CLI 的日志文件 (通常位于 ~/.aws/cli/log 目录下) 获取更多信息。

4. 示例脚本

以下是一个示例脚本，演示如何使用 aws s3 cp 命令备份本地目录到 S3 存储桶：

“`bash

!/bin/bash

存储桶名称

BUCKET_NAME=”your-bucket-name”

本地目录

LOCAL_DIR=”/path/to/your/local/directory”

S3 存储桶中的目标路径

S3_PATH=”backups/$(date +%Y%m%d%H%M%S)”

使用 aws s3 cp 命令备份本地目录到 S3

aws s3 cp “$LOCAL_DIR” “s3://${BUCKET_NAME}/${S3_PATH}” –recursive –exclude “.tmp” –include “.txt” –storage-class STANDARD_IA –sse AES256 –progress

检查命令是否成功执行

if [ $? -eq 0 ]; then
echo “备份成功！备份文件已上传到 s3://${BUCKET_NAME}/${S3_PATH}”
else
echo “备份失败！请检查日志文件获取更多信息。”
fi
“`

5. 总结

aws s3 cp 是一个功能强大的命令行工具，用于在本地文件系统和 S3 存储桶之间以及 S3 存储桶之间高效地传输文件和目录。通过理解其基本语法、常用选项和最佳实践，你可以充分利用这个工具，提高工作效率，并更好地管理你的 S3 存储桶。记住，安全是至关重要的，务必使用 IAM 角色进行身份验证，并仔细评估 ACL 和 SSE 等安全选项。结合其他 AWS 服务，如 CloudWatch 和 Lifecycle 策略，可以进一步优化 S3 的使用。熟练掌握 aws s3 cp 命令对于任何使用 AWS S3 的开发者和系统管理员来说都是一项宝贵的技能。

S3 CP：AWS 命令行文件传输工具详解 – wiki基地

S3 CP：AWS 命令行文件传输工具详解

!/bin/bash

存储桶名称

本地目录

S3 存储桶中的目标路径

使用 aws s3 cp 命令备份本地目录到 S3

检查命令是否成功执行

发表评论取消回复

S3 CP：AWS 命令行文件传输工具详解

!/bin/bash

存储桶名称

本地目录

S3 存储桶中的目标路径

使用 aws s3 cp 命令备份本地目录到 S3

检查命令是否成功执行

发表评论 取消回复

发表评论取消回复