AWS S3 定价指南 – wiki基地

AWS S3 定价深度解析：一份详尽的指南

Amazon Simple Storage Service (S3) 是亚马逊网络服务 (AWS) 提供的一项高度可扩展、高可靠性、低延迟的对象存储服务。它被广泛应用于各种场景，从网站托管、大数据分析、备份与恢复到媒体存储和分发。然而，正如所有云计算服务一样，理解其定价模式对于有效控制成本至关重要。S3 的定价并非单一标准，而是由多个维度共同决定。本文将深入解析 AWS S3 的各项定价要素，帮助您全面理解并优化您的 S3 支出。

理解 AWS S3 的基本定价原则

AWS 的定价模式基于“按需付费”原则，这意味着您只需为您实际使用的资源付费，没有长期合同（除非您选择特殊的企业协议）或最低消费要求（某些功能除外）。S3 的定价主要围绕以下几个核心维度展开：

存储空间 (Storage): 您存储在 S3 中的数据量。
请求 (Requests): 您对 S3 对象或存储桶执行的操作，例如上传、下载、列出对象等。
数据传输 (Data Transfer): 数据进出 S3 的流量。
管理功能 (Management Features): 使用某些高级功能，如生命周期管理、复制、分析、存储类别分析等。
加速和选择 (Acceleration & Select): 使用 S3 Transfer Acceleration 或 S3 Select/Glacier Select 功能。

了解这五个核心维度是理解 S3 定价的基础。不同维度之间相互关联，特别是存储空间，其成本会因您选择的存储类别（Storage Class）而差异巨大。

核心定价维度一：存储空间 (Storage)

这是 S3 定价中最核心、通常也是占比最大的部分。S3 提供了多种存储类别，每种类别都针对特定的访问模式、弹性和持久性需求进行了优化，并且具有不同的定价。您的存储成本取决于您使用的存储类别以及您存储的数据量（按 GB-月计算）。

1. 不同的存储类别及其定价特点：

S3 Standard (标准): 适用于需要频繁访问的数据，具有高吞吐量和低延迟。设计为提供 99.999999999% (11个9) 的数据持久性和 99.99% 的可用性。定价： 每 GB-月价格较高，但请求和数据检索费用相对较低。适用于默认、通用型存储。
S3 Intelligent-Tiering (智能分层): 适用于数据访问模式未知或变化的工作负载。它通过监控对象的访问模式，自动将对象移动到成本最低的访问层，而无需操作开销。包括频繁访问层和不频繁访问层。如果数据在 30 天内未被访问，会自动移至不频繁访问层；如果后续被访问，则移回频繁访问层。还有一个可选的归档访问层（Archive Access）和深度归档访问层（Deep Archive Access）。定价： 引入额外的监控和自动分层费用（按对象数量和容量收费），但可以有效降低总存储成本，特别是在访问模式难以预测时。频繁访问层定价类似于 Standard，不频繁访问层类似于 Standard-IA。
S3 Standard-Infrequent Access (Standard-IA，标准-不频繁访问): 适用于不频繁访问但需要快速访问的数据。具有与 Standard 相同的持久性和可用性，但存储成本较低。定价： 每 GB-月价格低于 Standard，但数据检索费用较高。此外，有最短存储期（通常为 30 天）和最小对象大小（通常为 128 KB）的收费规定——即使您存储的数据小于 128 KB 或存储不足 30 天，也会按这些最小值计费。适用于备份、灾难恢复、长期数据存储等场景。
S3 One Zone-Infrequent Access (One Zone-IA，单区-不频繁访问): 与 Standard-IA 类似，但数据仅存储在一个 AWS 可用区中。这使得其存储成本比 Standard-IA 更低，但也意味着如果该可用区发生物理灾难，数据可能会丢失。持久性为 99.5%，可用性为 99.5%。定价： 每 GB-月价格最低，但数据检索费用与 Standard-IA 相似。同样有最短存储期（通常为 30 天）和最小对象大小（通常为 128 KB）的收费规定。适用于可轻松重新创建的数据的辅助备份或非关键数据。
S3 Glacier Flexible Retrieval (以前称为 S3 Glacier): 适用于需要长期归档，且访问不频繁，但检索时间可接受几分钟到几小时的数据。提供了三种检索选项：加速检索（几分钟内）、标准检索（几小时内）和大宗检索（5-12 小时）。定价： 每 GB-月价格非常低，但数据检索费用（按 GB 和请求数量收费）较高。同样有最短存储期（通常为 90 天）和最小对象大小（通常为 40 KB）的收费规定。适用于法规遵从性归档、媒体资产归档等。
S3 Glacier Deep Archive (深度归档): 适用于需要长期归档，且访问频率极低，检索时间可接受数小时到几天的数据。提供了两种检索选项：标准检索（12 小时内）和大宗检索（48 小时内）。是 S3 中成本最低的存储类别。定价： 每 GB-月价格极低，但数据检索费用最高。有最短存储期（通常为 180 天）和最小对象大小（通常为 40 KB）的收费规定。适用于长期合规性归档、历史数据存储等。
S3 Outposts: 将 S3 存储部署在客户的本地环境或 AWS Outposts 设备上。定价： 与云中的 S3 定价模型不同，通常是基于 Outposts 硬件的费用加上一些服务费用。

总结： 存储成本与数据的访问频率和检索速度呈反比。访问越频繁、检索越快，每 GB 的存储成本越高；访问越不频繁、检索越慢，每 GB 的存储成本越低，但检索成本会增加。选择正确的存储类别是优化成本的关键。

2. 存储成本的计算方式：

存储成本通常按 GB-月 计算。例如，如果您在某个区域的 Standard 存储类别中存储了 100 GB 数据，持续一个月，并且该区域 Standard 存储的价格是每 GB-月 0.023 美元，那么这部分存储的费用就是 100 GB * 0.023 美元/GB-月 = 2.3 美元。

如果您在一个月内删除了数据，则按天计算。例如，100 GB 数据存储了半个月，则按 100 GB * (15天/30天) * 0.023 美元/GB-月计算。

需要注意的是，对于 Standard-IA, One Zone-IA, Glacier Flexible Retrieval 和 Glacier Deep Archive，还有前面提到的最短存储期和最小对象大小的收费规则。这意味着即使您存储了一个 10 KB 的文件在 Glacier Deep Archive 并立即删除，您仍然可能需要为 40 KB 的数据存储 180 天的费用（尽管实际删除会触发提前删除费用）。

核心定价维度二：请求 (Requests)

您对 S3 存储桶和对象执行的操作（如 PUT、COPY、POST、LIST、GET、SELECT 等 API 调用）都会产生请求费用。不同类型的请求和不同的存储类别具有不同的定价。

1. 请求类型及其定价：

PUT、COPY、POST、LIST 等请求： 这些通常是写入、复制或管理操作。它们的价格通常高于 GET 请求。定价单位通常是每 1000 个请求。
GET、SELECT 等请求： 这些是读取操作。GET 请求用于下载对象。SELECT 请求用于直接查询对象内容。它们的定价通常低于 PUT 等请求。定价单位通常是每 1000 个请求。
不同存储类别的请求定价差异： 对 Standard-IA, One Zone-IA, Glacier Flexible Retrieval 和 Glacier Deep Archive 执行 GET 或 SELECT 等检索请求时，除了请求本身的费用，还会产生数据检索费用（见下一节）。对 Glacier 存储类别执行 PUT 请求（用于上传）通常是免费的，因为它们是通过 PUT Object API 并指定存储类别来实现的。
部分免费请求： 使用 S3 Management Console 执行的操作、HEAD 请求（用于获取对象元数据）以及 OPTIONS 请求通常是免费的。

2. 请求费用的影响因素：

您的请求费用取决于您的应用程序或用户如何与 S3 交互。频繁上传、复制或列出存储桶内容会增加 PUT/COPY/POST/LIST 请求的费用。频繁下载数据会增加 GET 请求的费用。如果您的工作负载涉及大量小对象的频繁读写，请求费用可能会变得相当可观，甚至超过存储费用。

核心定价维度三：数据传输 (Data Transfer)

数据传输费用是另一个重要的成本组成部分，尤其是在数据需要传出 AWS 区域时。

1. 数据传输的收费原则：

数据传输入站 (Data Transfer In): 将数据上传到 S3 (从互联网或同一区域内的其他 AWS 服务) 通常是免费的。
数据传输出站 (Data Transfer Out): 将数据从 S3 传出 AWS 区域会产生费用。这是数据传输费用中最主要的部分。

2. 数据传输出站的几种情况：

数据传出到互联网 (Data Transfer Out to Internet): 这是最常见的出站流量，也是费用最高的。例如，用户从您的 S3 存储桶直接下载文件到他们的浏览器。定价通常按 GB 计算，并有分级定价，即传输的数据越多，每 GB 的价格越低（例如，每月前 1 TB、接下来的 49 TB 等）。
数据传出到同一 AWS 区域内的其他 AWS 服务 (Data Transfer Out to other AWS services in the same AWS Region): 例如，将 S3 数据加载到同一区域的 EC2 实例进行处理。这通常是免费的。
数据传出到不同 AWS 区域的其他 AWS 服务 (Data Transfer Out to other AWS services in a different AWS Region): 例如，将 S3 数据复制或传输到另一个区域的 EC2 实例或另一个 S3 存储桶（用于跨区域复制）。这会产生跨区域数据传输费用，定价通常按 GB 计算。
数据传出到 Amazon CloudFront (Data Transfer Out to Amazon CloudFront): 将 S3 作为源站配合 CloudFront 分发内容通常是免费的。这是因为 CloudFront 是一个内容分发网络 (CDN)，AWS 鼓励用户使用 CloudFront 来提高性能并降低从源站直接下载的流量成本。CloudFront 本身有单独的定价模式，主要基于传出到互联网的流量以及请求数量。

3. 数据检索费用 (Data Retrieval Fee)：

这部分费用严格来说是与“请求”和“存储类别”相关的，但因为它涉及到数据的“取出”，常被与数据传输一起讨论。对于 Standard-IA, One Zone-IA, Glacier Flexible Retrieval 和 Glacier Deep Archive 存储类别，除了 GET 请求本身的费用外，您还需要为检索的数据量付费。

Standard-IA 和 One Zone-IA 的检索费用相对较低，按 GB 计算。
Glacier Flexible Retrieval 的检索费用较高，按 GB 计算，且费用取决于您选择的检索速度（加速、标准、大宗）。
Glacier Deep Archive 的检索费用最高，按 GB 计算，费用也取决于检索速度（标准、大宗）。

理解数据检索费用与数据传输费用之间的区别很重要：检索费用是为从归档存储中“激活”数据而支付的，而数据传输费用是为将数据“移出”AWS 区域而支付的。如果您从 Standard-IA 检索数据，然后将数据下载到您的本地计算机，您将支付：Standard-IA 的 GET 请求费 + Standard-IA 的数据检索费 + 数据传出到互联网费。

核心定价维度四：管理功能 (Management Features)

使用 S3 提供的一些管理、监控和分析功能会产生少量费用。

S3 Lifecycle (生命周期): 设置对象生命周期策略（例如，在 30 天后将对象从 Standard 转换为 Standard-IA，或在 1 年后删除对象）本身通常是免费的。但是，由生命周期策略触发的存储类别转换可能会产生费用（例如，从 Standard 转换为 Glacier Flexible Retrieval 通常需要为每个转换的对象支付少量请求费用，并可能触发目标存储类别的最小对象大小和存储期规则）。
S3 Replication (复制): 包括同区域复制 (SRR) 和跨区域复制 (CRR)。使用复制功能会产生以下费用：
- 源区域的 PUT 请求费用（用于上传待复制的对象）。
- 将数据从源区域传输到目标区域的跨区域数据传输费用（如果是 CRR）。
- 目标区域的 PUT 请求费用（用于写入复制的对象）。
- 目标区域的存储费用。
S3 Inventory (清单) 和 S3 Analytics (分析): 生成存储桶清单列表或运行存储类别分析会产生少量费用，通常按您扫描或分析的对象数量或存储量计费。
S3 Storage Lens: 提供跨组织级别、账户和区域的存储使用和活动可视化视图。提供免费的默认指标和付费的高级指标/建议。付费 tier 按监控的存储量计费。

核心定价维度五：加速和选择 (Acceleration & Select)

S3 Transfer Acceleration (传输加速): 利用 CloudFront 的全球边缘网络加速远距离上传和下载数据。使用此功能会产生额外的费用，基于通过加速端点传输的数据量。费用通常高于直接上传或下载。
S3 Select 和 Glacier Select: 允许您使用简单的 SQL 表达式过滤 S3 对象或 Glacier 归档中的数据，只检索所需的数据子集，而不是整个对象。这可以显著减少需要传输的数据量和提高应用程序性能。定价： 基于扫描的数据量和返回的数据量收费。对于大型对象中的少量数据检索非常划算。

AWS S3 免费套餐 (Free Tier)

AWS 为新客户或某些现有客户提供 S3 免费套餐。典型的 S3 免费套餐包括：

5 GB 的 Standard 存储空间。
20,000 个 GET 请求。
2,000 个 PUT, COPY, POST, LIST 请求。
100 GB 的数据传出到互联网。

免费套餐每月重置一次。请注意，免费套餐可能因区域或时间而有所不同，请查阅最新的 AWS 官方文档。

影响 S3 费用的主要因素总结

存储类别选择: 是 Standard、IA、Glacier 还是 Intelligent-Tiering？这直接影响每 GB 的存储成本和检索成本。
数据总量: 存储的数据越多，存储费用越高。
对象大小和数量: 大量小对象会显著增加请求费用和管理功能（如 Intelligent-Tiering 监控）的成本，并且可能受 IA/Glacier 的最小对象大小限制影响。
访问模式: 频繁的读写操作会增加请求费用和数据传输/检索费用。
数据传出流量: 将数据传出 AWS 区域（尤其是到互联网）是主要的流量成本来源。
区域: 不同 AWS 区域的 S3 定价可能略有差异。
是否使用高级功能: 复制、清单、分析、加速等都会产生额外费用。

如何优化 S3 成本

理解了定价模型，就可以采取措施来优化成本：

选择最适合的存储类别: 根据数据的实际访问频率和检索需求，将数据存储在成本效益最高的存储类别中。不要将不常用甚至不再需要访问的数据长期放在昂贵的 Standard 存储中。
利用 S3 Intelligent-Tiering: 如果您的数据访问模式不确定，或者会随时间变化，Intelligent-Tiering 可以自动帮您优化存储成本。
实施生命周期策略: 自动将旧的、不常访问的数据迁移到 Standard-IA, One Zone-IA, Glacier 或 Deep Archive，并在数据不再需要时自动删除，避免为过期数据付费。
优化对象大小: 如果可能，考虑将大量小对象合并成较大的对象，以减少请求数量和某些存储类别的最小对象大小开销。
减少不必要的数据传出:
- 尽量在数据所在的同一区域进行处理。
- 使用 CloudFront 分发面向最终用户的数据。
- 定期审查出站流量来源，识别并优化高流量区域。
监控您的使用情况和费用:
- 使用 AWS Cost Explorer 分析您的 S3 费用明细，按服务、区域、标签等维度查看。
- 使用 S3 Storage Lens 获取存储使用模式的可视化报告。
- 设置 AWS Budgets 接收费用超出预期的警报。
- 利用 S3 Inventory 和 Analytics 了解您的数据分布和访问模式。
考虑 S3 Batch Operations: 对于需要对大量对象执行相同操作（如复制、更改存储类别、删除、运行 Lambda 函数等），使用 Batch Operations 通常比单独处理每个对象更具成本效益。
利用免费套餐: 对于小型项目或测试，充分利用 AWS 提供的 S3 免费套餐。

如何估算 S3 费用

AWS 提供了强大的在线工具来帮助您估算费用：

AWS Pricing Calculator: 您可以使用此工具输入预期的存储量、请求类型和数量、数据传输量等信息，获得详细的 S3 费用估算报告。强烈建议在使用 S3 之前或规划大量使用时使用此工具。

总结

AWS S3 的定价是一个多维度的模型，涵盖存储、请求、数据传输、管理功能和特殊特性等多个方面。理解不同存储类别的特点及其相关的请求和检索费用，是管理 S3 成本的关键。通过结合使用适当的存储类别、实施有效的生命周期策略、监控使用情况和利用 AWS 提供的成本管理工具，您可以有效地控制和优化您的 S3 支出，充分利用这一强大且灵活的对象存储服务。

请注意，AWS 的定价可能会随时间调整，本文旨在提供全面的指导原则和详细解释。最准确和最新的定价信息请务必查阅您所在区域的官方 AWS S3 定价页面。

希望这篇详细指南能帮助您更好地理解 AWS S3 的定价，并做出明智的决策来管理您的云存储成本。