首页 > 帮助中心 > AWS CloudWatch如何创建自定义指标，监控应用程序的性能

AWS CloudWatch如何创建自定义指标，监控应用程序的性能

⏱️2026-04-17 09:00 👁️80

创建一个自定义指标来监控你的应用程序性能，可以使用 AWS CloudWatch 📈。以下是一些步骤和示例：

1. 确定要监控的指标

首先，确定哪些性能指标对你来说最重要 🤔。例如：

请求延迟：衡量处理请求所需的时间。
错误率：应用程序返回错误的频率。
CPU 使用率：应用程序使用的 CPU 资源量。
内存使用量：应用程序使用的内存量。
自定义业务指标：例如，成功交易的数量或特定功能的调用次数。

2. 在应用程序中埋点

在你的应用程序代码中，你需要添加一些代码来收集这些指标数据 📍。这通常涉及到：

记录关键事件的发生时间。
计算错误数量。
获取系统资源使用情况。

示例（Python）

import boto3
import time
import random

# 创建 CloudWatch 客户端
cloudwatch = boto3.client('cloudwatch')

def record_latency(latency):
    """记录请求延迟"""
    cloudwatch.put_metric_data(
        Namespace='MyApp',  # 命名空间，用于组织指标
        MetricData=[
            {
                'MetricName': 'RequestLatency',  # 指标名称
                'Dimensions': [  # 可选的维度，用于更精细的分类
                    {
                        'Name': 'Endpoint',
                        'Value': 'API_Endpoint_A'
                    },
                ],
                'Unit': 'Milliseconds',  # 单位
                'Value': latency  # 指标值
            },
        ]
    )

def record_error():
    """记录错误"""
    cloudwatch.put_metric_data(
        Namespace='MyApp',
        MetricData=[
            {
                'MetricName': 'ErrorCount',
                'Unit': 'Count',
                'Value': 1
            },
        ]
    )

# 模拟应用程序逻辑
def handle_request():
    start_time = time.time()
    # 模拟一些工作
    time.sleep(random.uniform(0.1, 0.5))  # 模拟 0.1 到 0.5 秒的延迟
    end_time = time.time()
    latency = (end_time - start_time) * 1000  # 转换为毫秒
    record_latency(latency)

    # 模拟错误发生
    if random.random() < 0.1:  # 10% 的概率发生错误
        record_error()
        print("Error occurred!")

# 循环处理请求
for _ in range(10):
    handle_request()
    time.sleep(1)  # 每秒处理一个请求

解释

boto3 是 AWS SDK for Python。
cloudwatch.put_metric_data 用于将指标数据发送到 CloudWatch。
Namespace 是你的应用程序的命名空间。
MetricName 是指标的名称。
Dimensions 允许你添加维度，例如 Endpoint，以便你可以按端点过滤指标。
Unit 是指标的单位（例如，Milliseconds，Count）。
Value 是指标的值。

3. 使用 AWS SDK 或 API 发送指标数据

使用 AWS SDK (例如 Python 的 boto3) 或 CloudWatch API 将收集到的指标数据发送到 CloudWatch 🚀。

4. 配置 CloudWatch 仪表板

在 AWS 管理控制台中，转到 CloudWatch 并创建仪表板。你可以将自定义指标添加到仪表板，并使用各种图表类型（例如折线图、条形图）可视化数据 📊。

5. 设置 CloudWatch 警报

创建 CloudWatch 警报，以便在指标超过定义的阈值时收到通知 🚨。例如，你可以设置一个警报，当错误率超过 5% 时发送电子邮件或 SMS 通知。

示例：创建警报

在 CloudWatch 控制台中，选择 "Alarms"。
点击 "Create alarm"。
选择你的自定义指标（例如，MyApp/RequestLatency）。
配置警报条件（例如，当 RequestLatency 大于 100 毫秒时）。
设置通知操作（例如，发送电子邮件）。

6. 使用 CloudWatch Logs Insights 分析日志

如果你的应用程序将日志写入 CloudWatch Logs，你可以使用 CloudWatch Logs Insights 来分析日志数据，并基于日志数据创建指标 🔍。

示例：使用 Logs Insights 创建指标

fields @timestamp, @message
| filter @message like /ERROR/
| stats count() as ErrorCount by bin(1m)

这个查询会统计每分钟包含 "ERROR" 字符串的日志条目数量，并将结果作为 ErrorCount 指标。

7. 使用 CloudWatch Metric Streams

你可以使用 CloudWatch Metric Streams 将指标数据流式传输到其他 AWS 服务（例如 Amazon S3）或第三方解决方案（例如 Datadog） 📡。

最佳实践

选择合适的命名空间：使用有意义的命名空间来组织你的指标。
使用维度：使用维度来进一步细分你的指标，以便你可以更轻松地诊断问题。
选择合适的单位：确保你的指标使用正确的单位。
设置合理的警报阈值：避免设置过于敏感或过于宽松的警报阈值。

通过以上步骤，你可以创建自定义指标，并使用 CloudWatch 监控应用程序的性能，从而及时发现和解决问题 🎉！

上一篇：腾讯云TDSQL如何进行分库分表，以提高数据库的扩展性？

下一篇：腾讯云TI平台如何进行模型监控，以便及时发现模型退化？

鲨鱼云自助平台

鲨鱼云自助平台是一站式国际云服务解决方案平台，支持阿里云国际、腾讯云国际、亚马逊AWS、谷歌云GCP等主流云厂商账号的开通、充值与管理。

自助站点

自助BOT