Cloud Monitoring 的配額與限制

本文列出 Cloud Monitoring 適用的配額和系統限制。

  • 配額會指定您可使用的可計數共用資源數量。 Google Cloud 配額是由 Cloud Monitoring 等服務定義。
  • 系統限制為固定值,無法變更。

Google Cloud 會使用配額來確保公平性,並減少資源使用量和可用性的尖峰情形。配額會限制 Google Cloud 專案可使用的Google Cloud 資源數量。配額適用於多種資源類型,包括硬體、軟體和網路元件。舉例來說,配額可以限制向服務發出的 API 呼叫數、專案並行使用的負載平衡器數量,或可建立的專案數量。限制配額可預防服務超載,進而保障Google Cloud 使用者社群的權益。配額也能協助您管理自己的 Google Cloud 資源。

Cloud 配額系統會執行以下作業:

在大多數情況下,如果您嘗試使用的資源超過配額限制,系統會封鎖對該資源的存取權,而您嘗試執行的任務也會失敗。

配額通常會套用至 Google Cloud 專案層級。您在一個專案中使用資源,不會影響其他專案的可用配額。在 Google Cloud 專案中,所有應用程式和 IP 位址都會共用配額。

如要調整大部分配額,請使用 Google Cloud 控制台。詳情請參閱「要求配額調整」。

監控資源也有系統限制。系統限制無法變更。

使用者定義的指標

Cloud Monitoring 的「指標管理」頁面提供的資訊可協助您控制可計費指標的支出金額,且不會影響可觀察性。「指標管理」頁面會回報下列資訊:

  • 以位元組和樣本為基礎的計費作業量,跨指標網域和個別指標。
  • 指標的標籤和基數資料。
  • 每個指標的讀取次數。
  • 在警告政策和自訂資訊主頁中使用指標。
  • 指標寫入錯誤率。

您也可以使用「指標管理」頁面排除不需要的指標,省下擷取這些指標的成本。 如要進一步瞭解「指標管理」頁面,請參閱「查看及管理指標使用情形」一文。

類別 上限
每項專案的自訂指標描述元數量1 10,000
每個自訂、外部和工作負載指標描述元的標籤 30
每個 Prometheus 指標描述元的標籤 200
標籤鍵的字串長度 100
標籤值的字串長度 1024
寫入要求中可含的時間序列數2 200
將資料寫入單一時間序列的速率3 每 5 秒 1 個資料點
每項自訂分布指標的直方圖值區 200
每項專案的工作負載、Prometheus 和外部4 指標描述元 25,000
各項受控資源中5自訂指標產生的有效時間序列 200,000
各項受控資源中工作負載指標產生的有效時間序列5 200,000
每項受控資源中 Prometheus 產生的有效時間序列5 1,000,000
各項受控資源中5外部指標產生的有效時間序列 200,000
建立指標描述元的速率 每項專案每分鐘 6,000 次

1 這項限制由 Cloud Monitoring 設定,其他服務設定的上限可能較低。自訂指標是指寫入 custom.googleapis.com 的指標。
2 在單一要求的各個時間序列中,您只能寫入一個資料點,因此這項限制也等同於每項要求的寫入資料點上限。
3 Cloud Monitoring API 要求將資料點寫入時間序列的結束時間至少必須間隔 5 秒。您可以將資料點批次寫入時間序列,前提是系統會依序寫入這些資料點。
4 外部指標是指寫入 external.googleapis.com 的指標,
5 如果您是在過去 24 小時內將資料點寫入時間序列,該時間序列即為有效。 列中指定的限制,是指單一受控資源 (例如單一 gce_instance VM 或單一 k8s_container 容器) 在該列中所有使用者定義指標 (自訂、工作負載、Prometheus 或外部) 的有效時間序列總數。不過 global 受控資源不在此限,各項使用者定義指標的限制配額會分開計算。這是全系統通用的安全限制,因此無法自訂。

Monitoring API 配額和限制

類別 上限
API 用量限制

如要查看 API 配額和限制,請執行下列任一操作:

API 頁面權杖的有效期限 24 小時

Monitoring API 配額簡介

Monitoring API 有時間序列擷取要求和時間序列查詢的頻率配額限制。擷取要求是寫入時間序列資料的呼叫,查詢是擷取時間序列資料的呼叫。其他 Monitoring API 端點也會受到內部限制的影響,這些端點無法處理以高頻率發出的要求。

如要減少服務在寫入時間序列資料時發出的 API 要求數量,請使用一個 API 要求寫入多個時間序列的資料。建議您每個要求至少寫入 10 個物件。如要進一步瞭解如何批次處理 API 要求,請參閱 timeSeries.create

如果在批次處理 API 要求後,仍需要更高的 Monitoring API 配額限制,請與Google Cloud 支援團隊聯絡。

其他配額限制為固定值,如本頁面中所述。

詳請請參閱處理配額一文。

資料保留

超過保留期限的指標資料點會從時間序列中刪除。

類別
自訂、外部和代理程式指標類型產生的資料點保留期限,包括:
  • 自訂指標,前置字元 custom.googleapis.com
  • Google Cloud Managed Service for Prometheus 的指標,前置字串為 prometheus.googleapis.com2
  • 代理程式指標,前置字串 agent.googleapis.com,包括
    processes/count_by_stateprocesses/fork_state
    其餘 processes 指標的保留期限不同,請參閱下列項目。
  • 外部指標,前置碼 external.googleapis.com
  • OpenTelemetry 和其他工作負載指標,前置字串 workload.googleapis.com
24 個月1
程序健康狀態指標類型產生的資料點保留期限:agent.googleapis.com/processes
,但 count_by_statefork_state 除外,如前一個項目所述。
24 小時
保留部分 Google Cloud 服務的資料點,包括下列類別中的大部分指標:
  • Compute Engine 指標,前置字串 compute.googleapis.com
  • GKE 和 GKE Enterprise 指標,前置字串 kubernetes.io
  • Cloud Storage 指標,前置字串 storage.googleapis.com
  • BigQuery 指標,前置字元 bigquery.googleapis.com
  • Cloud SQL 指標,前置字串 cloudsql.googleapis.com
  • 內部、https 和 L7 負載平衡器指標,前置符號 loadbalancing.googleapis.com
24 個月1
所有其他指標類型產生的資料點保留期限,包括: 6 週
API 頁面權杖的有效期限 24 小時

1 指標資料在原始的取樣頻率時保留 6 週,然後降低取樣至 10 分鐘間隔以擴充儲存空間。
2 Google Cloud Managed Service for Prometheus 會以原始的取樣頻率儲存指標資料 1 週,然後降低取樣至 1 分鐘間隔,以便在接下來的 5 週內擴充儲存空間,最後再降低取樣至 10 分鐘間隔。

資源群組

類別
每個指標範圍 的資源群組數 500
電子郵件報告中的群組數量上限1 10

1 設定 Cloud Monitoring 電子郵件報告時,您可以要求取得資源群組使用情況的相關資訊。由於電子郵件報告程式有其限制,產生的報告中僅包括 10 個群組的資訊。

受監控專案數量限制

Cloud Monitoring 官方支援最多 375 個 Google Cloud 專案,每個指標範圍

每個指標範圍最多可新增 3,500 個 Google Cloud 專案,但您可能會遇到效能問題,尤其是在查詢自訂指標或歷來資料時。Cloud Monitoring 僅針對每個指標範圍的 375 個 Google Cloud 專案保證查詢和圖表效能。

如要提高 Google Cloud 每個指標範圍的專案配額,您可以要求提高「監控的專案 / Monitoring 指標範圍」配額。詳情請參閱管理配額相關說明文件。

建立及更新指標描述元的限制

Cloud Monitoring 會針對建立新指標、為現有指標新增標籤名稱,以及刪除指標的操作,強制執行每分鐘的頻率限制。只有在首次與 Cloud Monitoring 整合時,才會觸及這項速率限制,例如將現有的成熟 Prometheus 部署作業遷移至 Cloud Monitoring 時。這不是攝入資料點的速率限制。這項速率限制只會在您建立未曾見過的指標,或在現有指標中新增標籤名稱時生效。

這個配額是固定的,但當新指標和指標標籤的建立次數達到每分鐘限制時,系統會自動解決任何問題。

快訊限制

類別 政策類型 1
警告政策 (指標和記錄的總和),按指標範圍 計算2 500 指標、記錄檔
每個以指標為準的快訊政策的條件 6 指標
每個 以 SQL 為基礎的警示政策的條件 (公開測試版) 1 SQL
以 SQL 為基礎的警示政策的查詢執行時間上限 (公開測試版) 5 分鐘 SQL

缺少指標條件評估的最大時間長度3
1 天 指標

metric-threshold 條件評估的最大時間長度3
23 個小時 30 分鐘 指標
在指標門檻條件中使用的篩選器長度上限
2,048 個 Unicode 字元 指標
預測條件監控的時間序列
數量上限
64 指標
最短預測期間 1 小時 (3,600 秒) 指標
預測期間上限 2.5 天 (216,000 秒) 指標
每個快訊政策的通知管道 16 全部
以記錄檔為準的快訊事件4
的事件頻率上限
每 5 分鐘 1 次事件 記錄檔
以記錄檔為準的快訊事件數量上限
每個以記錄為準的快訊政策每天 20 起事件 記錄檔
每個事件的通知數量上限:5
(記錄檔型快訊)
每個事件每天 20 則通知 記錄檔
每個專案同時觸發的快訊政策
數量上限
80,000 全部
每個快訊政策中同時存在的未解決事件數量上限
1,000 全部
事件沒有新資料時,系統會在
自動關閉事件的期限
7 天 指標、SQL
未手動關閉的事件上限時間長度 7 天 記錄檔
保留已結案事件 13 個月 不適用
未解決事件的保留期限 無限期 不適用
通知管道 (依指標範圍 ) 4,000 不適用
每個延後的快訊政策數量上限 16 全部
延後鬧鐘的保留時間 13 個月 不適用
1指標:以指標資料為準的警告政策;記錄:以記錄訊息為準的警告政策 (記錄型警報)
2ApigeeApigee hybrid 已與 Cloud Monitoring 深度整合。所有 Apigee 訂閱層級 (Standard、Enterprise 和 Enterprise Plus) 的警示限制與 Cloud Monitoring 相同:每個指標範圍 500 個。
3條件評估的最大時間範圍,是對齊期間和時間範圍值的總和。舉例來說,如果對齊期間設為 15 小時,且時間長度視窗設為 15 小時,則需要 30 小時的資料才能評估條件。
4如果以記錄為基礎的警示政策的查詢擷取標籤值,則每個擷取值組合都代表各自的事件時間表。舉例來說,假設以記錄為基礎的警示政策會擷取標籤的值,而標籤可以有兩個值。在這個設定下,您可以在 5 分鐘內建立兩個事件,每個標籤值對應一個事件。
5針對記錄快訊,如果系統收到符合篩選條件的記錄項目,且自上次通知發出後已過至少 5 分鐘,監控服務就會針對未解決的事件傳送新通知。每個事件每天最多會傳送 20 則通知。每則通知都會傳送至快訊政策的所有已設定通知管道。

簡訊限制

簡訊限制會以 24 小時為週期計算。

類別
簡訊驗證碼數量 40
每個電話號碼的簡訊驗證碼數量 5
簡訊快訊訊息數 2,500
每個電話號碼的簡訊快訊數量 200

綜合監控功能的限制

類別
每個指標範圍的運作時間檢查 * 100
每項公開運作時間檢查的 ICMP 封包偵測數量上限 3
綜合監控 (依指標範圍 ) 100
*這項限制適用於運作時間檢查設定的數量,每項運作時間檢查設定都包括測試指定資源狀態之間的間隔時間。
如要瞭解如何提高此限制,請參閱「使用 Google Cloud 控制台管理配額」。

圖表的限制

類別
資訊主頁 (依指標範圍 ) 1000
資訊主頁中的圖表數 100
資訊主頁版本記錄保留期限 90 天
圖表上的線條數 50*
資料表中的資料列 300
*這項限制是基於效能考量而設立。如果要繪製的時間序列超過 50 個,工具列會顯示帶有紅點的圖示。圖示的工具提示會顯示訊息 To improve performance, we've limited the time series displayed in this chart。如要顯示所有時間序列,請展開工具提示,然後選取標示為「Show All Time Series」的按鈕。

服務等級目標

類別
每項服務的服務等級目標數 500