為什麼監控API?

隨著越來越多的零售商、媒體、政府和金融服務公司開始公開Web API,每天都有大量的API增長。API已經成為擴展產品、獲取客戶,幫助合作伙伴提供高價值服務以及擴張生態系統的關鍵渠道。

穩定的API能幫助企業提高收入,降低成本。隨著行動應用的爆發增長,未來API將會使用的越來越多,不論是提供API的服務商還是使用API的公司,都不希望發生這樣的情景:

  • 利用第三方公司提供的應用程序API失敗,導致業務中斷,交易失敗。

  • 旅游網站透過API獲取機票和酒店庫存資訊並抽取傭金,API調用失敗導致失去一個客戶或是一次機會。

  • 其他數據源資訊的API調用失敗,影響自己的內容整合。

  • 公司內部產品之間API不穩定導致業務下滑。

  • 公司提供出去的API穩定性直接影響業務收入。

……

於是,監控專家推出“API監控服務”,用於有效監控API服務穩定性和正確性。我們希望API能夠達到,在Web上每一個想要使用API的人都能調用它,並得到他們所想的結果。


什麼是API監

用戶使用您的產品完成一項操作時需要調用API(應用程序介面)併發起一系列API請求,API監控就是對這一系列API請求的監控,從而幫您了解應用程序介面的效能。

這一系列的API請求組成了一個有意義的業務流程時,能夠幫您進行業務分析。


API監控的價值和特色

監控專家提供的API監控能夠利用全球近百個監測點,即時監控API的執行狀況,包括可用性、正確性、回應時間等效能數據。透過即時告警和歷史統計分析,幫您快速發現並解決問題,節約企業的維運成本,減少業務損失。

為滿足您的多樣需求,監控專家能夠:

  • 即時監控get、post、put、delete、head、options六種API請求方式,覆蓋絕大部分的介面調用格式。

  • 支援JSON、XML、Text、Response Status驗證及Postman腳本匯入。

  • 透過“斷言”功能監測正確性,可根據業務邏輯,將API的監控分成幾個連續的請求監控。


API監控的指標

API監控包括可用性、正確性、回應時間、可用率、故障率、正確率、平均可用率、平均正確率、平均回應時間、錯誤總時間、錯誤總次數、故障總時間、故障總次數13個監控指標。判斷和計算規則如下:

指標

規則

可用性

請求

單監測點:一次監測,返回狀態碼為1XX、2XX或3XX則為可用,否則為故障。

多監測點:一次監測,所有監測點都可用,則為全部可用;部分監測點可用,則為部分可用;所有監測點都不可用,則為故障。

事務

單監測點:一次監測,事務的所有請求都可用才為可用,否則為故障。

多監測點:一次監測,所有監測點都可用,則為全部可用;部分監測點可用,則為部分可用;所有監測點都不可用,則為故障。

正確性

請求

單監測點:一次監測,斷言正確則為正確,否則為錯誤。

多監測點:一次監測,所有監測點的斷言都正確,則為全部正確;部分監測點的斷言正確,則為部分正確;所有監測點的斷言都不正確,則為錯誤。

事務

單監測點:一次監測,事務的所有請求都正確才為正確,否則為錯誤。

多監測點:一次監測,所有監測點都正確,則為全部正確;部分監測點正確,則為部分正確;所有監測點的請都不正確,則為錯誤。

回應時間

請求:一次監測,請求結果返回的時間,包括DNS解析、建立連接、伺服器計算、內容下載。(不可用、不正確的不計算)

事務:一次監測,事務中所有請求的回應時間總和。(不可用、不正確的不計算)

可用率

請求:在單個監測點,請求可用率=請求可用次數/請求總次數

事務:在單個監測點,事務可用率=事務可用次數/事務總次數

故障率

請求:單個監測點,請求故障率=1-請求可用率

事務:單個監測點,事務故障率=1-事務可用率

正確率

請求:在單個監測點,請求正確率=請求正確次數/請求總次數

事務:在單個監測點,事務正確率=事務正確次數/事務總次數

平均可用率

請求:多個監測點,先計算每個監測點的請求可用率,然後取所有監測點請求可用率的平均值。

事務:多個監測點,先計算每個監測點的事務可用率,然後取所有監測點事務可用率的平均值。

平均正確率

請求:多個監測點,先計算每個監測點的請求正確率,然後取所有監測點請求正確率的平均值。

事務:多個監測點,先計算每個監測點的事務正確率,然後取所有監測點事務正確率的平均值。

平均回應時間

請求

單監測點:一段時間內,某監測點、某請求回應時間的平均值。(不可用、不正確的不計算)

多監測點:先計算每個監測點的請求回應時間的平均值,然後取所有監測點的平均值。(不可用、不正確的不計算)

事務

單監測點:一段時間內,某監測點、某事務回應時間的平均值。(不可用、不正確的不計算)

多監測點:先計算每個監測點的事務回應時間的平均值,然後取所有監測點的平均值。(不可用、不正確的不計算)

錯誤總時間

單監測點:指定時間內,某監測點的錯誤總時間。

多監測點:指定時間內,所有監測點錯誤總時間之和。

錯誤總次數

單監測點:指定時間內,某監測點的錯誤總次數。

多監測點:指定時間內,所有監測點錯誤總次數之和。

故障總時間

單監測點:指定時間內,某監測點的故障總時間。

多監測點:指定時間內,所有監測點故障總時間之和。

故障總次數

單監測點:指定時間內,某監測點的故障總次數。

多監測點:指定時間內,所有監測點故障總次數之和。