可用性

監控專家能夠在每次監測時分別判斷各個監測點是否可用,並透過所有監測點的可用性來判斷監控項目的可用性。例如,監控一個網站:

  • 一次監測中,只要網站在一個監測點可用,則認為網站是可用的。

  • 一次監測中,只有網站在所有監測點都不可用時,才認為網站是不可用的,即發生故障。

可用

根據網站監控類型的不同,可用的具體含義如下:

  • HTTP/HTTPs監控:網站可以正常訪問。

  • Ping監控:指定的伺服器可以正常進行ICMP Ping檢測。

  • DNS監控:DNS域名解析伺服器可以正常解析指定域名。

  • TCP監控:透過TCP協定可以正常連接伺服器指定通訊埠。

  • FTP監控:FTP伺服器可以正常連接。

  • UDP監控:透過UDP協定可以正常連接伺服器指定通訊埠。

  • SMTP監控:SMTP郵件伺服器可以正常連接。

  • TraceRoute監控:伺服器可以正常Trace。

可用率

可用率是一段時間內網站或伺服器可用的時間占總時間的百分比。

例如,網站首頁在一天內都可以正常訪問,那麼網站首頁一天的可用率為100%。如果網站首頁有9分鐘無法訪問,而一天共有1440分鐘,那麼網站首頁的可用率為:

((1440 - 9) / 1440) * 100%,也就是99.37%。

平均可用率

平均可用率是指一段時間內所有監測點可用率的平均值。

例如,用戶選擇查看“中南地區&電信“的可用率統計,中南地區(電信)包括3個監測點,可用率分別為:廣東深圳電信99.81%、廣東廣州電信99.81%、廣東佛山電信100%,則:

平均可用率=(99.81%+99.81%+100%)/3=99.87%

故障

根據網站監控類型的不同,故障的具體含義如下:

  • HTTP/HTTPs監控:所有監測點都無法正常訪問網站。

  • Ping監控:所有監測點都出現數據封包全部丟棄。

  • DNS監控:所有監測點都出現域名解析失敗。

  • TCP監控:所有監測點都出現TCP連接失敗。

  • FTP監控:所有監測點都出現FTP連接失敗。

  • UDP監控:所有監測點都出現UDP連接失敗。

  • SMTP監控:所有監測點都出現SMTP連接失敗。

  • TraceRoute監控:所有監測點都出現Trace失敗。

故障率

故障率是指一段時間監控項目故障的時間占總時間的百分比。

例如,監控項目的監測頻率為2分鐘,在10分鐘內進行了5次監測,每次監測都有3個監測點(A、B、C)執行監測任務,具體監測結果見下表。


第一次監測

第二次監測

第三次檢測

第四次監測

第五次監測

監測點A

不可用

可用

可用

可用

可用

監測點B

不可用

不可用

可用

可用

不可用

監測點C

不可用

可用

不可用

可用

可用

是否故障

故障時間

2分鐘

0分鐘

0分鐘

0分鐘

0分鐘

註:每次監測結果為故障時,故障時間都加一個和監測頻率相同的時間。

那麼,故障率=故障時間/總時間,即(2+0+0+0+0)/10=20%。

回應時間

回應時間是指從用戶對網站或伺服器發送請求開始,一直到目標內容下載到用戶端所用的時間。

對於HTTP/HTTPs監控,回應時間只針對網頁本身,包括DNS解析、建立連接、伺服器計算、下載內容所用的時間總和。但不包括網頁中其它組件(比如CSS、Javascript腳本)的下載時間。

對於Ping監控,回應時間其實就是我們經常在命令行中用ping命令看到的time值,也就是我們常說的Ping值。

平均回應時間

每次監控中各個監測點回應時間的平均值。

最快回應時間

每次監控中各個監測點回應時間中最小的回應時間。

最慢回應時間

透過每次監控中各個監測點回應時間中最大的回應時間。

封包遺失率

在Ping監控中,遺失數據封包數量占所發送數據封包數量的百分比。如果不出現丟包情況監測點會發送3個數據封包,如果中間有出現丟包情況監測點會發送4個數據封包。

TraceRoute總跳數

數據封包從監測點到目標主機所經過的總路由跳數。

TraceRoute無回應跳數

數據封包從監測點到目標主機所經過的路由跳數中沒有回應的跳數。

TraceRoute丟包跳數比

從監測點到目標主機出現丟包的跳數/總跳數。

無法連接伺服器

指5秒內無法建立TCP連接,這個是我們自定義的。這與瀏覽器返回的“無法連接伺服器”是兩回事。

我們的監控很敏感,監測點請求一次,如果在五秒內無法連接到您的伺服器獲取資訊,就會產生無法連接到伺服器的記錄。

請求逾時

指我們監測點在30秒內沒有完成請求,這跟瀏覽器的請求逾時並不是一回事,通常我們認為用戶不會等待這麼長時間。

某一監測點出現問題可能是局部網路存在問題,因為我們監測點機房到您網站所在機房要走多級路由,路由走向很大程度由您的機房與我們機房的地理位置及機房網路的ISP來決定。如果從監測點機房到您網站所在機房所走多級路由中某一個路由不穩定或者有頻寬瓶頸,那麼訪問就有可能出現問題。但此時我們的監測點到其他用戶的機房有可能就是正常的。

伺服器無回應數據

向伺服器發送請求後無回應數據,可能是伺服器處理請求時出現異常,建議您檢查伺服器Web應用程序。

回應內容超長

回應內容過大,監控專家不支援超過1MB的回應內容,建議使用HEAD方式。

DNS無法解析

可能是域名DNS服務商或者監測點ISP服務商的DNS伺服器故障,可以在歷史快照中找到用於解析的DNS伺服器,並聯絡相關負責人。

數據封包全部丟棄

單次ICMP Ping檢測的封包遺失率為100%。

域名不存在

沒有透過DNS伺服器查詢到對應的域名,建議聯絡域名服務商。

無解析記

沒有給域名設定任何記錄。