Commit fe31c53d authored by 郭人方's avatar 郭人方

doc: skywalking 使用说明

parent c3f9783f
# UI介绍
## SkyWalking仪表盘包括以下部分。
![仪表板.png](./images/仪表板.png)
1.功能选项卡选择区: 仪表盘、拓补图、追踪、性能剖析、日志、告警、事件、调试
2.重载区: 控制重新加载机制,包括定期重新加载或手动重新加载.
3.时间选择器: 控制时区和时间范围。这里有一个中文/英文切换按钮,默认,UI使用浏览器语言设置。
## 仪表板
1.吞吐量CPM,表示每分钟的调用,cpm 全称 call per minutes,是吞吐量(Throughput)指标。下图是拼接的全局、服务、实例和接口的吞吐量及平均吞吐量。
![CPM](./images/CPM.jpg)
第一条185cpm=185/60=3.08个请求/秒。
2.Apdex分数,Apdex规范推荐了以下Apdex质量评级,将Apdex得分分为:
2.1 优秀(0.94 - 1.00)
2.2 良好(0.85 - 0.93)
2.3 一般(0.70 - 0.84)
2.4 差(0.50 - 0.69)
2.5 不可接受(0.00 - 0.49)
3.响应时间百分比(Percent Response),包括 p99, p95, p90, p75, p50,其中的 “p99:390” 表示 99% 请求的响应时间在390ms以内。而99%一般用于抛掉一些极端值,表示绝大多数请求。
4.SLA表示成功率。SLA 全称 Service-Level Agreement,直译为 “服务等级协议”,用来表示提供服务的水平。在IT中,SLA可以衡量平台的可用性,下面是N个9的计算:
4.1 1年 = 365天 = 8760小时
4.299 = 8760 * 1% => 3.65天
4.399.9 = 8760 * 0.1% => 8.76小时
4.4 99.99 = 8760 * 0.01% => 52.6分钟
4.5 199.999 = 8760 * 0.001% => 5.26分钟
因此,全年只要发生一次较大规模宕机事故,4个9肯定没戏,一般平台3个9差不多。但2个9就基本不可用了,相当于全年有87.6小时不可用,每周(一个月按4周算)有1.825小时不可用。下图是服务、实例、接口的SLA,一般看年度、月度即可。
![SLA](./images/SLA.jpg)
5. Slow Endpoint 慢端点
Endpoint 表示具体的服务,例如一个接口。下面是全局Top N的数据,通过这个可以观测平台性能情况。
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment