用了很多年Dubbo,連Dubbo線程池監(jiān)控都不知道,覺得自己很厲害?
前言
micrometer 中自帶了很多其他框架的指標信息,可以很方便的通過 prometheus 進行采集和監(jiān)控,常用的有 JVM 的信息,Http 請求的信息,Tomcat 線程的信息等。
對于一些比較活躍的框架,有些還是不支持的,比如 Dubbo。如果想監(jiān)控 Dubbo 的一些指標,比如線程池的狀況,我們需要手動去擴展,輸出對應的線程池指標才行。
在這種情況下,肯定是沒什么思路的,因為你不知道怎么去擴展,下面給大家介紹去做一件事情之前的思考,方式方法很重要。
- Dubbo 有沒有現(xiàn)成的實現(xiàn)?
- 參考 micrometer 中指標的實現(xiàn),依葫蘆畫瓢?
Dubbo 有沒有現(xiàn)成的實現(xiàn)?
完整的實現(xiàn)應該沒有,至少我還沒用過,也沒有那種去搜索引擎一搜就大把結果的現(xiàn)狀,于是我在 Dubbo 的 Github 上找到了一個相關的項目 dubbo-spring-boot-actuator。
https://github.com/apache/dubbo-spring-boot-project/tree/master/dubbo-spring-boot-actuator
dubbo-spring-boot-actuator 看名稱就知道,提供了 Dubbo 相關的各種信息端點和健康檢查。從這里面也許能發(fā)現(xiàn)點有用的代碼。
果不其然,在介紹頁面中看到了想要的內(nèi)容,線程池的指標數(shù)據(jù),只不過是拼接成了字符串顯示而已。
"threadpool": { "source": "management.health.dubbo.status.extras", "status": { "level": "OK", "message": "Pool status:OK, max:200, core:200, largest:0, active:0, task:0, service port: 12345", "description": null } }
然后就去翻 dubbo-spring-boot-actuator 的代碼了,沒找到線程池這塊的代碼。后面在 dubbo.jar 中找到了 ThreadPoolStatusChecker 這個類,核心邏輯在這里面。現(xiàn)在已經(jīng)解決了第一個問題,就是獲取到 Dubbo 的線程池對象。
參考 micrometer 中指標的實現(xiàn),依葫蘆畫瓢?
線程池對象能拿到了,各種數(shù)據(jù)也就能獲取了。接下來的問題就是如何暴露出去給 prometheus 采集。
兩種方式,一種是自定義一個新的端點暴露,一種是直接在已有的 prometheus 端點中增加指標數(shù)據(jù)的輸出,也就是依葫蘆畫瓢。
看源碼中已經(jīng)有很多 Metrics 的實現(xiàn)了,我們也實現(xiàn)一個 Dubbo 線程池的 Metrics 即可。
上圖框起來的就是一個已經(jīng)存在的線程池 Metrics,可以直接復用代碼。
實現(xiàn)的主要邏輯就是實現(xiàn)一個 MeterBinder 接口,然后將你需要的指標進行輸出即可。于是打算在 bindTo 方法中獲取 Dubbo 的線程池對象,然后輸出指標。經(jīng)過測試,在 MeterBinder 實例化的時候 Dubbo 還沒初始化好,拿不到線程池對象,綁定后無法成功輸出指標。
后面還是打算采用定時采樣的方式來輸出,自定義一個后臺線程,定時去輸出數(shù)據(jù)??梢杂?Timer,我這圖簡單就直接 while 循環(huán)了。
/** * Dubbo線程池指標 * * @author yinjihuan */ @Configuration public class DubboThreadMetrics { @Autowired private MeterRegistry meterRegistry; private final IterableTAG = Collections.singletonList(Tag.of("thread.pool.name", "dubboThreadPool")); @PostConstruct public void init() { new Thread(() -> { while (true) { try { Thread.sleep(1000); } catch (InterruptedException e) { e.printStackTrace(); } DataStore dataStore = ExtensionLoader.getExtensionLoader(DataStore.class).getDefaultExtension(); Mapexecutors = dataStore.get(Constants.EXECUTOR_SERVICE_COMPONENT_KEY); for (Map.Entry entry : executors.entrySet()) { ExecutorService executor = (ExecutorService) entry.getValue(); if (executor instanceof ThreadPoolExecutor) { ThreadPoolExecutor tp = (ThreadPoolExecutor) executor; Gauge.builder("dubbo.thread.pool.core.size", tp, ThreadPoolExecutor::getCorePoolSize) .description("核心線程數(shù)") .baseUnit("threads") .register(meterRegistry); Gauge.builder("dubbo.thread.pool.largest.size", tp, ThreadPoolExecutor::getLargestPoolSize) .description("歷史最高線程數(shù)") .baseUnit("threads") .register(meterRegistry); Gauge.builder("dubbo.thread.pool.max.size", tp, ThreadPoolExecutor::getMaximumPoolSize) .description("最大線程數(shù)") .baseUnit("threads") .register(meterRegistry); Gauge.builder("dubbo.thread.pool.active.size", tp, ThreadPoolExecutor::getActiveCount) .description("活躍線程數(shù)") .baseUnit("threads") .register(meterRegistry); Gauge.builder("dubbo.thread.pool.thread.count", tp, ThreadPoolExecutor::getPoolSize) .description("當前線程數(shù)") .baseUnit("threads") .register(meterRegistry); Gauge.builder("dubbo.thread.pool.queue.size", tp, e -> e.getQueue().size()) .description("隊列大小") .baseUnit("threads") .register(meterRegistry); Gauge.builder("dubbo.thread.pool.taskCount", tp, ThreadPoolExecutor::getTaskCount) .description("任務總量") .baseUnit("threads") .register(meterRegistry); Gauge.builder("dubbo.thread.pool.completedTaskCount", tp, ThreadPoolExecutor::getCompletedTaskCount) .description("已完成的任務量") .baseUnit("threads") .register(meterRegistry); } } } }).start(); } }
指標信息:
配置線程池圖表
創(chuàng)建一個新的 dashboard 配置圖表,然后新建 panel 配置指標信息
左側配指標信息,右側選擇對應的圖表格式。需要注意的是,如果有多個服務實例,Metrics 這邊最好是根據(jù)服務實例來顯示,需要在指標后面增加條件,如下:
dubbo_thread_pool_max_size_theads{application="$application", instance=~"$instance"}
免責聲明:本文內(nèi)容由21ic獲得授權后發(fā)布,版權歸原作者所有,本平臺僅提供信息存儲服務。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!