當(dāng)前位置:首頁(yè) > 嵌入式 > 嵌入式硬件

  BOSS作為移動(dòng)運(yùn)營(yíng)商業(yè)務(wù)支撐的最核心系統(tǒng),在提高運(yùn)營(yíng)能力、控制成本、分析市場(chǎng)等方面都發(fā)揮關(guān)鍵作用。隨著數(shù)據(jù)業(yè)務(wù)的快速發(fā)展,外圍系統(tǒng)不斷增加,系統(tǒng)之間的數(shù)據(jù)傳遞與功能交互也呈劇增趨勢(shì)。

由于歷史與公司發(fā)展策略等多種因素,佛山移動(dòng)的BOSS系統(tǒng)中存在著多種系統(tǒng)并存的情況。而多數(shù)系統(tǒng)由不同公司開發(fā),也導(dǎo)致數(shù)據(jù)格式、消息機(jī)制等不盡相同。其中的惟一相同點(diǎn),是外圍系統(tǒng)都必須通過“接口”才能與BOSS產(chǎn)生交互,接口有效地保證了數(shù)據(jù)安全與模塊獨(dú)立,同時(shí)也意味接口中斷將割裂內(nèi)外部系統(tǒng)的連接。

根據(jù)規(guī)范,所有功能與業(yè)務(wù)的設(shè)置都必須由BOSS發(fā)起,一旦發(fā)生接口故障,涉及外圍系統(tǒng)的一切操作都將失敗。以目前的用戶基數(shù),即便是短時(shí)間內(nèi)發(fā)生異常,所造成的影響也是不可估量。因此,研究如何保障接口的高穩(wěn)定性與可靠性意義重大。

BOSS2.0接口系統(tǒng)框架   

BOSS接口系統(tǒng)并非獨(dú)立存在,圖1描述了接口系統(tǒng)的技術(shù)框架,如圖中所示,在整個(gè)技術(shù)架構(gòu)中,BOSS接口所處的位置、與關(guān)聯(lián)模塊的對(duì)接方式、內(nèi)部實(shí)現(xiàn)原理等因素,都是能有效維護(hù)BOSS系統(tǒng)的基本前提。

圖1 BOSS2.0接口系統(tǒng)框架   

由圖1可知,從調(diào)用方向的角度看,接口可分為主動(dòng)接口和被動(dòng)接口,分別表示BOSS調(diào)用外圍系統(tǒng)服務(wù),以及外圍系統(tǒng)調(diào)用BOSS服務(wù)。主動(dòng)接口由BOSS應(yīng)用服務(wù)器驅(qū)動(dòng),即BOSS應(yīng)用服務(wù)器上的主動(dòng)服務(wù)接口進(jìn)程,是調(diào)用CICS對(duì)相關(guān)待處理表進(jìn)行輪詢,并將每一條記錄封裝為一條消息放入MQ隊(duì)列(該隊(duì)列均由消息組成),接口機(jī)上的主動(dòng)接口再?gòu)年?duì)列中取出消息進(jìn)行解析,進(jìn)而根據(jù)控制信息發(fā)送到指定系統(tǒng)執(zhí)行。被動(dòng)接口則是由外圍系統(tǒng)驅(qū)動(dòng),通過接口機(jī)上的CICS客戶端調(diào)用BOSS應(yīng)用服務(wù)器上的業(yè)務(wù)層服務(wù)操作數(shù)據(jù)庫(kù)。

值得一提的是,作為BOSS與外圍系統(tǒng)的承接點(diǎn),接口的功能最終可歸結(jié)為對(duì)BOSS與外圍系統(tǒng)數(shù)據(jù)庫(kù)的操作。其中,主動(dòng)接口的實(shí)現(xiàn)邏輯對(duì)BOSS2.0接口監(jiān)控措施的實(shí)現(xiàn)至關(guān)重要。

接口監(jiān)控措施   

監(jiān)控接口是避免故障突發(fā)的重要措施。通過分析運(yùn)行情況,監(jiān)控接口能實(shí)現(xiàn)異常情況的提前預(yù)警,有效地縮短故障持續(xù)時(shí)間。

從分析方法的角度看,監(jiān)控可分為定性和定量?jī)煞N,前者關(guān)注受監(jiān)控體相關(guān)因素本質(zhì)是否發(fā)生變化,是常用手段,而后者則深入到相關(guān)因素變化的數(shù)量,使分析更為徹底。

1.接口定性監(jiān)控   

接口的本質(zhì)是進(jìn)程,監(jiān)控進(jìn)程一般采用查看進(jìn)程狀態(tài)以及日志分析。作為有具體應(yīng)用的進(jìn)程,接口還有其特殊性,因而接口的定性分析至少覆蓋以下4個(gè)層次。

1)系統(tǒng)環(huán)境   

指操作系統(tǒng)及硬件環(huán)境穩(wěn)定,提供進(jìn)程足夠的信息資源,不存在非兼容應(yīng)用等情況,這些是接口賴以生存的基本條件。

2)進(jìn)程狀態(tài)   

在系統(tǒng)環(huán)境滿足的情況下,檢測(cè)進(jìn)程狀態(tài)是最重要的方法,但必須注意進(jìn)程活躍并不等同于進(jìn)程正常工作,在Linux系統(tǒng)中,其進(jìn)程可能因異常而停止工作,但仍能在活躍列表中查詢到,此時(shí)需配合日志做進(jìn)一步定位。發(fā)生后這種現(xiàn)象的原因是,在正常情況下,所有的進(jìn)程動(dòng)作都會(huì)被寫入log文件。

3)日志分析   

在日志分析環(huán)節(jié),主要包括寫入狀態(tài)與日志內(nèi)容,如果檢測(cè)到日志處于寫狀態(tài),則說明對(duì)應(yīng)進(jìn)程是活躍的,但進(jìn)程正常與否尚需進(jìn)一步判斷日志內(nèi)容。異常操作時(shí),在日志中會(huì)有失敗代碼關(guān)鍵字返回,如failed、error等。

4)進(jìn)程時(shí)態(tài)   

進(jìn)程時(shí)態(tài)指從業(yè)務(wù)角度看進(jìn)程活躍的時(shí)間段。并非所有進(jìn)程都是24小時(shí)處于工作狀態(tài),正如銀行劃扣接口一般只允許在夜間啟動(dòng),因此白天期間檢測(cè)日志是無法判斷該進(jìn)程是否正常,若不考慮該特性,則可基本判斷該進(jìn)程結(jié)果是否有可能出錯(cuò)。

在接口的定性監(jiān)控方面,只有充分結(jié)合以上4個(gè)因素,才能對(duì)接口運(yùn)行情況形成較全面認(rèn)識(shí)。

在具體實(shí)施上,為了形成統(tǒng)一的體系以方便監(jiān)控并達(dá)到告警信息與實(shí)時(shí)的反饋,可將以上4個(gè)層面因素納入IBM公司開發(fā)的TIVOLI監(jiān)控系統(tǒng)。除此之外,為實(shí)現(xiàn)告警信息的自動(dòng)推送與分發(fā),可將自行開發(fā)告警信息轉(zhuǎn)發(fā)程序接入TIVOLI監(jiān)控系統(tǒng)信息庫(kù)。一旦檢測(cè)到異常信息存在則立即進(jìn)行短信或郵件的發(fā)送,確保維護(hù)人員及時(shí)了解接口系統(tǒng)運(yùn)行情況。整個(gè)過程如圖2所示。

圖2 TIVOLI監(jiān)控接口模型   

2.接口定量監(jiān)控   

上文措施均從接口本身入手,并定性分析其運(yùn)行情況。根據(jù)圖1對(duì)主動(dòng)接口實(shí)現(xiàn)機(jī)制的描述,本節(jié)文字將從外系統(tǒng)(BOSS庫(kù)表)的角度提出監(jiān)控措施,并利用表面不關(guān)聯(lián)的數(shù)據(jù)實(shí)現(xiàn)對(duì)接口性能的定量分析。

由于主動(dòng)接口的業(yè)務(wù)數(shù)據(jù)來源于BOSS庫(kù)表,那么,庫(kù)表數(shù)據(jù)累積情況即反映了接口的運(yùn)行情況,而庫(kù)表數(shù)據(jù)的遞減情況也就反映了接口的性能。示意圖如圖3。

圖3 庫(kù)表數(shù)據(jù)變動(dòng)邏輯示意圖   

假設(shè)主動(dòng)接口在正常工作的情況下進(jìn)程數(shù)為N,庫(kù)表原有數(shù)據(jù)量U,業(yè)務(wù)請(qǐng)求增速恒定Su,經(jīng)過時(shí)間t后U降低為0(生產(chǎn)環(huán)境中取接近0,若庫(kù)表數(shù)據(jù)隨時(shí)間不斷增加則說明接口性能不滿足),則接口單個(gè)進(jìn)程性能為Ci=(U+Sut)/Nt。通過接口性能能夠估其吞吐能力,再結(jié)合業(yè)務(wù)量重新調(diào)整接口進(jìn)程數(shù),達(dá)到資源優(yōu)化配置。

對(duì)于不間斷工作的主動(dòng)接口(如HLR施工),若其計(jì)得性能c,業(yè)務(wù)請(qǐng)求增速恒定為Su,在相鄰的2個(gè)單位時(shí)間內(nèi)查得的庫(kù)表數(shù)據(jù)量,先后為Ut、Ut+1,則如果|Ut-Ut+1|≈|c-Su|則說明接口正常,否則接口可能存在異常,需要引起重視。

對(duì)于被動(dòng)接口,BOSS庫(kù)表的作用是保存業(yè)務(wù)執(zhí)行結(jié)果,因此在計(jì)算性能時(shí)只需考慮外部請(qǐng)求滿負(fù)荷情況下庫(kù)表的增速Sp,即Cp=Sp。但必須注意的是,庫(kù)表數(shù)據(jù)的增長(zhǎng)速度s低于Cp并不能說明接口一定異常,因?yàn)樵诜菨M負(fù)荷情況下s   對(duì)于負(fù)責(zé)業(yè)務(wù)查詢的接口,其數(shù)據(jù)源與結(jié)果均不經(jīng)過BOSS庫(kù)表,因此上述方法不具有普適性。

使用定性分析與定量分析的兩種監(jiān)控方法,都只涉及接口的某一特性,在監(jiān)控時(shí)還需充分考慮各種因素,建立完整的接口健康度模型,在定性方法無法判斷接口運(yùn)行狀態(tài)時(shí)需進(jìn)一步進(jìn)行定量分析,使得兩種方法優(yōu)勢(shì)互補(bǔ),提高監(jiān)控的有效性。

應(yīng)急方案與工具   

應(yīng)急是在故障事實(shí)既定時(shí)的補(bǔ)救措施,主要包括應(yīng)急方案與工具,前者是完整的流程及措施,后者能輔助方案的順利實(shí)施。

1.制定應(yīng)急措施并演練   

作為BOSS與外圍系統(tǒng)的惟一連接點(diǎn),接口故障將導(dǎo)致內(nèi)外系統(tǒng)完全中斷。因此,最好的應(yīng)急措施之一就是在故障時(shí)立即將服務(wù)切換到備機(jī)。為保證一次切換成功率,應(yīng)急方案須詳盡、具可操作性與驗(yàn)證性,并至少在方案中詳細(xì)描述以下關(guān)鍵點(diǎn)。

1)接口機(jī)與備機(jī)網(wǎng)絡(luò)環(huán)境,包括邏輯連接圖、備機(jī)IP、網(wǎng)絡(luò)聯(lián)通等作為判斷條件;   

2)接口啟動(dòng)方式與配置參數(shù),包括指令路徑及執(zhí)行方式,配置文件具體修改方法,接口已正常啟動(dòng)的標(biāo)志;   

3)備機(jī)具備對(duì)主機(jī)完全可代替的條件,包括接口進(jìn)程類型、數(shù)量,操作系統(tǒng)環(huán)境,配置信息及網(wǎng)絡(luò)結(jié)構(gòu)等;   

4)誤操作回滾邏輯,包括操作步驟、命令字,檢測(cè)回滾成功的方法。該部分的描述在出現(xiàn)切換失敗時(shí)顯得尤為重要;   

5)切換結(jié)果測(cè)試用例,在切換成功后根據(jù)預(yù)先設(shè)計(jì)好的輸入檢測(cè)輸出是否符合要求,是檢測(cè)切換結(jié)果的有效手段。

必須強(qiáng)調(diào)的是,完善的應(yīng)急預(yù)案并不能保障應(yīng)急成功,只有配合熟練演練才能真正發(fā)揮預(yù)案的作用。

2.開發(fā)應(yīng)急工具   

應(yīng)急工具能有效縮短故障恢復(fù)時(shí)間。廣東移動(dòng)通信有限公司自主開發(fā)的“BOSS接口異常數(shù)據(jù)輔助處理系統(tǒng)”便是處理客服接口故障的重要應(yīng)急工具之一,系統(tǒng)通過將異常數(shù)據(jù)封裝為協(xié)議包直接送接口執(zhí)行,可有效彌補(bǔ)BOSS前臺(tái)功能不足、或前臺(tái)界面異常及因流程冗長(zhǎng)引起的施工延時(shí)或故障,同時(shí)由于該方式精簡(jiǎn)流程,執(zhí)行效率與成功率高,能有效應(yīng)對(duì)緊急情況。

圖4 智能網(wǎng)號(hào)碼充值流程   

以圖4智能網(wǎng)充值開機(jī)流程為例,其經(jīng)歷的步驟繁多,特別是其中信控判斷邏輯復(fù)雜,程序處理耗時(shí)多,是引起月結(jié)用戶充值到賬但無法及時(shí)開機(jī)的關(guān)鍵環(huán)節(jié)。站在服務(wù)用戶的角度,最直接的應(yīng)急方式便是提取已繳費(fèi)入賬的號(hào)碼直接送HLR施工開機(jī),對(duì)于存在欠費(fèi)可能的用戶,其開機(jī)狀態(tài)在正常流程進(jìn)行修復(fù),但對(duì)于充值后仍欠費(fèi)的用戶,其開機(jī)狀態(tài)將在經(jīng)歷過信控后自動(dòng)被修改為停機(jī)。

盡管該方式可能產(chǎn)生欠費(fèi)風(fēng)險(xiǎn),但考慮到大部分用戶將根據(jù)欠費(fèi)額度進(jìn)行充值,同時(shí)流程修復(fù)時(shí)間也相對(duì)較短,該方法依然是可行的。

利用BOSS接口異常數(shù)據(jù)輔助處理系統(tǒng)執(zhí)行以上應(yīng)急流程的方式是:在提取號(hào)碼后,根據(jù)客服協(xié)議開機(jī)命令字10007格式要求(HandsetNo~工號(hào)~返回格式~nCode~sType~備注),將批量號(hào)碼構(gòu)造成報(bào)文列表并導(dǎo)入系統(tǒng)執(zhí)行。主界面如圖5所示。

圖5 系統(tǒng)主界面   

該系統(tǒng)的設(shè)計(jì)模型如圖6所示。由設(shè)計(jì)模型可看出,系統(tǒng)主要實(shí)現(xiàn)協(xié)議包的封裝與發(fā)送,后續(xù)流程由接口進(jìn)程完成,因此,只要是接口協(xié)議支持的業(yè)務(wù)系統(tǒng)即可。統(tǒng)計(jì)《客服接口說明》命令字可知系統(tǒng)支持的業(yè)務(wù)類型約計(jì)500種,能有效滿足多種需求。

圖6 系統(tǒng)設(shè)計(jì)模型   

為了調(diào)節(jié)對(duì)接口所產(chǎn)生的壓力,系統(tǒng)還實(shí)現(xiàn)線程數(shù)與執(zhí)行時(shí)間的動(dòng)態(tài)配置,在接口壓力較大時(shí)可減少系統(tǒng)線程,并把對(duì)資源需要量多的任務(wù)定時(shí)在晚間自動(dòng)啟動(dòng),避免對(duì)接口日常運(yùn)作造成不良影響。

總結(jié)   

本文主要研究BOSS接口的監(jiān)控方法以及應(yīng)急措施,將傳統(tǒng)手段納入監(jiān)控系統(tǒng),并重點(diǎn)介紹利用庫(kù)表定量分析。在應(yīng)急措施中,主要討論應(yīng)急方案以及自建系統(tǒng)在應(yīng)急中的作用,通過監(jiān)控預(yù)防故障突發(fā),利用應(yīng)急措施降低故障影響范圍,形成較完整的接口維護(hù)體系,佛山移動(dòng)目前在實(shí)踐中已經(jīng)驗(yàn)證了該方法的有效性。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉