自動轉(zhuǎn)報(bào)系統(tǒng)數(shù)據(jù)庫進(jìn)程異常的現(xiàn)象及處置過程的案例分析論文
摘要:本文詳細(xì)描述了自動轉(zhuǎn)報(bào)系統(tǒng)數(shù)據(jù)庫進(jìn)程異常的現(xiàn)象及處置過程, 總結(jié)了類似故障的處理方法及預(yù)防措施。
關(guān)鍵詞:自動轉(zhuǎn)報(bào)系統(tǒng); 數(shù)據(jù)庫操作處理進(jìn)程DMHS_M(jìn)ON; 壓報(bào);
2010年, 北京區(qū)管中心從中國民航總局航管科技公司引進(jìn)了DMHS—H大型電報(bào)和信息交換處理系統(tǒng), 該系統(tǒng)采用存儲轉(zhuǎn)發(fā)的方式完成電報(bào)信息的交換, 作為首都機(jī)場自動轉(zhuǎn)報(bào)樞紐的下級節(jié)點(diǎn), 通過民航ATM專網(wǎng)與首都機(jī)場轉(zhuǎn)報(bào)系統(tǒng)、民航總局轉(zhuǎn)報(bào)系統(tǒng)相連, 承載著北京區(qū)域管制中心所有的電報(bào)收發(fā)業(yè)務(wù), 為北京區(qū)管的管制員提供安全可靠的飛行電報(bào)信息。系統(tǒng)服務(wù)器及交換機(jī)均采用雙機(jī)熱備方式, 為每臺服務(wù)器配備獨(dú)立的oracle關(guān)系型數(shù)據(jù)庫, 達(dá)到雙機(jī)雙庫運(yùn)行模式。
一、相關(guān)內(nèi)容解釋
DMHS_MON:數(shù)據(jù)庫操作處理, 主要負(fù)責(zé)報(bào)文收發(fā)出入庫功能操作
DMHS_IP、%date%:存放于/dmhs/log目錄下的日志文件
OUT_QUEUE_%date%:輸出隊(duì)列報(bào)文表, 其中DEAL_FLAG字段, Y為正常發(fā)送、T為中間態(tài)、M為未發(fā)、D為刪除
二、故障現(xiàn)象
值班員發(fā)現(xiàn), 北京時間2017年12月21日早八點(diǎn), 即國際時零點(diǎn)左右, DMHS—H轉(zhuǎn)報(bào)系統(tǒng)的前臺管理終端會出現(xiàn)告警:“dmhs_mon從[00:00:00]進(jìn)程136秒工作可能不正常, 請檢查盤陣!”
三、問題分析
登錄自動轉(zhuǎn)報(bào)系統(tǒng)后臺管理終端, 查看DMHS_IP日志, 發(fā)現(xiàn)自19日起至21日共三天, 每日國際時00:02:16, 均出現(xiàn)“Chk_Mon_Wait_Long dmhs_mon從[00:00:00]起[136秒]工作可能不正常, 請檢查盤陣!”告警。
根據(jù)自動轉(zhuǎn)報(bào)系統(tǒng)的工作原理, 當(dāng)系統(tǒng)產(chǎn)生大量壓報(bào)且數(shù)量超過內(nèi)存的上限, 新的壓報(bào)會覆蓋最開始的壓報(bào), 而數(shù)據(jù)庫中的壓報(bào)數(shù)據(jù)一直是被標(biāo)記為‘M’的。當(dāng)內(nèi)存中的壓報(bào)被繞轉(zhuǎn)或被刪除之后, 以前被覆蓋的壓報(bào)就會一直存在于數(shù)據(jù)庫中, 且標(biāo)記始終為‘M’未發(fā)送, 這些報(bào)文就會在每天國際時00:00:00進(jìn)行移庫操作, 將數(shù)據(jù)庫中的昨日未發(fā)報(bào)文移動到當(dāng)天的發(fā)送報(bào)文表中。可以確定, 此次故障告警時間與數(shù)據(jù)庫移庫操作時間吻合, 登錄到數(shù)據(jù)庫, 統(tǒng)計(jì)當(dāng)天未發(fā)送的報(bào)文, 得到結(jié)果為74034條, 由此可以斷定, 12月18日自動轉(zhuǎn)報(bào)系統(tǒng)某信道產(chǎn)生了大量標(biāo)記為‘M’的被覆蓋的未發(fā)送報(bào)文, 這些報(bào)文每天在國際時00:00:00進(jìn)行移庫操作, 連續(xù)進(jìn)行了三天, 每次移庫花費(fèi)136秒, 使得DMHS_MON進(jìn)程響應(yīng)變慢, 從而前臺出現(xiàn)相應(yīng)的告警。
四、故障處置
根據(jù)以上分析, 修改輸出隊(duì)列報(bào)文表中積壓報(bào)文的狀態(tài), 由未發(fā)送改為正常發(fā)送, 同時要注意避免將12月21日新產(chǎn)生的未發(fā)報(bào)文同時被修改。
五、總結(jié)
5、1及時查看信道壓報(bào)情況
值班員應(yīng)做到每兩小時查看一次系統(tǒng)的壓報(bào)數(shù)量, 如果壓報(bào)過多應(yīng)及時處理, 可進(jìn)行壓報(bào)繞轉(zhuǎn)、報(bào)文drop等操作, 及時檢查線路以及終端問題。
5、1、1壓報(bào)繞轉(zhuǎn)操作
點(diǎn)擊主菜單“報(bào)務(wù)管理”的'“相關(guān)控制”單擊“壓報(bào)繞轉(zhuǎn)”, 在“源隊(duì)列”輸入有壓報(bào)的隊(duì)列, 在“目標(biāo)隊(duì)列”填入源隊(duì)列的備用隊(duì)列, 然后選擇繞轉(zhuǎn)電報(bào)等級, 最后點(diǎn)擊“確定”。
5、1、2 DROP報(bào)文操作
點(diǎn)擊主菜單“報(bào)務(wù)管理”的“相關(guān)控制”單擊“DROP/UNDROP電文”, 在“隊(duì)列名稱”內(nèi)填入要DROP的隊(duì)列, 等級及日期, 然后選擇“瀏覽報(bào)文”最后可以DROP全部, 也可以選擇性的DROP所選報(bào)文。
5、1、3UNDROP報(bào)文操作
點(diǎn)擊主菜單“報(bào)務(wù)管理”的“相關(guān)控制”單擊“DROP/UNDROP電文”, 在“隊(duì)列名稱”內(nèi)填入要UNDROP的隊(duì)列, 等級及日期, 然后選擇“瀏覽報(bào)文”, 然后點(diǎn)擊“全部UNDROP”恢復(fù)DROP掉的電文。
當(dāng)某一隊(duì)列轉(zhuǎn)報(bào)速度慢, 有很多積壓電報(bào), 就可以先DROP掉一些無關(guān)緊要的電報(bào), 讓后面新來的電報(bào)先走。DROP不是真正的刪除電文而等轉(zhuǎn)報(bào)機(jī)機(jī)正常后, 再把DROP的電報(bào)UNDROP恢復(fù)。
5、2設(shè)置壓報(bào)告警
對于重要的信道設(shè)置壓報(bào)告警, 點(diǎn)擊“系統(tǒng)配置”的“流量告警設(shè)置”, 在新建/修改頁面中, 填入需要配置告警的信道、告警的時間段、最大和最小報(bào)量以及報(bào)文統(tǒng)計(jì)周期 (以分鐘為單位) 。
這樣在告警時間段, 當(dāng)壓信道報(bào)超出設(shè)定最大或小于設(shè)定最小報(bào)量之后, 轉(zhuǎn)報(bào)系統(tǒng)會主動發(fā)出告警提示, 以便提醒值班員及時進(jìn)行處理, 從而避免出現(xiàn)大量壓報(bào)。
參考文獻(xiàn)
[1]徐斌, 鄭斌、自動轉(zhuǎn)報(bào)系統(tǒng)GPS故障案例分析[J]、當(dāng)代青年, 2015年第07期、
[2]李朝紅、DMHS—M轉(zhuǎn)報(bào)機(jī)幾則故障分析[J]、空中交通, 2015年第05期、
【自動轉(zhuǎn)報(bào)系統(tǒng)數(shù)據(jù)庫進(jìn)程異常的現(xiàn)象及處置過程的案例分析論文】相關(guān)文章:
分析幾起市電異常引起的設(shè)備故障現(xiàn)象及處置方法的案例論文12-03
關(guān)于環(huán)網(wǎng)運(yùn)行異常現(xiàn)象分析論文04-09
Windows XP中自動系統(tǒng)恢復(fù)方法分析論文07-09
論文汽輪機(jī)的異常原因分析06-26
商法案例分析論文02-24
《圓明園的毀滅》的案例分析論文11-04