簡析基于大數(shù)據(jù)平臺的動態(tài)票額智能預分系統(tǒng)的研究與實現(xiàn)論文
從2011年起,鐵路在全路實行旅客列車票額智能預分,采用客流預測方法生成列車席位預分方案,達到了票額管理合理化、科學化、趟車效益增加,并且自預售之日起,保證始發(fā)長途票額分配合理,兼顧沿途需求,保障中間站的旅客發(fā)送,充分提高了中間站組織客流的積極性。為各鐵路局客運組織實現(xiàn)挖潛提效、精細化管理起到關鍵作用作用。隨著參與預分的列車不斷增多,動車組列車購票習慣的變化,現(xiàn)有的預分方法和實現(xiàn)機制也存在以下問題:
(1)鐵路列車近年來調圖頻繁,車次急劇增加,并且預售期延長,由調圖帶來的停站方案、開點變更、編組調整變化較大,導致預測計算量巨大,系統(tǒng)負載較重。
(2)以往的票額預分為預售期外一次預測并預分,預售期內調整完全依據(jù)人工調整,不容易及時發(fā)現(xiàn)問題,票額調整工作被動,且臨近開車期間銷售情況難以掌握。
因此,有必要針對參考期內席位售出情況和預售期內余票概貌等情況進行動態(tài)監(jiān)測,研究票額動態(tài)預分的方法,并對預測數(shù)據(jù)、調整依據(jù)的計算進行基礎架構改造,適應海量數(shù)據(jù)變化的需要。
1鐵路客票大數(shù)據(jù)平臺的研究與實現(xiàn)
隨著客運歷史數(shù)據(jù)的累積,以及全國鐵路客運規(guī)模的快速擴展,全國鐵路客票歷史數(shù)據(jù)規(guī)模越來越大,數(shù)據(jù)種類也越來越多,僅僅依靠關系型數(shù)據(jù)庫進行數(shù)據(jù)的管理和操作,已經(jīng)不能滿足需要。因此,以客運營銷數(shù)據(jù)為基礎,結合由客票生產(chǎn)系統(tǒng)產(chǎn)生的實時數(shù)據(jù),采用開源分布式數(shù)據(jù)庫構建大數(shù)據(jù)平臺,實現(xiàn)鐵路客票大數(shù)據(jù)平臺的研究具有重要意義。
1.1Hadoop分布式并行處理
Hadoop是近年來炙手可熱的開源分布式并行處理框架,用戶可忽略對底層并行實現(xiàn)的細節(jié)高效的構建出并行的分布式程序。Hadoop主要包括2個組件:(1)與GFS類似的分布式文件系統(tǒng),簡稱HDFS;(2)并行計算模型MapReduce,由JobTracker、TaskTracker等組件組成。
Hadoop的工作原理是將數(shù)據(jù)拆成片,并將每個“分片”分配到特定的集群節(jié)點上進行分析,每個數(shù)據(jù)分片都是在獨立的集群節(jié)點上進行單獨處理的,因此非常適合處理大數(shù)據(jù)量、非結構化數(shù)據(jù)。Hadoop集群的另一個特點是具有較好的可擴展性,隨著數(shù)據(jù)量的增加,集群的處理能力將會受到影響,可通過添加額外的集群節(jié)點有效地擴充集群以解決問題。Hadoop集群的并行處理能力可顯著提高計算效率,能達到實時或準實時數(shù)據(jù)處理的時效性。此外,Hadoop所需軟件為開源軟件,并能夠很好的支持商用硬件從而客運很好的控制成本,此外,Hadoop集群還具有故障容錯的優(yōu)點,當一個數(shù)據(jù)分片發(fā)送到某個節(jié)點進行計算時,該數(shù)據(jù)在集群其他節(jié)點上會保留副本,即使一個節(jié)點發(fā)生故障,該策略也能保證該節(jié)點數(shù)據(jù)的副本數(shù)據(jù)正常處理。
1.2鐵路客票大數(shù)據(jù)平臺數(shù)據(jù)源
鐵路客票大數(shù)據(jù)平臺主要來源于歷史數(shù)據(jù)和實時數(shù)據(jù)兩類。歷史數(shù)據(jù)包括互聯(lián)網(wǎng)訂票數(shù)據(jù)、運能數(shù)據(jù)以及售票、退票、廢票和改簽數(shù)據(jù)。客票系統(tǒng)實時數(shù)據(jù)包括實時余票數(shù)據(jù)、實時存量數(shù)據(jù)以及取票軌跡數(shù)據(jù)。其中,實時余票數(shù)據(jù)從互聯(lián)網(wǎng)售票的余票查詢集群獲得,實時存量數(shù)據(jù)和取票軌跡數(shù)據(jù)從鐵路局中心的客票系統(tǒng)獲得。
客票歷史數(shù)據(jù)和客票系統(tǒng)實時數(shù)據(jù)通過ETL服務,進入鐵路總公司營銷數(shù)據(jù)倉庫,通過數(shù)據(jù)建模組成數(shù)據(jù)集市提供報表、查詢應用等服務;同時上述數(shù)據(jù)也進入Hadoop平臺的HDFS,數(shù)據(jù)提供Hbase和Hive兩種訪問方式。
在票額預分應用服務層中,由客流預測應用服務器從Hbase中提取預測需要的樣本數(shù)據(jù),應用MapReduce實現(xiàn)客流預測算法,以實現(xiàn)客流預測結果。
客流預測結果通過鐵路總公司客票系統(tǒng)服務器實現(xiàn)往18個鐵路局(公司)分發(fā)。各鐵路局客票系統(tǒng)服務器上部署預測執(zhí)行子系統(tǒng),將預測結果與席位實時存量數(shù)據(jù)結合生成預分方案,對鐵路局中心席位庫進行預分操作。
2基于客票大數(shù)據(jù)平臺的票額預分系統(tǒng)
各鐵路局售票歷史數(shù)據(jù)通過傳輸軟件進入鐵路總公司營銷系統(tǒng),實時售票數(shù)據(jù)通過數(shù)據(jù)同步技術進入到鐵路總公司營銷系統(tǒng),另外,來自于互聯(lián)網(wǎng)售票查詢集群的余票相關數(shù)據(jù)也進入到營銷數(shù)據(jù)庫,多個渠道的數(shù)據(jù)形成所需分析的數(shù)據(jù)源,通過Hadoop平臺ETL裝置進入鐵路總公司營銷數(shù)據(jù)倉庫,在客流預測子系統(tǒng)中進行預測并且形成預測數(shù)據(jù)進入票額預分執(zhí)行子系統(tǒng),票額預分執(zhí)行子系統(tǒng)形成預分方案通過傳輸下發(fā)到各鐵路局形成預分方案,通過票額預分執(zhí)行子系統(tǒng)作用于席位庫,對生成的初始票額進行預分。在各鐵路局通過票額預分優(yōu)化子系統(tǒng)對預分效果進行實時反饋,形成優(yōu)化方案供鐵路局客運決策者進行調整,實現(xiàn)智能調整流程。
2.1客流預測子系統(tǒng)
客流預測子系統(tǒng)是該系統(tǒng)的核心系統(tǒng)。歷史數(shù)據(jù)是對未來計劃預測的重要依據(jù),有效數(shù)據(jù)量越大、越全面,得到的預測結果也會與實際更為接近。目前,文獻中最常見的客流預測方法是外推法,該方法有很多成熟的模型,如指數(shù)平滑、ARIMA模型、非線性回歸模型、神經(jīng)網(wǎng)絡模型等。Vlahogianni,GoliasandKarlaftis指出神經(jīng)網(wǎng)絡在短期交通預測領域是最有潛力的技術,并且一些文獻也歸納了神經(jīng)網(wǎng)絡的優(yōu)點,如分布自由、全局最優(yōu)逼近和容錯性等,還有一些學者基于神經(jīng)網(wǎng)絡使用定量的方法建立了鐵路客運量預測模型,因此,本系統(tǒng)采用神經(jīng)網(wǎng)絡構造預測模型。
2.2票額預分執(zhí)行子系統(tǒng)
票額預分執(zhí)行子系統(tǒng)的主要功能包括預分車次定義、預分天數(shù)定義、專家參數(shù)定義、預分方案審核、預分模板交路維護、預分方案查詢及修改、預分結果查詢等功能。其核心概念如下:
(1)預測數(shù)據(jù)。預測數(shù)據(jù)是通過Hadoop平臺的MapReduce并行預測算法計算得出的分車次數(shù)據(jù),其存在形式為始發(fā)站—終點站(OD)客流矩陣。
(2)預分方案。預分方案是基于預測數(shù)據(jù)生成的票額分配方案,是結合實際票額情況通過票額分配算法調整而生成的實際票額OD矩陣。
(3)預分模板。預分模板是歷史預分方案經(jīng)過專家經(jīng)驗確定的內置預分方案。鐵路局客票管理人員可自定義預分模板。預分模板可通過經(jīng)驗值人工指定,也可以通過“模板復制”功能獲取一段時間內的預分數(shù)據(jù)后,參考得出模板值。預分模板分為精確模板和模糊模板,精確模板與預分方案OD區(qū)間一致,設置了每個預分站票額的可售區(qū)間,模糊模板是對車站分組并按以遠站分塊分配票額。
(4)預分方式。由于淡旺季客流的不同,決定了預分方案的不同。一般來說按模板預分管理更加嚴謹,而按預測預分更貼近客流實際情況。針對各鐵路局淡旺季的'不同,操作員可通過此功能對預分方式進行定義。操作員可以在此查詢到本局所有車次的預分方式定義,并對相關車次的預分方式定義進行追加和刪除,并查看相對應的操作日志。
(5)預分車次分組定義。對一些具有相同管理需求的車次,操作員可以將這些車次分成一組進行統(tǒng)一定義,同一組內的車次可一并添加到預分方式定義中。此功能避免可避免客運管理人員對同一類車的重復定義。
預分結果記錄在預分結果表中,再回傳至票額預分優(yōu)化子系統(tǒng)。計劃預分的數(shù)據(jù)也可以來源于鐵路局客票生產(chǎn)庫中的預分模板和模板交路,這樣可以得到一個相對穩(wěn)定的預分方案。
2.3票額預分優(yōu)化子系統(tǒng)
2.3.1動態(tài)票額預分
由于客票系統(tǒng)預售期較長,傳統(tǒng)的票額預分方案是基于預售期外1次預測結果生成的,預售期之內不再重新預分,因此,無法適應預售期內偶然事件的影響。從2014年開始,票額預分系統(tǒng)引入了動態(tài)票額預分,可在預售期內進行周期性的動態(tài)客流預測及多次動態(tài)調整,如圖6所示。以2014年6月17日為例,這一天預測子系統(tǒng)將產(chǎn)生2014年7月10日始發(fā)列車的OD客流預測,同時調整2014年6月30日和2014年6月23日的始發(fā)終到預測數(shù)據(jù)(這兩日初始預測數(shù)據(jù)分別在2014年6月8日和2014年6月1日生成),在票額預分執(zhí)行子系統(tǒng)中將預分2014年7月6日始發(fā)列車的席位,并對2014年6月29日和2014年6月22日始發(fā)列車的票額進行重新預分。
票額動態(tài)預分是基于客流按周變化的規(guī)律較為顯著的特點進行的。在預售期為20天時,最多通過3次預分即可達到非常滿意效果,但在預售期延長至60天的時候,由于客流變化較大,且高鐵、城際列車在開車前一日和當天的預售情況變化非常顯著,僅靠預售期之外的動態(tài)調整也不能很好的滿足預測需求,結合余票快照分析技術實現(xiàn)敏捷票額調整。
2.3.2敏捷票額調整
余票快照分析模塊能記錄每個時刻余票歷史截面的可售能力。由余票快照分析模塊取得的余票情況可通過圖表觀察得知,圖表的橫坐標為觀察日(觀察點),縱坐標為對應的觀察點的余票快照數(shù)據(jù)。一條折線表示對應某一下車站的余票變化趨勢。余票波動圖用于顯示在車次、日期、席別、上車站確定的情況下,到各站的可售剩余票數(shù)隨時間的變化情況。在預售期內距離發(fā)車時間3天以外的取數(shù)時間間隔為1天,3天以內的時間間隔為1h。
2014年5月12日7:00始發(fā)的G101次列車各區(qū)間的余票消逝情況,默認為北京南—上海虹橋這一始發(fā)終到區(qū)間的余票,可得知該區(qū)間首次售完在2014年5月11日23:00。說明次日首列始發(fā)的京滬高鐵動車始發(fā)長途票在前一日晚間23:00全部售罄,由于首班高鐵旅客一般不會在開車前即買即走,而夜間高鐵旅客購票相對較少,相當于既能保證始發(fā)長途票在開車前有票可買,又能保證始發(fā)長途票及時賣完。因此該結果符合預分的初衷。若開車前始發(fā)長途票既未賣完,而沿途區(qū)間在開車前一直無票可售,則說明始發(fā)長途預留過多,因調配一些到沿途站銷售。
3結束語
實際應用中Hadoop集群使用了16臺HPDL380的服務器,操作系統(tǒng)是RedHat6.4,每臺服務器上安裝了JDK1.6和Intel的Hadoop穩(wěn)定版IDH2.3。16臺服務器中,1臺機器作為Master節(jié)點,剩余機器作為Slave節(jié)點?土黝A測子系統(tǒng)開發(fā)環(huán)境采用Eclipse,開發(fā)語言使用Java;票額預分執(zhí)行子系統(tǒng)前臺應用采用PowerBuilder開發(fā),與客票核心系統(tǒng)保持一致;預分優(yōu)化子系統(tǒng)采用.net開發(fā)。
通過對京滬、京廣等干線經(jīng)過一段時間的試用及跟蹤分析,可看出旅客發(fā)送量、客運收入都有5%以上的提升。尤其是在傳統(tǒng)的客運淡季,其增收的效果更為明顯。
在鐵路運輸企業(yè)改革推動下,鐵路客運業(yè)務快速發(fā)展,對新一代客票系統(tǒng)對票額管理精細化和智能化以及提高鐵路運輸企業(yè)效益等方面提出了更高的要求,基于大數(shù)據(jù)平臺構建了動態(tài)票額智能預分系統(tǒng),形成了“預測、預分、監(jiān)控、調整、再預測”的閉環(huán)流程。進一步提高了票額預分系統(tǒng)的可用性和有效性,為鐵路實施收益管理提供理論依據(jù)和技術儲備。
【簡析基于大數(shù)據(jù)平臺的動態(tài)票額智能預分系統(tǒng)的研究與實現(xiàn)論文】相關文章:
簡議鐵路旅客列車票額智能預分研究論文11-01
簡析基于web 的虛擬實驗平臺的設計論文11-17
基于數(shù)據(jù)抽取與訂閱實現(xiàn)數(shù)據(jù)共享分析及研究論文10-30
基于GIS的農業(yè)動態(tài)信息共享網(wǎng)絡平臺研究論文11-07
論文:短信平臺系統(tǒng)的設計與實現(xiàn)06-24
基于Hadoop平臺的課程云系統(tǒng)開發(fā)研究論文10-30