我國(guó)的數(shù)據(jù)挖掘技術(shù)現(xiàn)狀分析論文
摘要:數(shù)據(jù)挖掘?qū)W科的出現(xiàn), 是對(duì)計(jì)算機(jī)領(lǐng)域的補(bǔ)充, 在計(jì)算機(jī)領(lǐng)域的發(fā)展下發(fā)展迅速, 引起了國(guó)內(nèi)的重視, 并在國(guó)家的大力促進(jìn)下不斷發(fā)展, 取得了階段性的成就, 但是發(fā)展現(xiàn)狀仍然不容樂觀, 本篇文章將針對(duì)數(shù)據(jù)挖掘的定義以及國(guó)內(nèi)的現(xiàn)狀進(jìn)行分析, 并對(duì)其發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè), 目的在于加快我國(guó)的數(shù)據(jù)挖掘技術(shù)研究進(jìn)程。
關(guān)鍵詞:數(shù)據(jù)挖掘; 中國(guó); 現(xiàn)狀; 發(fā)展;
0 引言
隨著計(jì)算機(jī)的發(fā)展與數(shù)據(jù)量的增加, 其對(duì)于數(shù)據(jù)的處理技術(shù)如生成、收集、儲(chǔ)存數(shù)據(jù)等的水平要求越來越高, 因此新型的數(shù)據(jù)挖掘技術(shù)的出現(xiàn)是必然趨勢(shì), 替代了傳統(tǒng)落后的數(shù)據(jù)處理技術(shù)。我國(guó)對(duì)于數(shù)據(jù)挖掘技術(shù)的研究已經(jīng)取得矚目的效果, 但是應(yīng)用程度不高, 提高數(shù)據(jù)挖掘技術(shù)的實(shí)際應(yīng)用成為了主要的問題, 需要采取必要措施加快數(shù)據(jù)挖掘技術(shù)應(yīng)用進(jìn)程。
1 數(shù)據(jù)挖掘的定義
數(shù)據(jù)挖掘 (DM) 是一個(gè)新興的學(xué)科, 學(xué)名叫做數(shù)據(jù)庫(kù)中發(fā)現(xiàn)知識(shí) (KDD) , 其出現(xiàn)在20世紀(jì)90年代, 并在這三十年間發(fā)展迅速, 它的主要工作領(lǐng)域?yàn)閿?shù)據(jù)庫(kù)系統(tǒng)以及數(shù)據(jù)庫(kù)應(yīng)用領(lǐng)域, 其作用在于能夠從應(yīng)用數(shù)據(jù)中提取隱藏的關(guān)鍵信息與知識(shí), 應(yīng)用數(shù)據(jù)的范圍廣泛, 不管是不完整的數(shù)據(jù), 還是受干擾的數(shù)據(jù), 數(shù)據(jù)挖掘技術(shù)都能夠通過對(duì)其數(shù)據(jù)的轉(zhuǎn)換分析或者模塊化處理進(jìn)行識(shí)別與篩選, 并提取和處理其中的有用信息。數(shù)據(jù)挖掘的目的在于通過對(duì)數(shù)據(jù)中信息的處理, 篩選關(guān)鍵數(shù)據(jù), 發(fā)現(xiàn)被忽略的數(shù)據(jù), 從而尋找數(shù)據(jù)中的規(guī)律, 為決策者提供合理科學(xué)的數(shù)據(jù)分析報(bào)告, 幫助其作出最優(yōu)化的決策。
數(shù)據(jù)挖掘技術(shù)學(xué)科的本質(zhì)在于加深對(duì)數(shù)據(jù)的使用層次, 挖掘數(shù)據(jù)的內(nèi)在含義并進(jìn)行抽象化的概括, 改變了以往數(shù)據(jù)只能簡(jiǎn)單查詢的低級(jí)層次。數(shù)據(jù)挖掘具有先知性、實(shí)用性以及科學(xué)性的特點(diǎn), 同時(shí)數(shù)據(jù)挖掘的發(fā)展依賴于數(shù)據(jù)庫(kù)、人工智能統(tǒng)計(jì)學(xué)等計(jì)算機(jī)學(xué)科的快速發(fā)展, 因此吸引了一大批專業(yè)人才加入到其的研發(fā)過程中, 加快了其的研究發(fā)展進(jìn)程。
2 數(shù)據(jù)挖掘在中國(guó)的現(xiàn)狀分析
2.1 研究現(xiàn)狀分析
我國(guó)開展數(shù)據(jù)挖掘技術(shù)的研究在1993年, 中科院合肥分院成為首個(gè)被自然科學(xué)基金支持進(jìn)行數(shù)據(jù)挖掘技術(shù)研究, 從此以后, 我國(guó)掀開了研究數(shù)據(jù)挖掘研究的序幕, 主要研究機(jī)構(gòu)與人員主要是相關(guān)專業(yè)的大學(xué)教授以及一些數(shù)據(jù)處理研究機(jī)構(gòu)。近年來, 我國(guó)對(duì)數(shù)據(jù)挖掘的研究工作高度重視, 通過中國(guó)自然科學(xué)基金等對(duì)其進(jìn)行資金支持, 同時(shí), 政府創(chuàng)立“九五”計(jì)劃以及“863”計(jì)劃對(duì)其提供政策支持。
數(shù)據(jù)挖掘的研究引起了我國(guó)相關(guān)專業(yè)的人才的廣泛關(guān)注, 并在全國(guó)范圍內(nèi)掀起了研究數(shù)據(jù)挖掘知識(shí)技術(shù)的'理論與實(shí)際應(yīng)用的熱潮, 其中包括高等學(xué)府與科研機(jī)構(gòu)。例如:對(duì)于數(shù)據(jù)挖掘技術(shù)的算法計(jì)算與改造研究是復(fù)旦大學(xué)與華中理工大學(xué)等高校的研究方向, 非結(jié)構(gòu)化數(shù)據(jù)知識(shí)的網(wǎng)頁(yè)數(shù)據(jù)挖掘技術(shù)是南京大學(xué)的主要研究方向, 而科研機(jī)構(gòu)如北京系統(tǒng)工程研究院來說, 其主要研究方向是數(shù)據(jù)挖掘技術(shù)在模糊信息中的實(shí)際應(yīng)用。
2.2 應(yīng)用現(xiàn)狀分析
在我國(guó), 能夠真正應(yīng)用數(shù)據(jù)挖掘技術(shù)并取得成就的公司包括是廣州華工明天科技有限公司以及菲奈特-融通企業(yè), 其中廣州華工明天科技有限公司主要進(jìn)行多功能數(shù)據(jù)挖掘設(shè)備的研發(fā), 而菲奈特-融通企業(yè)依賴于數(shù)據(jù)挖掘軟件的發(fā)展進(jìn)行其商業(yè)智能套件的研發(fā)。
2.3 研究成果分析
近年來, 由于國(guó)家的大力扶植與資金支持, 我國(guó)數(shù)據(jù)挖掘技術(shù)研究取得了重要性的成果, 在亞太數(shù)據(jù)挖掘的國(guó)際會(huì)議中, 由南京大學(xué)周志華帶隊(duì)的數(shù)據(jù)挖掘技術(shù)研究小組表現(xiàn)突出, 同時(shí)參與數(shù)據(jù)挖掘編程大賽并奪得桂冠;同樣在了亞太數(shù)據(jù)挖掘國(guó)際會(huì)議上, 中國(guó)香港大學(xué)的電子商業(yè)科技研究院的黃哲學(xué)教授的論文獲得亞太數(shù)據(jù)挖掘國(guó)際會(huì)議論文大獎(jiǎng)。
2.4 國(guó)內(nèi)外對(duì)比
國(guó)內(nèi)外的數(shù)據(jù)挖掘技術(shù)研究的進(jìn)程具有很大的差距, 不僅表現(xiàn)在相關(guān)理論的研究上, 更在于對(duì)數(shù)據(jù)挖掘技術(shù)的實(shí)際應(yīng)用的方面。與國(guó)外的數(shù)據(jù)挖掘技術(shù)研究進(jìn)程相比, 我國(guó)的研究起步晚, 仍然處于發(fā)展的初級(jí)階段, 并且還沒有成熟的理論與技術(shù)應(yīng)用成果, 目前的主要研究方向是對(duì)于數(shù)據(jù)的初級(jí)處理如模糊化處理, 技術(shù)尚不成熟。
國(guó)外關(guān)于數(shù)據(jù)挖掘技術(shù)的軟件研發(fā)發(fā)展已經(jīng)取得矚目的成就, 而國(guó)內(nèi)的軟件研發(fā)尚不成熟, 研究的重心在于高等學(xué)府的人才, 同時(shí)都是屬于政府資助項(xiàng)目, 可能導(dǎo)致其成果要求較低, 從而阻塞了研發(fā)的步伐。
3 數(shù)據(jù)挖掘在我國(guó)的未來發(fā)展
3.1 研究方向展望
近年來, 隨著計(jì)算機(jī)科學(xué)領(lǐng)域的快速發(fā)展, 數(shù)據(jù)挖掘技術(shù)作為一種新興的學(xué)科, 其研究熱度正在逐漸升溫, 研究的水平也在逐步提高, 同時(shí)由于政府的政策支持與資金支持, 越來越多的數(shù)據(jù)專業(yè)研究者被吸引加入其中。在數(shù)據(jù)挖掘技術(shù)未來的研究過程中, 其主要方向應(yīng)包括以下幾點(diǎn):
(1) 參照于SQL語(yǔ)言的標(biāo)準(zhǔn)化的研究成果, 對(duì)數(shù)據(jù)挖掘技術(shù)進(jìn)行形式化的描述, 即發(fā)現(xiàn)數(shù)據(jù)語(yǔ)言。 (2) 為實(shí)現(xiàn)關(guān)于數(shù)據(jù)額挖掘技術(shù)人機(jī)交互工作的順利開展, 應(yīng)滿足用戶對(duì)知識(shí)發(fā)現(xiàn)過程的可視化進(jìn)程。 (3) 研究在計(jì)算機(jī)領(lǐng)域的數(shù)據(jù)挖掘技術(shù)的發(fā)展, 可以通過數(shù)據(jù)挖掘服務(wù)器的有效配合的方式實(shí)現(xiàn)。
3.2 面臨的問題
(1) 挖掘方法與人機(jī)交互問題。我國(guó)數(shù)據(jù)挖掘技術(shù)的發(fā)展受限制于挖掘方法, 不管是知識(shí)類型的限制, 還是維度上的限制, 都是影響其發(fā)展的重要因素。 (2) 性能問題。能夠有效的解決數(shù)據(jù)挖掘技術(shù)算法中的問題是解決其性能問題的關(guān)鍵, 應(yīng)對(duì)其有效性、可伸縮性等問題進(jìn)行研究, 保證其算法能夠滿足用戶的性能要求。 (3) 數(shù)據(jù)類型多樣性問題。對(duì)于算法復(fù)雜的, 多維度的數(shù)據(jù)類型, 現(xiàn)有的研究水平很難去解決此類問題, 同時(shí)對(duì)于多跨度的全球化信息技術(shù)的挖掘水平仍然落后。
4 結(jié)束語(yǔ)
數(shù)據(jù)挖掘技術(shù)作為新興的數(shù)據(jù)應(yīng)用工具, 能夠有效的加強(qiáng)對(duì)數(shù)據(jù)的處理程度, 但是由于我國(guó)研發(fā)起步晚, 導(dǎo)致我國(guó)的發(fā)展水平落后與國(guó)外水平。近年來, 國(guó)家對(duì)數(shù)據(jù)挖掘技術(shù)的政策與資金支持, 掀起了研究的熱潮。我國(guó)應(yīng)重視數(shù)據(jù)挖掘算法研究以及其實(shí)際應(yīng)用, 不斷地發(fā)展數(shù)據(jù)挖掘技術(shù)的研究。
參考文獻(xiàn)
[1]謝邦昌, 李揚(yáng).數(shù)據(jù)挖掘與商業(yè)智能的現(xiàn)況及未來發(fā)展[J].統(tǒng)計(jì)與信息論壇, 2015 (05) :94-96.
[2]李菁菁, 邵培基, 黃亦瀟.數(shù)據(jù)挖掘在中國(guó)的現(xiàn)狀和發(fā)展研究[J].管理工程學(xué)報(bào), 2016 (03) :10-15.
【我國(guó)的數(shù)據(jù)挖掘技術(shù)現(xiàn)狀分析論文】相關(guān)文章:
分析在課程教學(xué)中數(shù)據(jù)挖掘技術(shù)的選擇論文10-15
大數(shù)據(jù)自動(dòng)分析與數(shù)據(jù)挖掘探討的論文11-28
數(shù)據(jù)挖掘技術(shù)在WEB的運(yùn)用論文11-28
數(shù)據(jù)挖掘論文03-31
我國(guó)預(yù)算績(jī)效管理現(xiàn)狀分析論文12-01
我國(guó)個(gè)人信貸消費(fèi)的現(xiàn)狀分析論文04-06
專利數(shù)據(jù)挖掘的論文06-26