中文字幕高清在线,中文字幕在线电影观看,中文字幕在线看,免费国产一区二区三区,男攻调教双性男总裁,热热涩热热狠狠色香蕉综合,亚洲精品网站在线观看不卡无广告

基于屬性重要度約簡算法在數(shù)據(jù)挖掘中的應(yīng)用研究論文

時間:2021-04-14 17:30:43 論文 我要投稿

基于屬性重要度約簡算法在數(shù)據(jù)挖掘中的應(yīng)用研究論文

  摘 要:屬性約簡是粗糙集理論研究的核心內(nèi)容之一,本文通過對屬性重要度的計算,以核為基礎(chǔ)計算條件屬性集中除核以外其他屬性的重要性來確定最小的約簡,最后通過實例分析驗證了算法的有效性與可行性。

基于屬性重要度約簡算法在數(shù)據(jù)挖掘中的應(yīng)用研究論文

  關(guān)鍵詞:數(shù)據(jù)挖掘 屬性約簡 重要度

  數(shù)據(jù)挖掘是從海量的且不斷動態(tài)變化的數(shù)據(jù)中,借助有效的方法挖掘出潛在、有價值的知識過程。而粗糙集理論它是一種刻畫不完整性和不確定性的數(shù)學工具,能在保持分類能力不變的前提下,通過知識約簡從中發(fā)現(xiàn)隱含的知識,揭示潛在的規(guī)律,是由波蘭科學家Pawlak在1982年提出的。而屬性約簡是粗糙集理論研究的核心內(nèi)容之一,它能保證在分類能力不變的情況下,消除重復(fù)、冗余的屬性和屬性值,減少數(shù)據(jù)挖掘要處理的信息量,提高數(shù)據(jù)挖掘的效率。本文提出了通過計算單個屬性的重要性,以重要性大于零的屬性為核,來選取其它屬性加入核中形成新的集合RED,直至剩下的所有屬性的重要性為零,得到的集合REDn即為屬性約簡。

  1 粗糙集的基本理論[1-2]

  定義1設(shè) 是一個信息系統(tǒng),其中 是對象的非空有限集合,即 ; 是屬性的非空有限集合; , 是屬性 的值域; 是一個信息函數(shù),即每個對象在每個屬性上對應(yīng)的`信息值。若 ,其中 為非空有限條件屬性集合, 為非空有限決策屬性集合,且 ,則稱信息系統(tǒng)為決策表。

  定義2對決策表 , , ,考慮單決策屬性的情況,即 ,則的分辨矩陣是一個 矩陣,其中的元素定義如下:

  定義3對分辨矩陣中每個 ,用布爾函數(shù) 來表示,若 ,則決策表的分辨函數(shù) 可定義為: 。

  2 基于粗糙集的數(shù)據(jù)挖掘的屬性約簡算法[3-4]

  2.1 算法分析

  第一步:求核。通過求條件屬性C中的每個屬性a對在整個條件屬性集C的重要性SigC(x)來確定屬性核CORE(x),重要性SigC(x)>0的屬性為核屬性。

  第二步:通過向?qū)傩院薈ORE(x)中依次加入重要性大的屬性來確定屬性集x的最小約簡,詳細步驟如下:(1)把a加入到屬性集R 中,計算重要性,選擇重要性最大的屬性;(2)如果兩個屬性有相同的重要性,取離散值小的屬性。

  2.2 算法復(fù)雜度

  通過算法的分析,在對決策表進行劃分的時間復(fù)雜度為O(n2)。而計算條件屬性的重要性也是滿足劃分的線性關(guān)系,因此所求屬性核的時間復(fù)雜度為O(n2),依次添加次重要度的屬性也沒有增加額外的開銷,因此整個時間復(fù)雜度還是O(n2)。

  2.3 實例及分析

  為了進一步驗證算法的可行性,下面以表1中的決策表為例進行分析說明,其中對象集 ,條件屬性集 ,決策屬性 。

  以上對計算出的實驗數(shù)據(jù)的重要性進行統(tǒng)計得出信息系統(tǒng)的兩個約簡為{c1,c4}和{c2,c4}。

  3 結(jié)語

  本文針對屬性約簡算法中的屬性重要度的計算來確定核,適合對海量數(shù)據(jù)的挖掘,不僅節(jié)省了存儲空間,而且在時間復(fù)雜度開銷少,通過實驗分析驗證了算法的可行性與有效性,為決策表的屬性約簡提供了一條高效的途徑。

  參考文獻:

  [1]張文修,吳偉志.粗糙集理論與方法[M].北京:科學出版社,2001:18-19

  [2]周獻中,黃兵,李華雄,等.不完備信息系統(tǒng)知識獲取的粗糙集理論與方法[M].南京:南京大學出版社,2010:10-11

  [3]饒泓,夏葉娟,李娒竹.基于分辨矩陣和屬性重要度的規(guī)則提取算法[J].計算機工程與應(yīng)用,2008,44(3):163-165

  [4]黃國順,劉云生.一種改進的決策表屬性重要性及其快速約簡算法[J].計算機工程與應(yīng)用,2007,43(28):173-176

【基于屬性重要度約簡算法在數(shù)據(jù)挖掘中的應(yīng)用研究論文】相關(guān)文章:

基于數(shù)據(jù)挖掘的高校教務(wù)系統(tǒng)設(shè)計論文11-15

數(shù)據(jù)挖掘在CRM中的應(yīng)用論文04-10

數(shù)據(jù)挖掘論文03-31

基于知識網(wǎng)格的分布式數(shù)據(jù)挖掘論文04-25

數(shù)據(jù)挖掘在培訓(xùn)管理中的應(yīng)用論文12-19

專利數(shù)據(jù)挖掘的論文06-26

論文:大數(shù)據(jù)在高校中的應(yīng)用研究07-02

高校管理中數(shù)據(jù)挖掘技術(shù)的研究論文01-15

科研管理中數(shù)據(jù)挖掘技術(shù)的應(yīng)用論文10-21