python關(guān)聯(lián)規(guī)則挖掘 apriori算法python包
數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫(kù)中一種重要的可發(fā)現(xiàn)知識(shí)。如果兩個(gè)或多個(gè)變量的值之間存在某種規(guī)律性,則稱(chēng)為關(guān)聯(lián)。關(guān)聯(lián)可以分為簡(jiǎn)單關(guān)聯(lián)、時(shí)間關(guān)聯(lián)和因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫(kù)中隱藏的關(guān)聯(lián)網(wǎng)絡(luò)。有時(shí)數(shù)據(jù)庫(kù)中數(shù)據(jù)的關(guān)
數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫(kù)中一種重要的可發(fā)現(xiàn)知識(shí)。
如果兩個(gè)或多個(gè)變量的值之間存在某種規(guī)律性,則稱(chēng)為關(guān)聯(lián)。
關(guān)聯(lián)可以分為簡(jiǎn)單關(guān)聯(lián)、時(shí)間關(guān)聯(lián)和因果關(guān)聯(lián)。
關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫(kù)中隱藏的關(guān)聯(lián)網(wǎng)絡(luò)。
有時(shí)數(shù)據(jù)庫(kù)中數(shù)據(jù)的關(guān)聯(lián)函數(shù)是未知的,即使是已知的,也是不確定的,因此關(guān)聯(lián)分析生成的規(guī)則具有可信性。
關(guān)聯(lián)規(guī)則挖掘在大量數(shù)據(jù)中查找項(xiàng)集之間有趣的關(guān)聯(lián)或相關(guān)性。
1993年,Agrawal首次提出在客戶(hù)事務(wù)數(shù)據(jù)庫(kù)中挖掘項(xiàng)目集之間關(guān)聯(lián)規(guī)則的問(wèn)題。后來(lái),許多研究者對(duì)關(guān)聯(lián)規(guī)則的挖掘問(wèn)題做了大量的研究。
他們的工作包括對(duì)原有算法的優(yōu)化,如引入隨機(jī)抽樣、并行思想等,以提高算法挖掘規(guī)則的效率,促進(jìn)關(guān)聯(lián)規(guī)則的應(yīng)用。
關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘中的一個(gè)重要課題,近年來(lái)得到了廣泛的研究。