混淆矩陣計(jì)算舉例 各行各業(yè)的數(shù)據(jù)挖掘與數(shù)據(jù)分析技術(shù)是否相通?
各行各業(yè)的數(shù)據(jù)挖掘與數(shù)據(jù)分析技術(shù)是否相通?人們有時(shí)會(huì)混淆大數(shù)據(jù)分析技術(shù)與數(shù)據(jù)挖掘的關(guān)系,把數(shù)據(jù)挖掘的一些結(jié)果直接視為大數(shù)據(jù)的結(jié)果。雖然大數(shù)據(jù)分析的結(jié)果確實(shí)與數(shù)據(jù)挖掘一樣,但它們需要算法的驅(qū)動(dòng)。但兩者之
各行各業(yè)的數(shù)據(jù)挖掘與數(shù)據(jù)分析技術(shù)是否相通?
人們有時(shí)會(huì)混淆大數(shù)據(jù)分析技術(shù)與數(shù)據(jù)挖掘的關(guān)系,把數(shù)據(jù)挖掘的一些結(jié)果直接視為大數(shù)據(jù)的結(jié)果。雖然大數(shù)據(jù)分析的結(jié)果確實(shí)與數(shù)據(jù)挖掘一樣,但它們需要算法的驅(qū)動(dòng)。但兩者之間也有明顯區(qū)別。具體如下圖所示。
從概念上講,大數(shù)據(jù)分析是數(shù)據(jù)挖掘的一個(gè)子集。在一般的概念上,它們之間是有區(qū)別的,但嚴(yán)格來(lái)說(shuō),大數(shù)據(jù)的所有結(jié)果都可以歸入數(shù)據(jù)挖掘結(jié)果的范疇。
有時(shí),人們把數(shù)據(jù)挖掘等同于大數(shù)據(jù)分析,把大數(shù)據(jù)的一些理想情況,如高效、高速等,轉(zhuǎn)移到數(shù)據(jù)挖掘的實(shí)踐中,造成一些認(rèn)知錯(cuò)誤。
目前,與大數(shù)據(jù)相關(guān)的問(wèn)題更多是工程化的,主要集中在存儲(chǔ)和計(jì)算能力兩個(gè)方面;而數(shù)據(jù)挖掘的很多問(wèn)題還處于探索階段,還不成熟,準(zhǔn)確性無(wú)法保證。因此,大數(shù)據(jù)方法不能直接解決數(shù)據(jù)挖掘的問(wèn)題。并不是所有的學(xué)術(shù)問(wèn)題都能用大量的數(shù)據(jù)來(lái)解決。
大數(shù)據(jù)技術(shù)主要是提供存儲(chǔ)和計(jì)算能力,其次是對(duì)數(shù)據(jù)隱含意義的洞察。前者依賴(lài)于硬件設(shè)備的升級(jí),后者依賴(lài)于數(shù)據(jù)挖掘算法的不斷優(yōu)化和創(chuàng)新。