什么是數(shù)據(jù)敏感度?
網(wǎng)友解答: 鄙人拙見,往大了說叫天賦,對(duì)數(shù)據(jù)的變化和數(shù)據(jù)本身有興趣,有好奇心。好的扯遠(yuǎn)了。數(shù)據(jù)的敏感度,我認(rèn)為是對(duì)于目標(biāo)函數(shù)而言,需要的是能發(fā)現(xiàn)哪些特征能最優(yōu)目標(biāo)函數(shù),盡管可以通過實(shí)驗(yàn)得
鄙人拙見,往大了說叫天賦,對(duì)數(shù)據(jù)的變化和數(shù)據(jù)本身有興趣,有好奇心。好的扯遠(yuǎn)了。
數(shù)據(jù)的敏感度,我認(rèn)為是對(duì)于目標(biāo)函數(shù)而言,需要的是能發(fā)現(xiàn)哪些特征能最優(yōu)目標(biāo)函數(shù),盡管可以通過實(shí)驗(yàn)得到答案,但是對(duì)于企業(yè)來(lái)講,更期望效率越高越好。例如,有A,B兩個(gè)特征,明明A起到?jīng)Q定性作用,但是如果選擇B做主要特征,會(huì)導(dǎo)目標(biāo)函數(shù)并沒有最優(yōu)化,也就是說敏感度不高。這只是簡(jiǎn)化的例子。
很多實(shí)際的數(shù)據(jù)并沒有明顯的特征,需要手動(dòng)選擇。近年來(lái)深度學(xué)習(xí)為什么這么火,就是做了一件事情,人工選擇特征變成了機(jī)器,當(dāng)然主要是因?yàn)楝F(xiàn)在的機(jī)器跟得上節(jié)奏。
但是深度學(xué)習(xí)并不是萬(wàn)能的,依然很多問題需要工程師來(lái)解決這些難題,如果對(duì)這方面沒夠熱情和執(zhí)著,在調(diào)試一些模型的時(shí)候總是得不到滿意的結(jié)果,甚至比不調(diào)還要差,這時(shí)候該怎么辦。
這些東西需要鉆研和經(jīng)驗(yàn),但前提是你真的熱愛而不是看就業(yè)形勢(shì),否則很難走下去的。
我也不知道是不是扯遠(yuǎn)了,簡(jiǎn)單點(diǎn),想象一下,通過分析地鐵的進(jìn)出站記錄,能知道高峰期,能知道更多表面上沒有的信息,你會(huì)興奮嗎?不會(huì)的話,就是沒感覺?;蛘哒f數(shù)據(jù)能帶來(lái)不可思議的結(jié)果,你期待不期待。我是覺得如果一個(gè)人對(duì)數(shù)據(jù)不熱愛,那他肯定不適合,也就是不敏感。我好像說了對(duì)廢話。。。
網(wǎng)友解答:數(shù)據(jù)敏感度,說白了就是記憶力+獨(dú)到視角,很多人可能覺得不可思議,但作為一個(gè)數(shù)據(jù)從業(yè)者,我深感記憶力的重要程度,可以說記憶力是數(shù)據(jù)分析師的硬件,視角是分析師的天分。
什么情況下需要敏感?舉例,今天APP開了個(gè)活動(dòng),當(dāng)你看到眼前的今天活躍數(shù)據(jù),你能否想起來(lái)昨天的值?上月均值?今年的平均值?你能否想起來(lái)歷次活動(dòng)促活效果?你的腦海里有沒有趨勢(shì)線,有沒有橫截面數(shù)據(jù)?競(jìng)品的活動(dòng)效果你了解多少?這些不止要看,要學(xué),更要記住,這是一個(gè)數(shù)據(jù)分析師的專業(yè)素養(yǎng),當(dāng)你告訴別人一個(gè)數(shù)據(jù),你必然清楚數(shù)據(jù)來(lái)源與口徑,當(dāng)別人問你一個(gè)重點(diǎn)數(shù)據(jù),你要張口說出準(zhǔn)確的數(shù)字,如果做不到,大概多少不能搞錯(cuò),數(shù)量級(jí)你至少應(yīng)該知道。
記住,記憶力有用,特別有用,除此以外,就是獨(dú)到的視角了。同樣的數(shù)據(jù)源,分析的結(jié)果未必相同,給出的建議未必一樣,原因就是構(gòu)建的分析指標(biāo)不同。為什么構(gòu)建的不同呢,對(duì)業(yè)務(wù)的理解不同,這個(gè)指標(biāo)是看增長(zhǎng)的絕對(duì)量還是相對(duì)量,怎么構(gòu)建公平的評(píng)價(jià)指標(biāo),怎么識(shí)別欺詐行為,甚至于構(gòu)建模型特征,這里面都有太多分析師的主觀判斷,你的視角將決定你的報(bào)告,所以,培養(yǎng)你的知識(shí)體系,構(gòu)建屬于你的分析框架,非常重要。
這就是分析師的慧根吧