神經(jīng)網(wǎng)絡(luò)過擬合什么意思 可以通過直接減少hidden layer、hidden unit而不是加正則化來解決神經(jīng)網(wǎng)絡(luò)過擬合嗎?
可以通過直接減少hidden layer、hidden unit而不是加正則化來解決神經(jīng)網(wǎng)絡(luò)過擬合嗎?簡單的答案是肯定的。復(fù)雜的答案是不確定的(見下文)。這個概念。(圖片作者:chabacano,許可
可以通過直接減少hidden layer、hidden unit而不是加正則化來解決神經(jīng)網(wǎng)絡(luò)過擬合嗎?
簡單的答案是肯定的。復(fù)雜的答案是不確定的(見下文)。
這個概念。
(圖片作者:chabacano,許可證:CC by sa 4.0)
從圖像中可以明顯看出,過度擬合的曲線過于曲折(復(fù)雜),對現(xiàn)有數(shù)據(jù)擬合得非常好,但它不能很好地描述數(shù)據(jù)的規(guī)律,因此面對新數(shù)據(jù),我們不得不停下來。
從上面我們得到一個直覺,過度擬合的模型往往比正確的模型更復(fù)雜。
。您所說的“直接減少隱藏層和隱藏單元的數(shù)量”使網(wǎng)絡(luò)更薄、更窄正是簡化模型的方法。這個想法沒有問題。
但是,我們可能必須嘗試找出它是否有效。因為,一般來說,更復(fù)雜的網(wǎng)絡(luò)可能更有表現(xiàn)力。
一般來說,神經(jīng)網(wǎng)絡(luò)仍然是一個黑匣子。有時,正則化的效果更好,有時則不然。一些問題可能是復(fù)雜的網(wǎng)絡(luò)工作得很好,另一些問題可能是深度和狹窄的網(wǎng)絡(luò)工作得很好,另一些問題可能是薄而寬的網(wǎng)絡(luò)工作得很好,或者一些問題可能是簡單的網(wǎng)絡(luò)工作得很好。
具體來說,為了解決過擬合問題,除了簡化模型(即您稱之為“直接減少隱藏層、隱藏層、隱藏層”)外,還存在漏項(在某種意義上,我們可以看到模型的某些部分由于簡化模型的繞道而無法工作),以及人為增加稀疏性限制(稀疏性和簡化之間存在模糊關(guān)系)或盡快停止訓(xùn)練。
請教大牛神經(jīng)網(wǎng)絡(luò)的過擬合問題?
你的問題很模糊。你想知道神經(jīng)網(wǎng)絡(luò)的過擬合是什么樣的嗎?為什么會有過擬合。對于第一個問題,神經(jīng)網(wǎng)絡(luò)的過擬合類似于支持向量機、高斯混合模型等建模方法的過擬合,說明訓(xùn)練數(shù)據(jù)集的建模效果很好,而測試數(shù)據(jù)集的建模效果很差,由于強學(xué)習能力是預(yù)測模型中的噪聲會湮滅有用信息,導(dǎo)致泛化能力差。對于第二個問題,產(chǎn)生上述現(xiàn)象的主要原因是隱層節(jié)點過多(隱層節(jié)點越多,學(xué)習能力越強),這使得預(yù)測模型在訓(xùn)練過程中挖掘訓(xùn)練數(shù)據(jù)集中的噪聲,即噪聲會湮滅有用信息。因此,在使用神經(jīng)網(wǎng)絡(luò)建模時,必須處理模型過擬合的問題。一方面,我們可以增加樣本數(shù)據(jù)集,另一方面,我們可以使用交叉驗證來選擇適當數(shù)量的隱層節(jié)點,在精度和泛化能力之間做出權(quán)衡。最常用的方法是加入正則化項,在一定程度上可以防止模型過擬合的問題。(機器學(xué)習算法和python學(xué)習)
深度神經(jīng)網(wǎng)絡(luò)是否夸張地過擬合了?
這可不一樣。
1. 過度裝配可分為許多情況。一是現(xiàn)在的情況太多了。這種神經(jīng)網(wǎng)絡(luò)能對許多情況給出正確的答案。即使它是過度安裝,你也無法證明它。此外,即使它能工作和排氣,也沒有壞處。
2. 是否過擬合與我們的神經(jīng)網(wǎng)絡(luò)模型和訓(xùn)練集有關(guān)。當二者的組合過擬合時,它在訓(xùn)練集上運行良好,在驗證集上也會出現(xiàn)問題?,F(xiàn)在有一些方法可以對訓(xùn)練集的數(shù)據(jù)進行預(yù)處理、多次輸入和多次訓(xùn)練。
3. 目前,過度擬合的問題是不可避免的。培訓(xùn)本身就是一種適應(yīng)過程。如果未來在數(shù)學(xué)原理或應(yīng)用這方面有質(zhì)的突破,可能有解決的機會。
既然使用神經(jīng)網(wǎng)絡(luò)也可以解決分類問題,那SVM、決策樹這些算法還有什么意義呢?
這取決于數(shù)據(jù)量和樣本數(shù)。不同的樣本數(shù)和特征數(shù)據(jù)適合不同的算法。像神經(jīng)網(wǎng)絡(luò)這樣的深度學(xué)習算法需要訓(xùn)練大量的數(shù)據(jù)集來建立更好的預(yù)測模型。許多大型互聯(lián)網(wǎng)公司更喜歡深度學(xué)習算法,因為他們獲得的用戶數(shù)據(jù)是數(shù)以億計的海量數(shù)據(jù),這更適合于卷積神經(jīng)網(wǎng)絡(luò)等深度學(xué)習算法。
如果樣本數(shù)量較少,則更適合使用SVM、決策樹和其他機器學(xué)習算法。如果你有一個大的數(shù)據(jù)集,你可以考慮使用卷積神經(jīng)網(wǎng)絡(luò)和其他深度學(xué)習算法。
以下是一個圖表,用于說明根據(jù)樣本數(shù)量和數(shù)據(jù)集大小選擇的任何機器學(xué)習算法。
如果你認為它對你有幫助,你可以多表揚,也可以關(guān)注它。謝謝您
神經(jīng)網(wǎng)絡(luò)能不能完全擬合簡單函數(shù)呢?
答案是,理論上,這取決于運氣。
在很大的概率中,訓(xùn)練的結(jié)果是達到局部最優(yōu)。如果你幸運的話,就有可能達到全局最優(yōu)。因此,在實際應(yīng)用中,神經(jīng)網(wǎng)絡(luò)完全擬合函數(shù)存在誤差。
當然,神經(jīng)網(wǎng)絡(luò)的最佳用途不是擬合函數(shù)。我們之所以使用神經(jīng)網(wǎng)絡(luò),是因為我們需要它的泛化能力,即對于未知的特征可以得到很好的分類或回歸結(jié)果。擬合函數(shù)只使用它的記憶能力。