cross validation 用哪個模型 xgboost中哪些特征可以歸一化？

2023-04-02

5003

xgboost中哪些特征可以歸一化？短語參數(shù)的命名規(guī)則。現(xiàn)在xgboost s模塊。在這個模塊中，命名規(guī)則與skl:基本上用的是gbtr:多線程，如果沒有設(shè)置，算自動檢查并行計算的核心數(shù)量。2.助推

xgboost中哪些特征可以歸一化？

短語參數(shù)的命名規(guī)則?，F(xiàn)在xgboost s模塊。在這個模塊中，命名規(guī)則與skl:基本上用的是gbtr:多線程，如果沒有設(shè)置，算自動檢查并行計算的核心數(shù)量。

2.助推器參數(shù)

η(學習rat:學習率0.01-0.2。

min_chil:子節(jié)點的最低權(quán)重和。防止高的時候過貼，低的時候容易欠貼。

Max_d:損失閾值，當損失降低超過該閾值時，分割將繼續(xù)。

最大增量步長:在最大增量步長中，我們允許每個樹的權(quán)重估計為。

在subsampl:，當構(gòu)建0.5-1中的每棵樹時，為了避免過擬合，只取一部分樣本進行構(gòu)建。

col sampl:[0.5-1]特征采樣

Colsampl: L2正則化$ T: L1正則項

秤_位置_重量

3.訓練參數(shù)

客觀二分類使用binary:logistic多分類使用multi:softmax直接返回標簽，也可以使用multi:softbob或predict_prob訓練后輸出類別的概率。

Eval_metric:用它來評估。估計驗證數(shù)據(jù):RMSE，平均誤差，對數(shù)損失，誤差，對數(shù)損失，auc。

4.XGBoost允許在每次boosting迭代中使用交叉驗證。因此，可以方便地獲得最佳的升壓迭代次數(shù)。而如果用sklearn的kfold和cross_val_score，這就是每個模型訓練只用一個固定數(shù)據(jù)，而不是每輪boosting都要交叉校驗。

5.關(guān)于特色工程

XGBOOST是樹的增強模型。由于樹的非線性特征，我們不不需要標準化(正態(tài)分布)或縮放(到01區(qū)間)特征。

或者拿log(這個存疑，我個人覺得拿log可能有用？)，但我們應該關(guān)注的是創(chuàng)造特色。

比如過去五天的平均值，去年同期的數(shù)值，環(huán)比增加，同比增長。比如租房的場景，房租/臥室數(shù)量這些和業(yè)務非常相關(guān)的東西，其實是需要不斷摸索才能找到的。XGBOOST can 不能幫助我們獲得這些特性。

與深度學習相比，深度學習本質(zhì)上依賴于特殊的結(jié)構(gòu)，如LSTM和CNN，來獲得適合于這項業(yè)務的特征。

那么分類功能在XGBOOST中并不是特別有用，如果相關(guān)性不是很大可以去掉。如果類別不多，比如只有個位數(shù)的類別，可以添加。如果類別很多，可以考慮使用CATBOOSTING或者LIGHTGBM。

進行戰(zhàn)略性采購

-協(xié)助團隊領(lǐng)導建立采購預算、商品策略和運營計劃。

-研究采購營銷，推薦新的潛在供應商支持買家

本地化協(xié)調(diào)

-負責本地化開發(fā)，并針對項目指導提供跨職能支持

-與采購/SDE/采購團隊合作跟蹤所有開發(fā)零件的過程，包括所有驗證階段

-與內(nèi)部部門合作，協(xié)調(diào)和推進新的本地化流程

-本地化FAI跟蹤列表，推動新的本地化流程

產(chǎn)品視圖計算(面向項目)

-定期創(chuàng)建MLL零件清單，并用Fico數(shù)據(jù)更新采購價格