cross validation 用哪個模型 xgboost中哪些特征可以歸一化?
xgboost中哪些特征可以歸一化?短語參數(shù)的命名規(guī)則。現(xiàn)在xgboost s模塊。在這個模塊中,命名規(guī)則與skl:基本上用的是gbtr:多線程,如果沒有設(shè)置,算自動檢查并行計算的核心數(shù)量。2.助推
xgboost中哪些特征可以歸一化?
短語參數(shù)的命名規(guī)則?,F(xiàn)在xgboost s模塊。在這個模塊中,命名規(guī)則與skl:基本上用的是gbtr:多線程,如果沒有設(shè)置,算自動檢查并行計算的核心數(shù)量。
2.助推器參數(shù)
η(學習rat:學習率0.01-0.2。
min_chil:子節(jié)點的最低權(quán)重和。防止高的時候過貼,低的時候容易欠貼。
Max_d:損失閾值,當損失降低超過該閾值時,分割將繼續(xù)。
最大增量步長:在最大增量步長中,我們允許每個樹的權(quán)重估計為。
在subsampl:,當構(gòu)建0.5-1中的每棵樹時,為了避免過擬合,只取一部分樣本進行構(gòu)建。
col sampl:[0.5-1]特征采樣
Colsampl: L2正則化$ T: L1正則項
秤_位置_重量
3.訓練參數(shù)
客觀二分類使用binary:logistic多分類使用multi:softmax直接返回標簽,也可以使用multi:softbob或predict_prob訓練后輸出類別的概率。
Eval_metric:用它來評估。估計驗證數(shù)據(jù):RMSE,平均誤差,對數(shù)損失,誤差,對數(shù)損失,auc。
4.XGBoost允許在每次boosting迭代中使用交叉驗證。因此,可以方便地獲得最佳的升壓迭代次數(shù)。而如果用sklearn的kfold和cross_val_score,這就是每個模型訓練只用一個固定數(shù)據(jù),而不是每輪boosting都要交叉校驗。
5.關(guān)于特色工程
XGBOOST是樹的增強模型。由于樹的非線性特征,我們不 不需要標準化(正態(tài)分布)或縮放(到01區(qū)間)特征。
或者拿log(這個存疑,我個人覺得拿log可能有用?),但我們應該關(guān)注的是創(chuàng)造特色。
比如過去五天的平均值,去年同期的數(shù)值,環(huán)比增加,同比增長。比如租房的場景,房租/臥室數(shù)量這些和業(yè)務非常相關(guān)的東西,其實是需要不斷摸索才能找到的。XGBOOST can 不能幫助我們獲得這些特性。
與深度學習相比,深度學習本質(zhì)上依賴于特殊的結(jié)構(gòu),如LSTM和CNN,來獲得適合于這項業(yè)務的特征。
那么分類功能在XGBOOST中并不是特別有用,如果相關(guān)性不是很大可以去掉。如果類別不多,比如只有個位數(shù)的類別,可以添加。如果類別很多,可以考慮使用CATBOOSTING或者LIGHTGBM。
采購員的崗位職責,英文版?
R:
進行戰(zhàn)略性采購
-協(xié)助團隊領(lǐng)導建立采購預算、商品策略和運營計劃。
-研究采購營銷,推薦新的潛在供應商支持買家
本地化協(xié)調(diào)
-負責本地化開發(fā),并針對項目指導提供跨職能支持
-與采購/SDE/采購團隊合作跟蹤所有開發(fā)零件的過程,包括所有驗證階段
-與內(nèi)部部門合作,協(xié)調(diào)和推進新的本地化流程
-本地化FAI跟蹤列表,推動新的本地化流程
產(chǎn)品視圖計算(面向項目)
-定期創(chuàng)建MLL零件清單,并用Fico數(shù)據(jù)更新采購價格