tensorflow輸入數(shù)據(jù)格式 在數(shù)據(jù)挖掘時為什么要進(jìn)行數(shù)據(jù)預(yù)處理?
在數(shù)據(jù)挖掘時為什么要進(jìn)行數(shù)據(jù)預(yù)處理?數(shù)據(jù)中含有大量噪聲數(shù)據(jù),需要剔除無關(guān)數(shù)據(jù),如分析無關(guān)字段了解數(shù)據(jù)質(zhì)量,有些數(shù)據(jù)質(zhì)量不足以直接使用,如包含太多缺失值,需要進(jìn)行缺失值處理,不能直接使用數(shù)據(jù)字段,為了更
在數(shù)據(jù)挖掘時為什么要進(jìn)行數(shù)據(jù)預(yù)處理?
數(shù)據(jù)中含有大量噪聲數(shù)據(jù),需要剔除無關(guān)數(shù)據(jù),如分析無關(guān)字段了解數(shù)據(jù)質(zhì)量,有些數(shù)據(jù)質(zhì)量不足以直接使用,如包含太多缺失值,需要進(jìn)行缺失值處理,不能直接使用數(shù)據(jù)字段,為了更好地進(jìn)行進(jìn)一步的數(shù)據(jù)挖掘,需要派生出新的字段,數(shù)據(jù)的分散性需要提高數(shù)據(jù)的集成度,比如添加表(添加行),或者合并表(添加列),可以通過數(shù)據(jù)預(yù)處理對數(shù)據(jù)有一個很好的初步了解和理解。