設置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

Excel 如何數(shù)據(jù)清洗

秋葉Excel 2025/2/8 13:09:13 責編:夢澤

原文標題:《Excel 里把人“逼瘋”的雜亂數(shù)據(jù),原來 1 分鐘就能整理好!》

鏘鏘!大家好哇~ 我是最近在研究數(shù)據(jù)分析的衛(wèi)星醬~

數(shù)據(jù)分析中有個很重要的預處理步驟,叫做「數(shù)據(jù)清洗」。

簡單來說就是把數(shù)據(jù)中「臟臟的 」部分 —— 缺失的、重復的、錯誤的等等,給它清除掉,剩下「干凈的」數(shù)據(jù)。

光講概念也太難理解了,衛(wèi)某今天就直接用實例,給大家看看數(shù)據(jù)清洗,到底是怎么個事兒~

1、缺失數(shù)據(jù)

如果某處缺了一兩個數(shù)據(jù),最簡單的方法就是 —— 扔了它。

別笑!

這的確是正規(guī)的數(shù)據(jù)清洗手段,在表格不大、不完整數(shù)據(jù)較少的情況下,完全可以這樣做。

「比如 2002 年「產(chǎn)品 C」的產(chǎn)量缺失了,那就偷偷把 2002 年從統(tǒng)計表里刪掉,只分析后面的~」

但這樣可能將潛在信息刪除,也可能導致數(shù)據(jù)分析出現(xiàn)較大偏差。

所以,如果數(shù)據(jù)很多、空缺也多,刪除過多條目會使得結果產(chǎn)生較大偏差時,我們還是得把空缺補上。

? 空值變 0 值

【Ctrl+G】定位,【定位條件】,選擇【空值】,【確定】,最后輸入 0。

? 統(tǒng)計學方法

但很多時候不能這樣粗暴地填充。

實際應用常選擇統(tǒng)計學方法,比如平均值,來填充缺失的數(shù)據(jù)。

當然,根據(jù)數(shù)據(jù)實際類型,也可能使用中間值、最大值、最小值或者其他更復雜的函數(shù)值。

像這個預測函數(shù),就怪好用的。

2、重復數(shù)據(jù)

至于重復數(shù)據(jù),在之前的「數(shù)據(jù)核對」篇中已經(jīng)講過了,這里就不再贅述。

點此回顧「數(shù)據(jù)核對」

很多時候,我們在基礎的 Excel 應用中就完成了「數(shù)據(jù)清洗」的步驟。

數(shù)據(jù)分析的門檻,真的沒我們想象的那么高~

3、錯誤數(shù)據(jù)

函數(shù)錯誤值,比如#DIV / 0!、#N / A! 之類,只要在公式外套上 IFERROR 就行:

另一種錯誤數(shù)據(jù),就沒那么好對付了……

「比如等級只有「A / B / C」三種,有個單元格卻出現(xiàn)了「D」的;或者要求填寫「√」,偏偏有人寫「?」的……」

這種除了在一開始設置數(shù)據(jù)驗證,就只有用查找、計數(shù)、條件格式等偏門方法了

這種錯誤數(shù)據(jù)「D」,可以用【查找】或【篩選】直接定位它。

而「感覺上不對」的數(shù)據(jù),就比較難找到了:

▲ 誤差過大,不是測量誤差可以解釋的

這時我們就只能因地制宜,想辦法定位它,例如用 IF 函數(shù)篩選大于 36.13 的數(shù)據(jù)。

找到之后按照「缺失數(shù)據(jù)」的辦法處理它就是了。

4、寫在最后

好啦,今天從數(shù)據(jù)類型的角度給大家簡單講了下數(shù)據(jù)清洗的做法~

小伙伴們還知道哪些屬于數(shù)據(jù)清洗的 Excel 操作呢?

本文來自微信公眾號:秋葉 Excel(ID:excel100),作者:衛(wèi)星醬

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。

相關文章

關鍵詞:Excel教程,Excel學院

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應用 魔方 最會買 要知