隨著資訊科技的進步以及電子化時代的來臨,現今企業所面對的是一個與以往截然不同的競爭環境。在資訊科技的推波助瀾下,不僅企業競爭的強度與速度倍數於以往,激增的市場交易也使得各企業所需儲存與處理的資料量越來越龐大。在這種情況下,企業的焦點已從以往的資料蒐集與整理,轉變成如何有效的利用資料庫來進行資訊的獲取。換言之,企業如何因應外界的競爭,能快速且有效的從資料庫中取得有用的資訊,並反應市場或消費者的需求,已成為各企業急於解決的重要議題之一。在整個資料採礦 (Data Mining) 的過程中,牽涉了大量的準備工作與規劃過程,事實上許多專家皆認為整套資料採礦的進行有80%的時間與精力是花費在資料的前置作業階段,其中包含資料的淨化與格式轉換甚或表格的連結。在資料蒐集上常因為人為或不可抗拒因素造成資料缺值,此時如不加以處理,將因為不完整的資料庫而導致資料採礦的結果失真。因此本文對資料淨化過程常遇到的問題-缺失資料的處理方面做一探討,並以農業試驗中的馬鈴薯品種塊莖收量資料來加以說明。