在C#中,使用DataTable進行數據清洗主要包括以下步驟:
using System.Data;
using System.Data.SqlClient;
DataTable dt = new DataTable();
dt.Columns.Add("ID", typeof(int));
dt.Columns.Add("Name", typeof(string));
dt.Columns.Add("Age", typeof(int));
// 添加數據行
DataRow row1 = dt.NewRow();
row1["ID"] = 1;
row1["Name"] = "Alice";
row1["Age"] = 30;
dt.Rows.Add(row1);
DataRow row2 = dt.NewRow();
row2["ID"] = 2;
row2["Name"] = "Bob";
row2["Age"] = 25;
dt.Rows.Add(row2);
// ... 添加更多數據行
刪除空值:
dt.DefaultView.RowFilter = "Name IS NOT NULL AND Age IS NOT NULL";
dt = dt.DefaultView.ToTable();
刪除重復值:
dt.DefaultView.RowFilter = "ID = 1 OR ID = 2"; // 根據需要修改條件
dt = dt.DefaultView.ToTable();
刪除不符合條件的數據(例如年齡小于18):
dt.DefaultView.RowFilter = "Age >= 18";
dt = dt.DefaultView.ToTable();
string connectionString = "your_connection_string";
string insertSql = "INSERT INTO YourTable (ID, Name, Age) VALUES (@ID, @Name, @Age)";
using (SqlConnection connection = new SqlConnection(connectionString))
{
using (SqlCommand command = new SqlCommand(insertSql, connection))
{
command.Parameters.AddWithValue("@ID", dt.Rows[0]["ID"]);
command.Parameters.AddWithValue("@Name", dt.Rows[0]["Name"]);
command.Parameters.AddWithValue("@Age", dt.Rows[0]["Age"]);
connection.Open();
command.ExecuteNonQuery();
}
}
注意:以上示例中的your_connection_string
需要替換為實際的數據庫連接字符串,YourTable
需要替換為實際的表名。
以上就是在C#中使用DataTable進行數據清洗的基本步驟。根據實際需求,可能需要進行更復雜的數據清洗操作。