Data Mining คือ
การค้นหาความสัมพันธ์และรูปแบบ (Pattern) ทั้งหมด
ซึ่งมีอยู่จริงในฐานข้อมูล แต่ได้ถูกซ่อนไว้ภายในข้อมูลจำนวนมาก Data
Mining จะทำการสำรวจและวิเคราะห์อย่างอัตโนมัติหรือกึ่งอัตโนมัติ
ในปริมาณข้อมูลจำนวนมากให้อยู่ในรูปแบบที่เต็มไปด้วยความหมายและอยู่ในรูปของกฎ (Rule) โดยความสัมพันธ์เหล่านี้แสดงให้เห็นถึงความรู้ต่างๆที่มีประโยชน์ในฐานข้อมูล
2.3.1**ประเภทข้อมูลที่สามารถทำดาต้าไมนิ่ง
2.3.1.1**ฐานข้อมูลที่จัดเก็บอยู่ในรูปแบบของตาราง (Relational Database) โดยในแต่ละตารางประกอบไปด้วยแถวและคอลัมน์
ความสัมพันธ์ของข้อมูลทั้งหมดสามารถแสดงได้โดย Entity-Relationship ( ER )
model
2.3.1.2**คลังข้อมูล (Data Warehouses) เป็นการเก็บรวบรวมข้อมูลจากหลายแหล่งมาเก็บไว้ในรูปแบบเดียวกันและรวบรวมไว้ในที่
ๆ เดียวกัน หรือ จะเก็บเป็น ฐานข้อมูล ก็ได้
2.3.1.3**ฐานข้อมูลรายการเปลี่ยนแปลง (Transaction Database) ประกอบด้วยข้อมูลที่
แต่ละรายการแทนด้วยเหตุการณ์ในขณะใดขณะหนึ่ง เช่น ใบเสร็จรับเงินซึ่งเก็บข้อมูลชื่อลูกค้าและรายการสินค้าที่ลูกค้ารายนั้นซื้อ
เป็นต้น
2.3.1.4**ฐานข้อมูลที่จัดเก็บในรูปแบบอื่น (Advanced Database) เช่น ข้อมูลเท็กซ์ไฟล์
ข้อมูลมัลติมีเดีย หรือข้อมูลในรูปของเว็บ เป็นต้น
2.3.2**ลักษณะเฉพาะของข้อมูลที่สามารถทำดาต้าไมนิง
2.3.2.1**ข้อมูลที่มีขนาดใหญ่เกินกว่าจะพิจารณาความสัมพันธ์ที่ซ่อนอยู่ภายในข้อมูลนั้นได้ด้วยตาเปล่า
หรือด้วยการใช้ระบบจัดการฐานข้อมูล
(Database Management System) ในการจัดการฐานข้อมูล
2.3.2.2**ข้อมูลที่มาจากหลายแหล่งโดยอาจรวบรวมมาจากหลายระบบปฏิบัติการหรือหลายระบบจัดการฐานข้อมูล
2.3.2.3**ข้อมูลที่ไม่มีการเปลี่ยนแปลงตลอดช่วงเวลาของการทำไมนิง หากข้อมูลที่มี
อยู่นั้นเป็นข้อมูลที่เปลี่ยนแปลงตลอดเวลาจะต้องแก้ปัญหานี้ก่อน โดยบันทึกฐานข้อมูลนั้นไว้และนำฐานข้อมูลที่บันทึกไว้มาทำไมนิง
แต่เนื่องจากข้อมูลนั้นมีการเปลี่ยนแปลงอยู่ตลอดเวลา จึงทำให้ผลลัพธ์ที่ได้จาการทำไมนิงสมเหตุสมผลในช่วงเวลาหนึ่งเท่านั้น
ดังนั้นเพื่อให้ได้ผลลัพธ์ที่มี ความถูกต้องเหมาะสมอยู่ตลอดเวลาจึงต้องทำไมนิงใหม่ทุกครั้งในช่วงเวลาที่เหมาะสม
2.3.2.4**ข้อมูลที่มีโครงสร้างซับซ้อน เช่น ข้อมูลรูปภาพ ข้อมูลมัลติมีเดีย
ข้อมูลเหล่านี้สามารถนำมาทำไมนิงได้เช่นกันแต่ต้องใช้เทคนิคการทำดาต้าไมนิงขั้นสูง
ภาพที่ 1 : *ขั้นตอนการทำดาต้าไมนิ่ง