เหมืองข้อมูล (Data Mining)


     Data Mining คือ การค้นหาความสัมพันธ์และรูปแบบ (Pattern) ทั้งหมด ซึ่งมีอยู่จริงในฐานข้อมูล แต่ได้ถูกซ่อนไว้ภายในข้อมูลจำนวนมาก Data Mining จะทำการสำรวจและวิเคราะห์อย่างอัตโนมัติหรือกึ่งอัตโนมัติ ในปริมาณข้อมูลจำนวนมากให้อยู่ในรูปแบบที่เต็มไปด้วยความหมายและอยู่ในรูปของกฎ (Rule) โดยความสัมพันธ์เหล่านี้แสดงให้เห็นถึงความรู้ต่างๆที่มีประโยชน์ในฐานข้อมูล

2.3.1**ประเภทข้อมูลที่สามารถทำดาต้าไมนิ่ง
2.3.1.1**ฐานข้อมูลที่จัดเก็บอยู่ในรูปแบบของตาราง (Relational Database) โดยในแต่ละตารางประกอบไปด้วยแถวและคอลัมน์ ความสัมพันธ์ของข้อมูลทั้งหมดสามารถแสดงได้โดย Entity-Relationship ( ER ) model
2.3.1.2**คลังข้อมูล (Data Warehouses) เป็นการเก็บรวบรวมข้อมูลจากหลายแหล่งมาเก็บไว้ในรูปแบบเดียวกันและรวบรวมไว้ในที่ ๆ เดียวกัน หรือ จะเก็บเป็น ฐานข้อมูล ก็ได้
2.3.1.3**ฐานข้อมูลรายการเปลี่ยนแปลง (Transaction Database) ประกอบด้วยข้อมูลที่ แต่ละรายการแทนด้วยเหตุการณ์ในขณะใดขณะหนึ่ง เช่น ใบเสร็จรับเงินซึ่งเก็บข้อมูลชื่อลูกค้าและรายการสินค้าที่ลูกค้ารายนั้นซื้อ เป็นต้น
2.3.1.4**ฐานข้อมูลที่จัดเก็บในรูปแบบอื่น (Advanced Database) เช่น ข้อมูลเท็กซ์ไฟล์ ข้อมูลมัลติมีเดีย หรือข้อมูลในรูปของเว็บ เป็นต้น

2.3.2**ลักษณะเฉพาะของข้อมูลที่สามารถทำดาต้าไมนิง
2.3.2.1**ข้อมูลที่มีขนาดใหญ่เกินกว่าจะพิจารณาความสัมพันธ์ที่ซ่อนอยู่ภายในข้อมูลนั้นได้ด้วยตาเปล่า หรือด้วยการใช้ระบบจัดการฐานข้อมูล (Database Management System) ในการจัดการฐานข้อมูล
2.3.2.2**ข้อมูลที่มาจากหลายแหล่งโดยอาจรวบรวมมาจากหลายระบบปฏิบัติการหรือหลายระบบจัดการฐานข้อมูล
2.3.2.3**ข้อมูลที่ไม่มีการเปลี่ยนแปลงตลอดช่วงเวลาของการทำไมนิง หากข้อมูลที่มี อยู่นั้นเป็นข้อมูลที่เปลี่ยนแปลงตลอดเวลาจะต้องแก้ปัญหานี้ก่อน โดยบันทึกฐานข้อมูลนั้นไว้และนำฐานข้อมูลที่บันทึกไว้มาทำไมนิง แต่เนื่องจากข้อมูลนั้นมีการเปลี่ยนแปลงอยู่ตลอดเวลา จึงทำให้ผลลัพธ์ที่ได้จาการทำไมนิงสมเหตุสมผลในช่วงเวลาหนึ่งเท่านั้น ดังนั้นเพื่อให้ได้ผลลัพธ์ที่มี ความถูกต้องเหมาะสมอยู่ตลอดเวลาจึงต้องทำไมนิงใหม่ทุกครั้งในช่วงเวลาที่เหมาะสม
2.3.2.4**ข้อมูลที่มีโครงสร้างซับซ้อน เช่น ข้อมูลรูปภาพ ข้อมูลมัลติมีเดีย ข้อมูลเหล่านี้สามารถนำมาทำไมนิงได้เช่นกันแต่ต้องใช้เทคนิคการทำดาต้าไมนิงขั้นสูง




ภาพที่ 1 : *ขั้นตอนการทำดาต้าไมนิ่ง