การขุดข้อมูลเทียบกับ OLAP
ทั้งการทำเหมืองข้อมูลและ OLAP เป็นสองเทคโนโลยี Business Intelligence (BI) ทั่วไป ข่าวกรองธุรกิจหมายถึงวิธีการที่ใช้คอมพิวเตอร์ในการระบุและดึงข้อมูลที่เป็นประโยชน์จากข้อมูลทางธุรกิจ การทำเหมืองข้อมูลเป็นสาขาของวิทยาการคอมพิวเตอร์ที่เกี่ยวข้องกับการแยกรูปแบบที่น่าสนใจจากชุดข้อมูลขนาดใหญ่ มันรวมวิธีการมากมายจากปัญญาประดิษฐ์ สถิติ และการจัดการฐานข้อมูล OLAP (การประมวลผลเชิงวิเคราะห์ออนไลน์) ตามชื่อที่แนะนำคือการรวบรวมวิธีการสืบค้นฐานข้อมูลหลายมิติ
การขุดข้อมูลเรียกอีกอย่างว่าการค้นพบความรู้ในข้อมูล (KDD)ดังที่ได้กล่าวมาแล้ว เป็นสาขาวิชาวิทยาการคอมพิวเตอร์ที่เกี่ยวข้องกับการดึงข้อมูลดิบที่ไม่ทราบมาก่อนและน่าสนใจจากข้อมูลดิบ เนื่องจากการเติบโตแบบทวีคูณของข้อมูล โดยเฉพาะอย่างยิ่งในด้านต่าง ๆ เช่น ธุรกิจ การทำเหมืองข้อมูลได้กลายเป็นเครื่องมือที่สำคัญมากในการแปลงข้อมูลจำนวนมากนี้เป็นข่าวกรองธุรกิจ เนื่องจากดูเหมือนว่าการดึงรูปแบบด้วยตนเองจะเป็นไปไม่ได้ในช่วงสองสามทศวรรษที่ผ่านมา ตัวอย่างเช่น ปัจจุบันมีการใช้แอปพลิเคชันต่างๆ เช่น การวิเคราะห์เครือข่ายสังคม การตรวจจับการฉ้อโกง และการตลาด การทำเหมืองข้อมูลมักจะเกี่ยวข้องกับงานสี่อย่างต่อไปนี้: การจัดกลุ่ม การจำแนก การถดถอย และการเชื่อมโยง การทำคลัสเตอร์กำลังระบุกลุ่มที่คล้ายกันจากข้อมูลที่ไม่มีโครงสร้าง การจัดประเภทเป็นกฎการเรียนรู้ที่สามารถนำไปใช้กับข้อมูลใหม่ได้ และโดยทั่วไปจะรวมถึงขั้นตอนต่อไปนี้: การประมวลผลข้อมูลล่วงหน้า การออกแบบแบบจำลอง การเลือกการเรียนรู้/คุณสมบัติ และการประเมิน/การตรวจสอบ การถดถอยคือการค้นหาฟังก์ชันที่มีข้อผิดพลาดน้อยที่สุดในข้อมูลแบบจำลอง และความสัมพันธ์กำลังมองหาความสัมพันธ์ระหว่างตัวแปรการทำเหมืองข้อมูลมักใช้เพื่อตอบคำถามเช่น ผลิตภัณฑ์หลักที่อาจช่วยให้ได้รับผลกำไรสูงในปีหน้าใน Wal-Mart คืออะไร
OLAP คือคลาสของระบบที่ให้คำตอบสำหรับคำถามแบบหลายมิติ โดยทั่วไปแล้ว OLAP จะใช้สำหรับการตลาด การจัดทำงบประมาณ การคาดการณ์ และแอปพลิเคชันที่คล้ายคลึงกัน มันไปโดยไม่บอกว่าฐานข้อมูลที่ใช้สำหรับ OLAP ได้รับการกำหนดค่าสำหรับการสืบค้นที่ซับซ้อนและเฉพาะกิจโดยคำนึงถึงประสิทธิภาพที่รวดเร็ว โดยทั่วไปจะใช้เมทริกซ์เพื่อแสดงผลลัพธ์ของ OLAP แถวและคอลัมน์ถูกสร้างขึ้นตามขนาดของคิวรี พวกเขามักจะใช้วิธีการรวมในหลายตารางเพื่อรับสรุป ตัวอย่างเช่น สามารถใช้เพื่อค้นหายอดขายของปีนี้ใน Wal-Mart เมื่อเทียบกับปีที่แล้ว? การคาดการณ์ยอดขายในไตรมาสถัดไปเป็นอย่างไร? สิ่งที่สามารถพูดเกี่ยวกับแนวโน้มโดยดูที่เปอร์เซ็นต์การเปลี่ยนแปลง?
แม้ว่าจะเห็นได้ชัดว่าการทำเหมืองข้อมูลและ OLAP คล้ายกันเนื่องจากทำงานบนข้อมูลเพื่อให้ได้ข้อมูลอัจฉริยะ ความแตกต่างหลักมาจากวิธีดำเนินการกับข้อมูลเครื่องมือ OLAP ให้การวิเคราะห์ข้อมูลแบบหลายมิติ และให้ข้อมูลสรุป แต่การทำเหมืองข้อมูลจะเน้นที่อัตราส่วน รูปแบบ และอิทธิพลในชุดข้อมูลในทางตรงกันข้าม นั่นคือข้อตกลงของ OLAP กับการรวม ซึ่งรวมการทำงานของข้อมูลผ่าน "การเพิ่ม" แต่การทำเหมืองข้อมูลสอดคล้องกับ "การแบ่ง" ความแตกต่างที่น่าสังเกตอื่น ๆ คือในขณะที่เครื่องมือขุดข้อมูลจำลองข้อมูลและส่งคืนกฎที่ดำเนินการได้ OLAP จะทำการเปรียบเทียบและเปรียบเทียบเทคนิคต่าง ๆ ตามมิติทางธุรกิจแบบเรียลไทม์