ความแตกต่างระหว่าง KDD และการขุดข้อมูล

ความแตกต่างระหว่าง KDD และการขุดข้อมูล
ความแตกต่างระหว่าง KDD และการขุดข้อมูล

วีดีโอ: ความแตกต่างระหว่าง KDD และการขุดข้อมูล

วีดีโอ: ความแตกต่างระหว่าง KDD และการขุดข้อมูล
วีดีโอ: การเงินสำหรับมือใหม่ EP56: โครงสร้างเงินทุน (Capital Structure) 2024, พฤศจิกายน
Anonim

KDD เทียบกับการทำเหมืองข้อมูล

KDD (การค้นพบความรู้ในฐานข้อมูล) เป็นสาขาวิทยาการคอมพิวเตอร์ ซึ่งรวมถึงเครื่องมือและทฤษฎีที่จะช่วยมนุษย์ในการดึงข้อมูลที่เป็นประโยชน์และไม่เคยรู้จักมาก่อน (เช่น ความรู้) จากชุดข้อมูลดิจิทัลจำนวนมาก KDD ประกอบด้วยหลายขั้นตอน และ Data Mining ก็เป็นหนึ่งในนั้น การทำเหมืองข้อมูลเป็นการใช้อัลกอริธึมเฉพาะเพื่อแยกรูปแบบออกจากข้อมูล อย่างไรก็ตาม KDD และ Data Mining ใช้แทนกันได้

KDD คืออะไร

ดังที่กล่าวไว้ข้างต้น KDD เป็นสาขาวิชาวิทยาการคอมพิวเตอร์ที่เกี่ยวข้องกับการดึงข้อมูลดิบที่ไม่รู้จักและน่าสนใจก่อนหน้านี้จากข้อมูลดิบKDD เป็นกระบวนการทั้งหมดในการพยายามทำความเข้าใจข้อมูลโดยการพัฒนาวิธีการหรือเทคนิคที่เหมาะสม กระบวนการนี้เกี่ยวข้องกับการทำแผนที่ของข้อมูลระดับต่ำในรูปแบบอื่นๆ ที่มีขนาดกะทัดรัด เป็นนามธรรม และมีประโยชน์มากกว่า ซึ่งทำได้โดยการสร้างรายงานสั้นๆ สร้างแบบจำลองกระบวนการสร้างข้อมูล และพัฒนาแบบจำลองการคาดการณ์ที่สามารถทำนายกรณีในอนาคตได้ เนื่องจากการเติบโตแบบทวีคูณของข้อมูล โดยเฉพาะอย่างยิ่งในด้านต่าง ๆ เช่น ธุรกิจ KDD ได้กลายเป็นกระบวนการที่สำคัญมากในการแปลงข้อมูลจำนวนมากนี้เป็นข่าวกรองธุรกิจ เนื่องจากการดึงรูปแบบด้วยตนเองดูเหมือนจะเป็นไปไม่ได้ในช่วงสองสามทศวรรษที่ผ่านมา ตัวอย่างเช่น ปัจจุบันมีการใช้แอปพลิเคชันต่างๆ เช่น การวิเคราะห์เครือข่ายสังคม การตรวจจับการฉ้อโกง วิทยาศาสตร์ การลงทุน การผลิต โทรคมนาคม การล้างข้อมูล กีฬา การดึงข้อมูล และส่วนใหญ่สำหรับการตลาด KDD มักใช้เพื่อตอบคำถามเช่นผลิตภัณฑ์หลักที่อาจช่วยให้ได้รับผลกำไรสูงในปีหน้าใน Wal-Mart คืออะไร?กระบวนการนี้มีหลายขั้นตอน เริ่มต้นด้วยการพัฒนาความเข้าใจในโดเมนแอปพลิเคชันและเป้าหมาย จากนั้นจึงสร้างชุดข้อมูลเป้าหมาย ตามด้วยการทำความสะอาด การประมวลผลล่วงหน้า การลดขนาด และการฉายข้อมูล ขั้นตอนต่อไปคือการใช้ Data Mining (อธิบายด้านล่าง) เพื่อระบุรูปแบบ สุดท้าย ความรู้ที่ค้นพบจะถูกรวบรวมโดยการแสดงภาพและ/หรือตีความ

การขุดข้อมูลคืออะไร

ดังที่กล่าวไว้ข้างต้น Data Mining เป็นเพียงขั้นตอนหนึ่งในกระบวนการ KDD โดยรวม เป้าหมายการทำเหมืองข้อมูลหลักสองข้อตามที่กำหนดไว้โดยเป้าหมายของแอปพลิเคชัน ได้แก่ การยืนยันหรือการค้นพบ การยืนยันเป็นการยืนยันสมมติฐานของผู้ใช้เกี่ยวกับข้อมูล ในขณะที่การค้นพบจะค้นหารูปแบบที่น่าสนใจโดยอัตโนมัติ งานเหมืองข้อมูลที่สำคัญมีสี่งาน: การจัดกลุ่ม การจัดประเภท การถดถอย และการเชื่อมโยง (การสรุป) การทำคลัสเตอร์กำลังระบุกลุ่มที่คล้ายกันจากข้อมูลที่ไม่มีโครงสร้าง การจัดประเภทเป็นกฎการเรียนรู้ที่สามารถนำไปใช้กับข้อมูลใหม่ได้การถดถอยคือการค้นหาฟังก์ชันที่มีข้อผิดพลาดน้อยที่สุดในข้อมูลแบบจำลอง และความสัมพันธ์กำลังมองหาความสัมพันธ์ระหว่างตัวแปร จากนั้นจึงต้องเลือกอัลกอริธึมการขุดข้อมูลเฉพาะ สามารถเลือกอัลกอริธึมต่างๆ เช่น การถดถอยเชิงเส้น การถดถอยโลจิสติก แผนผังการตัดสินใจ และ Naïve Bayes ทั้งนี้ขึ้นอยู่กับเป้าหมาย จากนั้นจะค้นหารูปแบบที่สนใจในรูปแบบการแสดงแทนอย่างน้อยหนึ่งรูปแบบ สุดท้าย โมเดลจะได้รับการประเมินโดยใช้ความแม่นยำในการคาดการณ์หรือความเข้าใจ

KDD กับการทำเหมืองข้อมูลต่างกันอย่างไร

แม้ว่าคำสองคำ KDD และ Data Mining จะใช้สลับกันอย่างมาก แต่ก็อ้างถึงแนวคิดที่เกี่ยวข้องกันแต่ต่างกันเล็กน้อย KDD เป็นกระบวนการโดยรวมในการดึงความรู้ออกจากข้อมูล ในขณะที่ Data Mining เป็นขั้นตอนภายในกระบวนการ KDD ซึ่งเกี่ยวข้องกับการระบุรูปแบบในข้อมูล กล่าวอีกนัยหนึ่ง Data Mining เป็นเพียงแอปพลิเคชันของอัลกอริธึมเฉพาะตามเป้าหมายโดยรวมของกระบวนการ KDD

แนะนำ: