ความแตกต่างระหว่าง Semi Join และ Bloom Join

ความแตกต่างระหว่าง Semi Join และ Bloom Join
ความแตกต่างระหว่าง Semi Join และ Bloom Join

วีดีโอ: ความแตกต่างระหว่าง Semi Join และ Bloom Join

วีดีโอ: ความแตกต่างระหว่าง Semi Join และ Bloom Join
วีดีโอ: ความแตกต่าง Wiiware vs Wii game 2024, พฤศจิกายน
Anonim

Semi Join vs Bloom Join

Semi join และ Bloom join เป็นวิธีการเข้าร่วมสองวิธีที่ใช้ในการประมวลผลแบบสอบถามสำหรับฐานข้อมูลแบบกระจาย เมื่อประมวลผลการสืบค้นข้อมูลในฐานข้อมูลแบบกระจาย ข้อมูลจะต้องได้รับการถ่ายโอนระหว่างฐานข้อมูลที่อยู่ในไซต์ต่างๆ นี่อาจเป็นการดำเนินการที่มีราคาแพง ทั้งนี้ขึ้นอยู่กับปริมาณข้อมูลที่ต้องถ่ายโอน ดังนั้น เมื่อประมวลผลการสืบค้นข้อมูลในสภาพแวดล้อมฐานข้อมูลแบบกระจาย สิ่งสำคัญคือต้องปรับการสืบค้นให้เหมาะสมเพื่อลดปริมาณข้อมูลที่ถ่ายโอนระหว่างไซต์ การรวมกึ่งและการรวมแบบบานเป็นสองวิธีที่สามารถใช้เพื่อลดปริมาณการถ่ายโอนข้อมูลและดำเนินการประมวลผลแบบสอบถามอย่างมีประสิทธิภาพ

กึ่งเข้าร่วมคืออะไร

Semi join เป็นวิธีที่ใช้สำหรับการประมวลผลการสืบค้นที่มีประสิทธิภาพในสภาพแวดล้อมฐานข้อมูลแบบกระจาย พิจารณาสถานการณ์ที่ฐานข้อมูลพนักงาน (เก็บข้อมูลเช่น ชื่อพนักงาน หมายเลขแผนกที่เธอทำงาน ฯลฯ) อยู่ที่ไซต์ 1 และฐานข้อมูลของแผนก (เก็บข้อมูลเช่น หมายเลขแผนก ชื่อแผนก สถานที่ ฯลฯ) อยู่ที่ไซต์งาน 2. ตัวอย่างเช่น หากเราต้องการรับชื่อพนักงานและชื่อแผนกที่เธอทำงานอยู่ (เฉพาะแผนกที่ตั้งอยู่ใน "นิวยอร์ก") โดยดำเนินการค้นหาที่ตัวประมวลผลการสืบค้นซึ่งอยู่ที่ไซต์ 3 มีหลายวิธีที่ สามารถถ่ายโอนข้อมูลระหว่างสามไซต์เพื่อให้งานนี้สำเร็จ แต่เมื่อถ่ายโอนข้อมูล สิ่งสำคัญคือต้องทราบว่าไม่จำเป็นต้องถ่ายโอนฐานข้อมูลทั้งหมดระหว่างไซต์ เฉพาะบางแอตทริบิวต์ (หรือทูเพิล) ที่จำเป็นสำหรับการรวมเท่านั้นที่จำเป็นต้องได้รับการถ่ายโอนระหว่างไซต์เพื่อดำเนินการค้นหาอย่างมีประสิทธิภาพการรวมกึ่งเป็นวิธีที่สามารถใช้เพื่อลดปริมาณข้อมูลที่ส่งระหว่างไซต์ ในการเข้าร่วมแบบกึ่ง มีเพียงคอลัมน์การรวมเท่านั้นที่จะถูกโอนจากไซต์หนึ่งไปยังอีกไซต์หนึ่ง จากนั้นคอลัมน์ที่โอนย้ายจะถูกใช้เพื่อลดขนาดของความสัมพันธ์ที่จัดส่งระหว่างไซต์อื่น สำหรับตัวอย่างข้างต้น คุณสามารถโอนหมายเลขแผนกและชื่อแผนกของ tuples ด้วย location=”New York” จากไซต์ 2 ไปยังไซต์ 1 และดำเนินการเข้าร่วมที่ไซต์ 1 และโอนความสัมพันธ์สุดท้ายกลับไปยังไซต์ 3

Bloom Join คืออะไร

ดังที่กล่าวไว้ก่อนหน้านี้ Bloom join เป็นอีกวิธีหนึ่งที่ใช้เพื่อหลีกเลี่ยงการถ่ายโอนข้อมูลที่ไม่จำเป็นระหว่างไซต์ต่างๆ เมื่อดำเนินการค้นหาในสภาพแวดล้อมฐานข้อมูลแบบกระจาย ในการเข้าร่วมแบบบลูม แทนที่จะถ่ายโอนคอลัมน์การรวม การแสดงคอลัมน์การรวมแบบย่อจะถูกถ่ายโอนระหว่างไซต์ต่างๆ Bloom เข้าร่วมใช้ตัวกรอง Bloom ซึ่งใช้เวกเตอร์บิตเพื่อดำเนินการค้นหาสมาชิก ประการแรก ตัวกรองการผลิบานถูกสร้างขึ้นโดยใช้คอลัมน์การรวม และจะถูกถ่ายโอนระหว่างไซต์ต่างๆ จากนั้นจึงดำเนินการเข้าร่วม

Semi Join และ Bloom Join ต่างกันอย่างไร

ถึงแม้ว่าจะใช้วิธีการเข้าร่วมแบบกึ่งเข้าร่วมและเข้าร่วมแบบ Bloom เพื่อลดปริมาณข้อมูลที่ถ่ายโอนระหว่างไซต์เมื่อดำเนินการสืบค้นข้อมูลในสภาพแวดล้อมฐานข้อมูลแบบกระจาย แต่การเข้าร่วม Bloom จะลดปริมาณข้อมูล (จำนวนสิ่งอันดับ) ที่ถ่ายโอนเมื่อเทียบกับ กึ่งเข้าร่วมโดยใช้แนวคิดของตัวกรองบลูม ซึ่งใช้เวกเตอร์บิตเพื่อกำหนดสมาชิกชุด ดังนั้นการใช้ bloom join จะมีประสิทธิภาพมากกว่าการใช้ semi join

แนะนำ: