G711 vs G729
G.711 และ G.729 เป็นวิธีการเข้ารหัสเสียงที่ใช้สำหรับการเข้ารหัสด้วยเสียงในเครือข่ายโทรคมนาคม วิธีการเข้ารหัสเสียงพูดทั้งสองแบบได้รับมาตรฐานในปี 1990 และใช้ในแอปพลิเคชันพื้นฐาน เช่น การสื่อสารไร้สาย เครือข่าย PSTN ระบบ VoIP (Voice over IP) และระบบสวิตชิ่ง G.729 มีการบีบอัดสูงเมื่อเทียบกับ G.711 โดยทั่วไป อัตราข้อมูล G.711 สูงกว่าอัตราข้อมูล G.729 ถึง 8 เท่า ทั้งสองวิธีมีวิวัฒนาการในช่วงทศวรรษที่ผ่านมาและมีหลายเวอร์ชันตามมาตรฐาน ITU-T
G.711
G.711 เป็นคำแนะนำของ ITU-T สำหรับความถี่เสียงของ Pulse Code Modulation (PCM)G.711 เป็นตัวแปลงสัญญาณที่ใช้กันทั่วไปในช่องทางโทรคมนาคมซึ่งมีแบนด์วิดท์ 64kbps G.711 มีสองเวอร์ชันที่เรียกว่า μ-law และ A-law A-Law ถูกใช้ในประเทศส่วนใหญ่ทั่วโลก ในขณะที่ μ-law ถูกใช้เป็นหลักในอเมริกาเหนือ คำแนะนำของ ITU-T สำหรับ G.711 คือ 8000 ตัวอย่างต่อวินาที โดยมีค่าความคลาดเคลื่อนเพียง +50 ส่วนต่อล้าน แต่ละตัวอย่างจะแสดงด้วยควอนไทเซชันแบบสม่ำเสมอ 8 บิต ซึ่งลงท้ายด้วยอัตราข้อมูล 64 kbps G.711 ส่งผลให้โอเวอร์เฮดในการประมวลผลต่ำมาก เนื่องจากอัลกอริธึมง่ายๆ ที่ใช้ในการแปลงสัญญาณเสียงให้อยู่ในรูปแบบดิจิทัล แต่นำไปสู่ประสิทธิภาพของเครือข่ายที่ต่ำเนื่องจากการใช้แบนด์วิดท์ไม่มีประสิทธิภาพ
มีรูปแบบอื่นๆ ของมาตรฐาน G.711 เช่น คำแนะนำ G.711.0 ซึ่งอธิบายรูปแบบการบีบอัดแบบไม่สูญเสียของสตรีมบิต G.711 และมุ่งเป้าไปที่การส่งผ่านบริการ IP เช่น VoIP นอกจากนี้ คำแนะนำของ ITU-T G.711.1 ยังอธิบายอัลกอริธึมการเข้ารหัสเสียงและคำพูดแบบไวด์แบนด์แบบฝังของมาตรฐาน G.711 ซึ่งทำงานที่อัตราข้อมูลที่สูงกว่า เช่น 64, 80 และ 96kbps และใช้ 16,000 ตัวอย่างต่อวินาทีเป็นอัตราการสุ่มตัวอย่างเริ่มต้น
G.729
G.729 คือคำแนะนำของ ITU-T สำหรับการเข้ารหัสสัญญาณเสียงพูดที่อัตราข้อมูล 8kbps โดยใช้ Conjugate Structure-Algebraic Code Excited Linear Prediction (CS-ACELP) G.729 ใช้ 8000 ตัวอย่างต่อวินาทีในขณะที่ใช้ PCM เชิงเส้น 16 บิตเป็นวิธีการเข้ารหัส ความล่าช้าในการบีบอัดข้อมูลคือ 10ms สำหรับ G.729 นอกจากนี้ G.729 ยังได้รับการปรับให้เหมาะกับสัญญาณเสียงจริงซึ่งนำไปสู่โทนเสียง DTMF (Dual Tone Multi-Frequency) และเพลงและแฟกซ์คุณภาพสูงไม่ได้รับการสนับสนุนอย่างน่าเชื่อถือโดยใช้ตัวแปลงสัญญาณ ดังนั้น การส่ง DTMF จึงใช้มาตรฐาน RFC 2833 เพื่อส่งตัวเลข DTMF โดยใช้เพย์โหลด RTP นอกจากนี้ แบนด์วิดท์ที่ต่ำกว่า 8kbps ทำให้สามารถใช้ G.729 ในแอปพลิเคชัน Voice Over IP (VoIP) ได้อย่างง่ายดาย ตัวแปรอื่นๆ ของ G.729 คือ G.729.1, G.729A และ G.729B G.729.1 ช่วยให้อัตราข้อมูลที่ปรับขนาดได้ระหว่าง 8 ถึง 32 kbps G.729.1 คืออัลกอริธึมการเข้ารหัสเสียงและความเร็วแบนด์แบนด์ ซึ่งสามารถทำงานร่วมกับตัวแปลงสัญญาณ G.729, G.729A และ G.729B
G711 กับ G729 ต่างกันอย่างไร – ทั้งสองเป็นระบบเข้ารหัสเสียงที่ใช้ในการสื่อสารด้วยเสียงและเป็นมาตรฐานโดย ITU-T – ทั้งคู่ใช้ 8000 ตัวอย่างต่อวินาทีสำหรับสัญญาณเสียงโดยใช้ทฤษฎี Nyquest แม้ว่า G.711 จะรองรับ 64kbps และ G.729 รองรับ 8kbps – แนวคิด G.711 เปิดตัวในปี 1970 ในระบบ Bell และทำให้เป็นมาตรฐานในปี 1988 ในขณะที่ G.729 ได้มาตรฐานในปี 1996 – G.729 ใช้อัลกอริธึมการบีบอัดพิเศษเพื่อลดอัตราข้อมูล ในขณะที่ G.711 ต้องการพลังการประมวลผลต่ำสุด เมื่อเทียบกับ G.729 เนื่องจากอัลกอริธึมที่เรียบง่าย – ทั้งสองเทคนิคมีเวอร์ชันขยายของตัวเองพร้อมรูปแบบเล็กน้อย – แม้ว่า G.729 จะให้อัตราข้อมูลต่ำ แต่ก็มีสิทธิ์ในทรัพย์สินทางปัญญาที่จำเป็นต้องได้รับใบอนุญาตหากคุณต้องการใช้ G.729 ซึ่งแตกต่างจาก G.711 – ดังนั้น G.711 จึงได้รับการสนับสนุนโดยอุปกรณ์ส่วนใหญ่และการทำงานร่วมกันได้ง่ายมาก |
สรุป
การแปลงจากรูปแบบการเข้ารหัสหนึ่งไปเป็นอีกรูปแบบหนึ่งจะจบลงด้วยการสูญเสียข้อมูลหากมีความไม่เข้ากันระหว่างอัลกอริธึมตัวแปลงสัญญาณ มีระบบที่วัดการสูญเสียคุณภาพในสถานการณ์ดังกล่าวโดยใช้ดัชนีต่างๆ เช่น MOS (Mean Opinion Score) และ PSQM (Perceptual Speech Quality Measure)
G.711 และ G.729 เป็นวิธีการเข้ารหัสด้วยเสียงสำหรับใช้กับเครือข่ายโทรคมนาคมโดยเฉพาะ G.729 ทำงานที่อัตราข้อมูลที่ต่ำกว่า 8 เท่าเมื่อเทียบกับ G.711 ในขณะที่ยังคงคุณภาพเสียงที่ใกล้เคียงกันโดยใช้อัลกอริธึมที่ซับซ้อนสูง ซึ่งนำไปสู่พลังการประมวลผลที่สูงขึ้นที่หน่วยเข้ารหัสและถอดรหัส