ข้อ 9
ปัจจุบันมาตราฐานของเทคโนโลยีการบีบอัดข้อมูล เช่น เทคนิคการบีบอัดข้อมูลวีดีโอเป็น MPEG การบีบอัดข้อมูลเสียงเป็น MIDI และการบียอัดเสียงพูดด้วย ADPCM หรือแม้แต่รูปภาพก็บีบอัดเป็น GIF หรือ JPEG เป็นต้น การบีบอัดทำให้รับส่งข้อมูลได้เร็วขึ้น และยังใช้ที่เก็บความจุลดลงด้วย
MPEG (Motion Picture Experts Group)
ปัจจุบันกลุ่มนักวิชาการและผู้หาความรู้ทางด้านภาพเคลื่อนไหวได้พยายามวางมาตรฐาน โดยกลุ่มนี้ทำงานภายใต้ชื่อ MPEG -Moving Picture Exports Group และพัฒนามาตรฐานภายใต้องค์กร ISO ซึ่งเป็นมาตรฐานระหว่างประเทศ
MPEG Group เป็นกลุ่มที่คิดค้นพัฒนาเทคโนโลยีการลดรูปข้อมูลและการบีบอัดข้อมูลความหนาแน่นระดับสูง (High bit compression rate) ทั้งข้อมูลด้านภาพและข้อมูลด้านเสียง แต่ส่วนใหญ่จะรู้จักเทคโนโลยีของ MPEG ในด้านการประยุกต์ใช้งานด้านภาพเป็นส่วนใหญ่ ได้แก่ ระบบการลดรูปและบีบอัดข้อมูลภาพ MPEG -1 ถูกนำไปใช้เป็นมาตรฐานการบันทึกข้อมูลสัญญาณภาพวิดีโอ ลงบนแผ่น CD (Video CD: VCD) อัดข้อมูลภาพ MPEG -2 ซึ่งมีการนำไปเป็นมาตรฐานการบันทึกข้อมูลสัญญาณภาพดิจิตอลลงบนแผ่นดิสก์ (Digital video disc : DVD) ดังปรากฏในปัจจุบัน ในยุคเริ่มต้นของเทคโนโลยีการลดรูปข้อมูลสัญญาณเสียงดิจิตอลนั้นมุ่งเพื่อสนองตอบความต้องการส่งข้อมูล สัญญาณเสียงดิจิตอล (ส่วนใหญ่เป็นเพลง) ผ่านเครือข่ายอินเทอร์เน็ต และการบันทึกลงสู่หน่วยความจำสารกึ่งตัวนำอิเล็กเทรอนิกส์ หรือบรรดาหน่วยความจำแบบแฟลช (flasj memory) กับเครื่องเล่นเพลงดิจิตอลแบบพกพา ซึ่งเครื่องดังกล่าวมีย่านการรับส่งข้อมูล (band width) ไม่กว้างมากนัก แม้จะเพิ่มขนาดหน่วยความจำใหญ่ขึ้นแต่ความมุ่งหมายคือความสามารถในการจัดเก็บเพลงดิจิตอล ให้ได้จำนวนเพลงมากที่สุด รูปแบบมาตรฐานคือบันทึกลงบนแผ่นคอมแพกต์ดิสก์ หรือแผ่น CD ทั่วๆ ไป เป็นลักษณะการบันทึกแบบ PCM 16 บิต ซึ่งเป็นการบันทึกระบบดิจิตอลที่ไม่มีการลดรูปข้อมูลและให้คุณภาพเสียงดีกว่าการบันทึกเสียงเพลงดิจิตอลแบบลดรูปข้อมูล แต่จะสิ้นเปลืองพื้นที่มากกว่าทำให้เก็บเพลงได้น้อยกว่า MPEG Group เล็งเห็นความต้องการใช้งานในจุดนี้ จึงได้คิดค้นพัฒนาระบบการลดรูปของสัญญาณเพลงขึ้นและใช้ชื่อเทคโนโลยีแรกที่คิดค้นขึ้นเป็นผลสำเร็จคือ ระบบ MP 3 ภายใต้มาตรฐานการลดรูปและบีบอัดข้อมูลระบบ MPEG -1 Layer 3 จึงเรียกย่อๆ ว่า MP3
ดังนั้น MPEG เป็นการกำหนดมาตรฐานขั้นพื้นฐานสำหรับกำหนดรูปแบบของข้อมูลระดับบิตของวีดีโอและออดิโอ รวมไปถึงขยายกลับข้อมูลที่ถูกบีบอัด ปัจจุบัน MPEG พัฒนามาเป็นมาตรฐาน MPEG Layer 3 เป็นการบีบอัดข้อมูลที่มีคุณภาพมาก โดยการบีบอัดข้อมูลดิจิตอลที่ระดับความถี่ 44.1 khz โดยสามารถบีบอัดข้อมูลให้มีขนาดเล็กลง 12 เท่า โดยไม่เสียคุณภาพของเสียงแต่อย่างใด MPEG มีการพัฒนา MPEG จาก 1-2, 4 และ 7
GIP (Graphics Interchange Format)
เป็นไฟล์กราฟิกมาตรฐานที่ทำงานบนอินเทอร์เน็ต มักจะใช้เมื่อ
ต้องการไฟล์ที่มีขนาดเล็ก
จำนวนสีและความละเอียดของภาพไม่สูงมากนัก
ต้องการพื้นแบบโปร่งใส
ต้องการแสดงผลแบบโครงร่างก่อน แล้วค่อยแสดงผลแบบละเอียด
ต้องการนำเสนอภาพแบบภาพเคลื่อนไหว
จุดเด่น
มีขนาดไฟล์ต่ำ
สามารถทำพื้นของภาพให้เป็นพื้นแบบโปร่งใสได้ (Transparent)
มีระบบแสดงผลแบบหยาบและค่อยๆ ขยายไปสู่ละเอียดในระบบ Interlace
มีโปรแกรมสนับการสร้างจำนวนมาก
เรียกดูได้กับ Graphics Browser ทุกตัว
ความสามารถด้านการนำเสนอแบบภาพเคลื่อนไหว (Gif Animation)
จุดด้อย
แสดงสีได้เพียง 256 สี
ไฟล์ .GIF มี 2 สกุล ได้แก่
GIF87 พัฒนาขึ้นในปี ค.ศ. 1987
เป็นไฟล์กราฟิกรุ่นแรกที่สนับสนุนการนำเสนอบนอินเทอร์เน็ต เป็นไฟล์ที่มีขนาดเล็กและแสดงผลสีได้เพียง 256 สี และกำหนดให้แสดงผลแบบโครงร่างได้ (Interlace)
GIF89A พัฒนาขึ้นในปี ค.ศ. 1989
เป็นไฟล์กราฟิกที่พัฒนาต่อจาก GIF87 โดยเพิ่มความสามารถการแสดงผลแบบพื้นโปร่งใส (Transparent) และการสร้างภาพเคลื่อนไหว (GIF Animation) ซึ่งเป็นไฟล์กราฟิกที่มีความสามารถพิเศษโดยนำเอาไฟล์ภาพหลายๆ ไฟล์มารวมกันและนำเสนอภาพเหล่านั้นโดยอาศัยการหน่วงเวลา มีการใส่รูปแบบการนำเสนอลักษณะต่างๆ (Effects) ในลักษณะภาพเคลื่อนไหว
ไฟล์ GIF ถูกบีบอัดโดยใช้มาตราฐานเดียว ดังนั้นจึงไม่สามารถลดขนาดของไฟล์ได้โดยตรง (เหมือนอย่าง JPEG) เมื่อมีไฟล์ขนาดใหญ่ขึ้นนั่นหมายความว่า ถึงเวลาแล้วที่ควรคิดเปรียบเทียบการใช้ JPEG กับการใช้ GIF ในภาพเดียวกัน โดยอาจต้องใช้โปรแกรมแปลงภาพกราฟิกเพื่อสร้างสำเนาของภาพฟอร์แมต GIF ที่มีเป็นฟอร์แมต JPEG และนำภาพ GIF ออกจากเพจหลัก (ใช้ GIF โดยมีลิงก์จากภาพขนาดเล็กเพื่อให้คลิกไปชม)
มาตรฐานล่าสุดของ GIF คือ GIF89a มาตรฐานนี้สนับสนุนการมีรูปภาพหลายรูปในไฟล์เดียว หมายความว่าเราสามารถระบุภาพ GIF แต่ละช่วงให้ปรากฎในกรอบเดียวกันไปเรื่อยๆ ในไฟล์ HTML เรียกว่า GIF animation ซึ่งเป็นวิธีง่ายๆ เพื่อทำให้รูปภาพในเพจเคลื่อนไหวได้ด้วยชุดมาตรฐานหนึ่งของ GIF และมาตรฐาน HTML ธรรมดา โดยไม่ต้องกังวลเลยว่าจะต้องมีการทำอะไรเกี่ยวข้องกับโค้ตของเซิร์ฟเวอร์ เพราะความสามารถใหม่ที่ถูกสร้างไว้ในฟอร์แมต GIF
JPEG (Joint Photographic Experts Group)
เป็นอีกไฟล์หนึ่งที่นิยมใช้บน Internet มักใช้กรณี
1. ภาพที่ต้องการนำเสนอมีความละเอียดสูง และใช้สีจำนวนมาก (สนับสนุนถึง 24 bit color)
2. ต้องการบีบไฟล์ตามความต้องการของผู้ใช้
3. ไฟล์ชนิดนี้มักจะใช้กับภาพถ่ายที่นำมาสแกน และต้องการนำไปใช้บนอินเทอร์เน็ต
เพราะให้ความคมชัดและความละเอียดของภาพสูง
- จุดเด่น
สนับสนุนสีได้ถึง 24 bit
สามารถกำหนดค่าการบีบไฟล์ได้ตามที่ต้องการ
มีระบบแสดงผลแบบหยาบและค่อยๆ ขยายไปสู่ละเอียดในระบบ Progressive
มีโปรแกรมสนับสนุนการสร้างจำนวนมาก
เรียกดูได้กับ Graphics Browser ทุกตัว
ตั้งค่าการบีบไฟล์ได้ (compress files)
- จุดด้อย
ทำให้พื้นของรูปโปร่งใสไม่ได้
ข้อเสียของการบีบไฟล์ (Compress File)
กำหนดค่าการบีบไฟล์ไว้สูง (1 - 10) แม้ว่าจะช่วยให้ขนาดของไฟล์มีขนาดต่ำ แต่ก็มีข้อเสีย คือ เมื่อมีการส่งภาพจาก Server ไปแสดงผลที่ Client จะทำให้การแสดงผลช้ามาก เพราะต้องเสียเวลาในการคลายไฟล์ ดังนั้นการเลือกค่าการบีบไฟล์ ควรกำหนดให้เหมาะสมกับภาพแต่ละภาพ
JPEG เป็นตัวแปรที่ใช้กำหนดการจัดการของระบบบีบอัดข้อมูลรูปภาพมาตรฐานเนื่องจากรูปภาพ JPEG แตกต่างจาก GIF ตรงที่ถูกออกแบบมาเพื่อลดขนาดของไฟล์ในขณะที่ยังมีขนาดภาพเท่าเดิม นอกจากนี้ฟอร์แมตไฟล์ JPEG ยังสนับสนุนอัลกอริทึมการบีบอัดไฟล์หลายแบบ นั่นหมายความว่า ซอฟต์แวร์ที่ต่างออกไปสามารถบีบอัด JPEG ให้มีขนาดเล็กลงในขณะที่ยังรักษาคุณภาพระดับสูงของรูปภาพไว้ได้ ซึ่งใช้พารามิเตอร์ของผู้ใช้งานน้อยที่สุด ได้แก่
อัตราบิต (bit rate) คือ ค่าเฉลี่ยในการบีบอัดข้อมูล ซึ่งมีหน่วยเป็นบิตต่อพิกเซล (Bit per Pixel) และ อัตราส่วนการบีบอัดข้อมูล (compression ration) อัตราส่วนระหว่างขนาดของรูปภาพต้นฉบับต่อขนาดของรูปภาพที่ถูกบีบอัด (Original image size)
ขนาดของภาพ ค่าความละเอียดของภาพ (Resolution) และจำนวนองค์ประกอบของสี เหล่านี้ล้วนเป็นตัวกำหนดถึงขนาด
ในเรื่องคุณภาพของภาพ JPEG จะลบเฉพาะข้อมูลที่ซ้ำและข้อมูลที่ทั่วไปไม่มีความสำคัญต่อภาพออกจากไฟล์กราฟิก และส่วนมากไม่สามารถบอกได้ว่ารูปภาพถูกแก้ไขไปแล้ว
การใช้การบีบอัด JPEG จะ แบ่งออกตามอักอริธึมของการบีบอัดข้อมูล ซึ่งสามารถแบ่งออกได้ 2 แบบ คือ แบบที่ไม่มีการสูญเสีย (Lossless) กับแบบที่มีการสูญเสีย (Lossy) โดยไม่ได้หมายความว่า อัลกอริธึมของการบีบอัดข้อมูลภาพของแบบที่ไม่มีการสูญเสียจะเป็นแบบที่เหนือกว่าแบบที่มีการสูญเสีย อักอริธึมของการบีบอัดข้อมูลภาพแบบที่ไม่มีการสูญเสีย หรือ Entropy coding จะเป็นส่วนที่พยายามเก็บรักษาข้อมูลให้มีความกะทัดรัดมากที่สุดเท่าที่จะทำได้ แต่อย่างไรก็ตามอักอริธึมของการบีบอัดข้อมูลภาพของแบบที่ไม่มีการสูญเสียนี้จะถูกกำหนดขอบเขตด้วย Entropy ของข้อมูลเอง ซึ่งจะสามารถบีบอัดข้อมูลที่มีอยู่เป็นจำนวนมากได้ และจุดสำคัญคือจะมีการแยกแยะข้อมูลอย่างมีเหตุมีผล
โครงสร้างของระบบ JPEG
มาตราฐาน JPEG เปรียบเสมือนศูนย์กลางที่ครอบคลุมเทคนิคการบีบอัดข้อมูลด้านต่างๆ พื้นฐานการทำงานแบบเป็นลำดับขั้นตอน (baseline Sequentia) เป็นโหมดการทำงานของ JPEG โดยวิธีการจะใช้การเข้ารหัสแบบ Huffman และใช้แหล่งข้อมูลภาพที่มีลักษณะเป็นข้อมูลแบบ 8 บิต/พิกเซลในการทำงาน และจะไม่เกิดประโยชน์อะไรเลยถ้าหากใช้ภาพตัวอย่างที่เป็นภาพข้อมูลต่ำกว่า 8 บิต และถ้าหากจะลองทำดูก็จะพบว่าความเข้มที่มากกว่าจากพิกเซลหนึ่งจะแพร่เข้าไปสู่อีกพิกเซลหนึ่ง โดยส่งผลให้ได้ภาพที่มีอัตราบิตที่ไม่ดี และยังจะทำให้ได้คุณภาพของภาพที่แย่กว่าตามไปด้วย
มาตราฐาน JPEG จะรวบรวมทางเลือกซึ่งสนับสนุนเทคนิคการแทนที่ที่เรียกว่า "การเข้ารหัสทางตัวเลข" (Arithmetic Coding) สำหรับใช้ในการเข้ารหัสแบบ Huffman หรือมาตรฐาน JPEG ยังรวบรวมทางเลือกซึ่งสนับสนุนการขยายพิกเซลเพื่อเพิ่มควมถูกต้องของภาพ คือ มีการใช้ภาพขนาด 12 บิต แทนที่จะใช้ภาพที่มีขนาดเพียงแค่ 8 บิต นอกจากนี้โหมดการทำงานที่ไม่มีการสูญเสียก็เป็นทางเลือกอีกทางหนึ่งในการบีบอัดข้อมูลที่ไม่ต้องใบ้การแปลงแยก cosine ออกจากข้อมูล และ JPEG ยังให้โหมดการทำงานที่ทันสมัยและมีคุณค่ายิ่งในการเข้ารหัสภาพ ซึ่งจะช่วยลดไม่ให้เกิดการถอดรหัสที่ด้อยคุณภาพตั้งแต่ส่วนเริ่มต้นของไฟล์และยังจะทำให้เกิดการสร้างงานคุณภาพที่มีความละเอียดทีละน้อยอีกด้วย โดยมาตรฐาน JPEG จะเป็นตัวกำหนดตัวแปรแต่ละตัวเหล่านี้ และเป็นเรื่องง่ายๆ ในการพิจารณาถึงการบีบอัดข้อมูลขององค์ประกอบแบบสีเดียว มาตรฐาน JPEG จะกำหนดให้มีการบีบอัดข้อมูลแยกกันในแต่ละองค์ประกอบสี และแยกองค์ประกอบสีที่มีหลากสีในไฟล์ของการบีบอัดข้อมูลออกเป็นส่วนๆ เพราะฉะนั้นองค์ประกอบเดียวก็เพียงพอแล้วที่จะใช้แสดงการทำงานของอัลกอริธึมของ JPEG
อัลกอริธึมลำดัลแรก คือการแบ่งภาพให้เป็นบล็อกภาพขนาด 8 x 8 พิกเซล หลังจากนั้นจะผ่านกระบวนการทำงานบนพื้นฐานการทำงานแบบ Block by block basis คือจะผ่านข้อมูลเข้าสู่อัลกอริธึมตัวต่อไป ซึ่งจะเป็นอัลกอริธึมที่ทำการแปลง-แยก cosine (DCT) ของข้อมูลแต่ละบล็อก (การทำงานของ DCT จะคล้ายกับการแปลงฟูเรียร์ แต่ DCT จะเหมาะสมมากกว่าสำหรับกระบวนการแบบนี้) ข้อมูลเอาต์พุตหลังจากผ่านอัลกอริธึม DCT แล้ว จะกลายเป็นสัมประสิทธิ์การแปลงข้อมูล (transform Coefficient) ขนาดบล็อก 8 x 8 ที่ประกอบด้วยส่วนประกอบ DC โดยมีความสำคัญสูงกว่าส่วนอื่นๆ ค่าในส่วนประกอบ DC จะมีค่าเป็น 8 เท่าของความเข้มเฉลี่ยของพิกเซลทั้งหมดในบล็อกนั้นๆ และสัมประสิทธิ์อีก 63 ส่วนจะเป็นส่วนประกอบแบบ AC จำนวนตัวเลขจะทำให้เห็นความเข้มของคลื่น cosine แบบ 2 มิติที่วิ่งอยู่ในภาคการทำงานของอัลกอริธึม DCT ที่ทำการแยก-แปลง cosine เรียบร้อยแล้ว โดยจะมีความถี่สูงขึ้นเมื่อเคลื่อนที่จากซ้ายไปขวาหรือจากบนลงล่าง
อัลกอริธึมต่อไปคือ อัลกอริธึมของการจัดแบ่งจำนวนภาพ โดยอัลกอริธึมนี้จะแบ่ง transform coefficient แต่ละส่วนโดยการเรียงลำดับค่าภายในบล็อกขนาด 8 x 8 พิกเซลในลักษณะตัวเลขจำนวนเต็ม และเรียกกระบวนการดังกล่าวว่า "การจัดแบ่งจำนวนตารางภาพ" จากนั้นอัลกอริธึมจะทำการหมุนวนข้อมูลตัวเลขที่ถูกแบ่งและจำทำให้ได้ผลลัพธ์ของการแบ่งสัมประสิทธิ์กลับมาอยู่ในรูปแบบของบล็อก 8 x 8 พิกเซลอีกครั้ง
ส่วนอัลกอริธึมที่เหลืออยู่ต่อไปทั้งหมดจะถูกรวมเรียกว่า "กลุ่มอัลกอริธึม" ที่ใช้ในการบีบอัดข้อมูลแบบไม่มีการสูญเสีย โดยอัลกอริธึมตัวแรกของกลุ่มนี้จะทำการเข้ารหัส transform coefficient โดยใช้จำนวนของบิตที่ต่ำสุด และทำการจัดแบ่งข้อมูลออกเป็นรูปแบบซิกแซก 64 ส่วน โดยเริ่มจากส่วนประกอบที่เป็น DC และทำงานเดินหน้า ถอยหลังในแนวทะแยงมุมกับบล็อก จุดประสงค์ของการจัดการแบบซิกแซกนี้ ก็เพื่อลดการใช้งาน Zero coefficient เป็นเวลานานๆ และหากมีการจัดวางความถี่ที่ต่ำกว่าไว้ในอันดับแรก และจัดวางความถี่สูงไว้ในลำดับต่อไป ก็จะพบส่วนที่เป็นค่าศูนย์จำนวนมากในตอนท้ายๆ ซึ่งการจัดวางแบบซิกแซกสามารถแก้ไขข้อด้อยนี้ได้
หนังสือสร้างสรรค์ Web Page ให้มีเสน่ห์วันละอย่าง โดย Richard Raucci เรียบเรียงโดย นพรัตน์ วินิจวรรณกมล และ พรเทพ เซี่ยวโหล
Microcomputer.Septermber 1999.ยืน ภู่วรวรรณ
คอมพิวเตอร์รีวิว 121. กันยายน 2537
เซมิฯ 191 ธันวาคม 2541
เซมิฯ 226 กันยายน 2544