สื่อผสมในรูปแบบดิจิตัล(Digital Multimedia Part 2)

Scaling
                ในการใช้งานแบบที่สามารถทำให้ภาพมีขนาดหน้าต่างที่เล็กลง จำนวนของจุดภาพที่น้อยลงย่อมมีผลทำให้จำนวนข้อมูลที่จำเป็นต้องใช้ลดลงตามไปด้วย นอกจากนี้จำนวนของข้อมูลจะลดลงได้อีกด้วยวิธีการลดอัตราการสร้างภาพต่อวินาที (Frame Rate)  แต่มันจะทำให้ภาพที่เคลื่อนไหวเร็วมีข้อจำกัด เช่นมีอาการภาพกระตุกเนื่องจากการสร้างภาพให้เห็นอย่างต่อเนื่องไม่เร็วพอ เช่นในกรณีการใช้งานบนเครื่องโทรศัพท์มือถือทีมีสภาวะแวดล้อมของเครือข่ายที่จำกัดอาจลดอัตราการสร้างภาพเหลือเพียง 7 – 15 fps.   
Video Compression
               การบีบอัดสัญญาณวิดีโอให้มีขนาดเล็กลงเป็นกระบวนการที่ซับซ้อนและจำเป็นต้องใช้เทคนิคหลายอย่างเพื่อทำการบีบอัดให้ได้อย่างน้อยหนึ่งร้อยเท่าหรือมากกว่า ในขณะที่ยังคงรักษาระดับของคุณภาพให้เป็นไปตามวัตถุประสงค์การใช้งานได้ การบีบอัดสัญญาณวิดีโอใช้เทคนิคที่มาจากการบีบอัดข้อมูลภาพเช่นในการบีบอัดภาพแบบ JPEG ที่ใช้วิธีการของ DCT  และด้วยเหตุที่แต่ละเฟรมนำเสนอภาพที่ซ้ำๆกันเพียงแต่มีการเคลื่อนไหวเปลี่ยนแปลงเฉพาะบางส่วนของภาพเท่านั้น ดังนั้นการนำเทคนิคการพยากรณ์เฟรมถัดไปแล้วนำมาแทรกเพิ่มเข้าไปจึงถูกนำมาใช้งาน
เทคนิคการบีบอัดทั้งหมดใช้จุดเด่นของการนำมาทดแทนกันได้ของการนำเสนอสัญญาณวิดีโอเพื่อที่จะลดข้อมูลลงสำหรับการใช้งานโทรทัศน์ระบบดิจิตอล โทรทัศน์ระบบพกพา โทรทัศน์อินเตอร์เน็ท
หรือบนเครือข่ายอื่นๆ การบีบอัดข้อมูลมีทั้งแบบสูญเสียข้อมูลบางส่วนกับแบบไม่สูญเสียข้อมูล (Lossy or Lossless)  ในกรณีชนิดที่สูญเสียข้อมูลไม่ว่าในกรณีใดๆจะไม่สามารถสร้างภาพตามข้อมูลดั้งเดิมที่มีรายละเอียดสูงได้อีก
Spatial Redundancy
                ในภาพตามปกติทั่วไปจะมีพื้นที่บางส่วนหรือหลายส่วนที่มีข้อมูลเป็นจุดสร้างภาพเหมือนกันเช่น ท้องฟ้าหรือก้อนเมฆ  ในกรณีเช่นนี้การเปลี่ยนแปลงจากจุดสร้างภาพหนึ่งไปยังจุดสร้างภาพอื่นมีน้อยมาก ดังที่ได้ทราบแล้วว่าแต่ละจุดสร้างภาพประกอบด้วยข้อมูลของการส่องสว่างและข้อมูลของสี  ทั้งหมดนี้สามารถเข้ารหัสข้อมูลด้วยการทดแทนทางสถิติ เช่นการเข้ารหัสแบบ Run Length Encoding ทียอมให้นำเอาเฉพาะข้อมูลทีมีตัวแปรจะพบได้บ่อยเท่านั้นด้วยข้อมูลไม่กี่บิท
Temporal Redundancy          
                ในกรณีของภาพเคลื่อนไหว แต่ละเฟรมจะมีเฉพาะบางจุดสร้างภาพเท่านั้นที่มีการเปลี่ยนแปลงจากเฟรมก่อนหน้าและทำให้เกิดเป็นภาพเคลื่อนไหว อย่างไรก็ดีนี่ไม่ใช่กรณีที่จุดสร้างภาพจะมีข้อมูลที่เหมือนกันทั้งหมด   ที่อัตราการสร้างภาพตามปกติระดับ 25 – 30 เฟรมต่อวินาทียังมีการนำพาข้อมูลของแต่ละเฟรมที่ไม่มีความเกี่ยวข้องกับภาพเดิม ข้อมูลที่จำเป็นคือข้อมูลการเปลี่ยนแปลงจากของเดิมเท่านั้น เช่นทิศทางการเคลื่อนไหวของวัตถุในแต่ละเฟรมไปยังภาพของเฟรมอื่นก็ต้องถูกบรรจุลงไป มันมีความเป็นไปได้ที่จะมีการกำหนดให้มีเฟรมที่ถูกบรรจุข้อมูลของภาพทั้งหมดก่อนและมันจะถูกเรียกว่า I – Frame (Intra Frame) ที่จำเป็นต้องให้ข้อมูลเพียงพอสำหรับการสร้างภาพ  แล้วตามมาด้วยเฟรมที่ได้รับจากการทำนายล่วงหน้า    สำหรับเฟรมที่เกิดจากการทำนายทิศทางการเคลื่อนที่ด้วยข้อมูลจากเฟรมก่อนหน้าจะถูกเรียกว่า P - Frame (Prediction Frame)  ในกรณีของการบีบอัดแบบ MPEG – 2 ยังมีรูปแบบการทำนายเฟรมล่วงหน้าอีกอย่างทีเรียกว่า B – Frame  (Bi direction Frame)  ที่เกิดจากการอ้างอิงข้อมูลของเฟรมทั้งสองชนิดรวมกัน
Perceptual Redundancy
                ดวงตาของมนุษย์โดยปกติตามธรรมชาติแล้วมีความสามารถแยกแยะรายละเอียดขอบเขตวัตถุแบบขาวดำที่ระยะไกลได้มากกว่าการแยกแยะรายละเอียดของวัตถุที่เป็นสี ด้วยคุณสมบัติการมองเห็นของดวงตามนุษย์ที่เป็นแบบนี้ทำให้มีผลดีต่อการเข้ารหัสภาพแบบ Object – Base และ Contour – Base เช่นที่มีการนำมาใช้ในระบบของ MPEG – 4
Statistical Redundancy
                ในภาพตามธรรมชาติแล้วไม่ใช่ว่าองค์ประกอบของภาพที่ปรากฏให้เห็นด้วยความน่าจะเป็นเสมอไป ข้อเท็จจริงเช่นนี้สามารถนำมาใช้ในการเข้ารหัสองค์ประกอบของภาพที่ปรากฏบ่อยๆได้ด้วยข้อมูลจำนวนน้อยๆ  และถ้าเป็นภาพที่ไม่ค่อยได้ปรากฏบ่อยๆด้วยข้อมูลจำนวนมาก รูปแบบการเข้ารหัสชนิดนี้ทำให้สามารถนำพาจุดสร้างภาพจำนวนมากด้วยข้อมูลจำนวนน้อยๆเรียกว่า Huffman Coding
Scaling : reducing pixel count
                ตัวการสำคัญที่ทำให้ข้อมูลภาพมีจำนวนมากคือจำนวนของจุดสร้างภาพที่จำเป็นต้องส่งออกไป โดยที่แต่ละจุดสร้างภาพอาจจำเป็นต้องเข้ารหัสด้วยข้อมูลขนาด 24 bit
                ดังตัวอย่างต่อไปนี้ ในกรณีของสัญญาณวิดีโอแบบความคมชัดปกติคือ 720 x 480 , MPEG – 1 หมายถึงมีจุดสร้างภาพทั้งหมด 345.6 K pixel  แต่ในกรณีของคุณภาพระดับ VCD จะมีรายละเอียดของจุดภาพอยู่ที่ 352 x 288 เท่ากับมีจุดสร้างภาพทั้งหมดจำนวน 101.3 K pixel จะเห็นได้ว่าจำนวนจุดสร้างภาพมีเพียงแค่หนึ่งในสามเท่านั้นเอง
Compression
Format
Picture Representation
Application
Bit Rate
MPEG – 1
MPEG – 2
MPEG – 4


352 x 288 SIF
720 x 480 CCIR
176 x 144 QCIF
352 x 288 QSIF
Video CD
Broadcast TV,DVD
Internet,Mobile TV

0 – 1.5 Mbps
1.5 – 15 Mbps
28.8 – 512 Kbps


Compression  Standard
                รูปแบบการบีบอัดสัญญาณมีหลากหลายขึ้นอยู่กับการนำไปใช้งาน  ที่ผ่านมาในอดีตวิธีการบีบอัดที่มีหลายแบบเกิดจากวิวัฒนาการของเทคโนโลยีและนับวันยิ่งมีความซับซ้อนมากยิ่งขึ้น  เนื่องจากมีการพัฒนาอุปกรณ์อิเลคทรอนิคส์ให้มีความสามารถสูงขึ้นแต่มีราคาลดลงจากอดีตเป็นอย่างมาก
MPEG – 1
       นี่คือมาตรฐานการเข้ารหัสสื่อผสมยุคเริ่มต้น มันถูกออกแบบสำหรับใช้งานกับแผ่น CD และด้วยข้อจำกัดที่รายละเอียดภาพ 352 x 288 25 fps  PAL ,  352 x 240 30 fps NTSC เท่ากับระบบอนาลอกแต่มันใช้วิธีการสแกนแบบ progressive โดยมีอัตราการส่งข้อมูลอยู่ที่ระดับ 1.5 Mbps สามารถมีสัญญาณเสียงสองช่องที่ต่อมาระบบของการบันทึกเสียงแบบนี้ได้รับความนิยมมากคือ MP3
MPEG – 2
                เป็นมาตรฐานการบีบอัดที่ในปัจจุบันถูกนำมาใช้งานอย่างกว้างขวาง เริ่มต้นประกาศใช้งานอย่างเป็นทางการในปี 1994 และปัจจุบันถูกนำมาใช้เป็นมาตรฐานเพื่อการออกอากาศโทรทัศน์มากที่สุดพอๆกับการนำไปใช้งานเพื่อการบันทึกแผ่นดีวีดี  มันถูกออกแบบให้รองรับวิดีโอที่มีรายละเอียดสูงสุดรวมทั้งวิดีโอแบบ HDTV สำหรับสัญญาณวิดีโอที่มีความคมชัดตามปกติแล้วจะมีอัตราการส่งตั้งแต่ 1.5 – 15 Mbps  สำหรับการใช้งานเพื่อส่งสัญญาณไปออกอากาศตามมาตรฐานของ CCIR601 จะอยู่ที่ระดับ 15 Mbps แต่ในทางปฏิบัติแล้วแค่ระดับ 2.5 Mbps ก็พอใช้งานได้แล้ว  สำหรับการใช้งานเพื่อทำงานในห้องสตูดิโอจะใช้เฉพาะ I – Frame ไม่ได้นำเอา B – Frame กับ P –Frame มาร่วมด้วยเพื่อให้เหมาะสมกับการตัดต่อทำให้อัตราความเร็วอยู่ทีระดับ 50 Mbps
                MPEG – 2 มีโครงสร้างที่สามารถรองรับการนำไปใช้งานเพื่อการเชื่อมโยงสัญญาณที่อาจจะมีภาพกับเสียงรวมถึงข้อมูลจำนวนหลายช่องได้ ซึ่งมันจะมีข้อมูลเพื่อบ่งชี้และรวมสัญญาณไปด้วยกันทีเรียกว่า PAT (Program Association Table)  นอกจากนี้ยังมีความสอดคล้องเข้ากันได้กับ MPEG – 1  และสามารถถูกนำพาโดยสื่อทีแตกต่างกันได้   รวมไปถึงการนำไปใช้งานเพื่อการออกอากาศเพื่อเครื่องรับประเภทพกพาเคลื่อนที่ได้อีกหลายประเภท

MPEG – 4

                เป็นวิธีการบีบอัดสัญญาณวิดีโอด้วยความแตกต่างจากรูปแบบเดิมของทั้ง MPEG – 1 , MPEG – 2 ด้วยการพิจารณาองค์ประกอบของภาพว่าประกอบด้วยฉากพื้นหลังและวัตถุที่เป็นองค์ประกอบในภาพนั้น ภายใต้การทำงานของ MPEG – 4  ภาพจะถูกวิเคราะห์และบ่งชี้ว่าอะไรคือฉากพื้นหลังและมีวัตถุหลายอย่างที่มีการเคลื่อนไหวซ้อนทับอยู่ในภาพ  ตัววัตถุจะถูกบ่งชี้แล้วทำการบีบอัดข้อมูลแยกออกต่างหาก ตัวข้อมูลของวัตถุทีมีการเคลื่อนไหวจะถูกรวมเข้าไปเป็นส่วนหนึ่งของสัญญาณวิดีโอ เมื่อมันถูกส่งไปถึงปลายทางตัวถอดรหัสจะทำการสร้างภาพขึ้นใหม่ด้วยการรวมฉากพื้นหลังเข้ากับวัตถุที่เคลื่อนไหวแต่ละอันรวมไปถึงทิศทางการเคลื่อนที่เข้าไปด้วย   ทำให้ระบบของ MPEG – 4 มีความสามารถทำการบีบอัดข้อมูลได้มากกว่าและมีอัตราการส่งข้อมูลที่น้อยกว่าแบบ MPEG – 2  ทำให้มีความเหมาะสมต่อการนำไปใช้เพื่อการส่งวิดีโอแบบต่อเนื่อง (streaming)  และด้วยเหตุที่มีมาตรฐานในการแยกวัตถุต่างๆออกจากกัน ทำให้เหมาะสมต่อการใช้งานในรูปแบบภาพสามมิติทั้งประเภทเกมและสื่อผสมอื่นๆ เช่นบนอินเตอร์เน็ท  การผลิตและการออกอากาศรายการโทรทัศน์แบบดิจิตอล

PROFILE
LEVEL      VIDEO
RESOLUTION    BIT RATE
MAX NO OFF OBJECTS
Simple  Profile
L1       QCIF
L2       CIF
L3       CIF
176 x 144  64 Kbps
352 X 288  128Kpbs
352 x 288   384Kpbs
4
4
4
Core  Profile
L1       QCIF
L2       CIF
176 x 144   384Kbps
352 x 288    2 M bps
4
16
Main  Profile
L2       CIF
L3       ITU 601
L4       HD
352 x 288    2 M bps
720 x 480    15 M bps
1920 x 1088 38.4 Mbps
16
32
32
  นอกจากนี้การเข้ารหัสแบบ MPEG – 4 ยังได้รับการพัฒนาต่อมาอีกด้วยความร่วมมือกันระหว่าง MPEG (Moving Picture Expert Group) และ VCEG (Video Coding Expert Group) โดยมีการประกาศมาตรฐานการเข้ารหัสแบบใหม่ในปี 2003 เรียกว่าระบบ H.264/AVC โดยมีการปรับปรุงและพัฒนาให้การเข้ารหัสมีประสิทธิภาพมากยิ่งขึ้นและเหมาะสมต่อการปรับเปลี่ยนการใช้งานบนเครือข่ายของอินเตอร์เน็ททั้งแบบมีสายและแบบไร้สาย   รวมไปถึงการนำไปใช้เป็นมาตรฐานของ HD – DVD    และ Blue – ray DVD  เป็นต้น

TV and  Video

                มันเป็นเรื่องสำคัญทีจะทำความเข้าใจถึงความแตกต่างกันระหว่างทั้งสองประเภทนี้โดยพิจารณาเปรียบเทียบโดยละเอียดระหว่างวิดีกับโทรทัศน์  ในโลกของโทรทัศน์คือคุณสมบัติของการใช้วิธีสแกนแบบแทรกสอดเพื่อให้ประหยัดช่องสัญญาณส่งออกอากาศที่มีจำกัด และใช้ข้อกำหนดอัตราการสร้างภาพกับรายละเอียดภาพและสีด้วยวิธีการแบบอนาลอก  ทำให้มีมาตรฐานระบบต่างกันเป็น NTSC , PAL , SECAM  และถึงแม้ว่าในระบบทีวีแบบดิจิตอลเองแล้วยังต้องมีความแตกต่างกัน ว่าอิงกับระบบอนาลอกเดิมแบบใดเช่นอัตราการสร้างภาพ  จำนวนจุดภาพทั้งแนวตั้งและแนวนอนที่มีความแตกต่างกัน แต่ในโลกของวิดีโอมันจะไปเกี่ยวข้องกับการนำไปใช้งานบนเครือข่ายอินเตอร์เน็ทและถูกนำเสนอบนจอภาพของเครื่องคอมพิวเตอร์ที่ใช้วิธีการสร้างภาพแบบ Progressive scan

Video Files
                ข้อมูลที่เป็นวิดีโอไม่จำเป็นต้องถูกนำส่งออกไปภายหลังจากการบีบอัดข้อมูลเสมอไป ตามปกติมันจำเป็นต้องถูกจัดเก็บอยู่ในรูปแบบของแฟ้มข้อมูลและใช้งานเกี่ยวข้องกับอุตสาหกรรมสื่อผสม แฟ้มข้อมูลมีอยู่หลายแบบที่ต้องขึ้นอยู่กับระบบปฏิบัติการโดยเฉพาะของมันเองและส่วนมากถูกจัดเก็บไว้ในเครื่องคอมพิวเตอร์  หรือไม่ก็ขึ้นอยู่กับมาตรฐานการบีบอัดที่นำมาใช้งาน ในปัจจุบันนี้การแปลงไฟล์ของวิดีโอกระทำได้ง่ายมากด้วยการใช้ซอฟแวร์ที่มีหลากหลายโปรแกรมให้เลือกใช้
The Window AVI Format (. Avi)
                AVI (Audio Video Interleaved) เป็นมาตรฐานสำหรับวิดีโอที่ใช้งานอยู่บนเครื่องคอมพิวเตอร์ที่ใช้ระบบปฏิบัติการวินโดว์ ที่มีอุปกรณ์เข้ารหัสติดมาด้วยสำหรับสร้างวิดีโอแบบ AVI  ด้วยการสุ่มสัญญาณภาพและเสียงที่ป้อนให้โดยปราศจากการบีบอัด  ด้วยเหตุนี้มันถูกใช้เพื่อการจัดเก็บไว้ภายในเครื่องคอมพิวเตอร์แต่ไม่ใช่สำหรับส่งผ่านเครือข่าย

Window Media Format (.wmv)
                เป็นรูปแบบวิดีโอของบริษัทไมโครซอฟท์และใช้งานอยู่บนวินโดว์มีเดีย 9 ที่เป็นทั้งตัวเข้ารหัสกับถอดรหัสและเป็นเครื่องเล่นสื่อด้วย แต่ถ้าต้องการเอามันไปใช้บนเครื่องคอมพิวเตอร์ที่มีระบบปฏิบัติการแบบอื่นก็จำเป็นต้องมีซอฟแวร์เฉพาะ

MPEG  Format (. mpg)
                เป็นดังชื่อของมันเองคือวิดีโอและออดิโอที่ถูกบีบอัดให้เป็นทั้งแบบ MPEG – 1 , MPEG – 2 ข้อมูลไฟล์แบบนี้ถือว่าเป็นมาตรฐานสากล  เพราะเครื่องคอมพิวเตอร์ที่มีระบบปฏิบัติการทั้งแมคและวินโดว์รองรับการใช้งานทั้งคู่

Quick Time Format (. mov)
                ควิคไทม์เป็นรูปแบบวิดีโอที่เป็นของบริษัทแอปเปิ้ลคอมพิวเตอร์ มันถูกนำไปใช้งานทั้งในวงการอุตสาหกรรมวิดีโอพอๆกับการใช้งานด้านกราฟฟิคและการนำเสนอผลงาน  อย่างไรก็ดีมันมีความใกล้เคียงกับระบบ MPEG – 4 และระบบของ H.264/AVC   เครื่องเล่นสื่อแบบควิคไทม์พบเห็นได้ในระบบปฏิบัติการของเครื่องคอมพิวเตอร์เกือบทั้งหมด
RealMedia Format (. rm)
              รูปแบบของมันเริ่มเป็นที่นิยมมากขึ้นตามปริมาณการใช้งานบนอินเตอร์เน็ท ทั้งนี้ตัวโปรแกรมในการผลิตและเครื่องเล่นสื่อแบบพื้นฐาน  สามารถหาดาวโหลดได้ฟรี ตัวเว็บไซด์เองทั้งหมดรองรับเนื้อหาที่เป็นเรียลฟอร์แมท

Flash Video (. flv)
                รูปแบบวิดีโอแบบนี้ได้รับความนิยมมากขึ้นเนื่องจากมันถูกใช้งานเพื่อการนำส่งวิดีโอชนิดที่เรียกว่า web – based   การนำไฟล์ไปใช้งานทำได้ด้วยโปรแกรม Adobe Flash Player  รวมไปถึงโปรแกรมแบบที่มีมาพร้อมกับตัวเว็บเบราเซอร์เอง (Plug – in)  มันถูกนำมาใช้กับเว็บไซด์ยอดนิยมอย่าง YouTube , Google , Yahoo ตัวโปรแกรมเครื่องเล่นสื่อสามารถหาดาวโหลดและติดตั้งได้ฟรี
The  DivX  Format
             ได้ชื่อมาจากตัวเข้ารหัสที่เป็นของบริษัท DivX Inc. ที่นอกจากจะสามารถใช้เครื่องเล่นด้วยตัวโปรแกรมเล่นสื่อของตัวเองแล้ว ยังสามารถนำตัวโปรแกรมของมันไปไว้บนโปรแกรมเล่นสื่ออื่นเช่นวินโดว์มีเดียก็ได้   ตัวสื่อเองก็ทำให้เป็นทั้งวิดีโอสตรีมและออดิโอสตรีมได้หลายช่องพร้อมกันและยังสามารถใส่ซับไตเติ้ลลงไปได้อีก  มีรายละเอียดภาพให้เลือกใช้ได้หลายระดับตั้งแต่การใช้งานสำหรับอุปกรณ์ประเภทพกพาไปจนถึงระดับความชัดเจนสูงแบบ HD  และที่สำคัญคือมันสามารถบีบอัดข้อมูลของแผ่น DVD ตามปกติที่มีข้อมูลขนาด 4.7 GB ให้เหลือเพียงแค่ 700 MB ซึ่งมีผลดีทำให้การดาวโหลดข้อมูลจากอินเตอร์เน็ทใช้เวลาน้อยลงไป นอกจากนี้มันยังถูกนำไปใช้กับเครื่องเล่นเกมเช่น Sony PlayStation
MXF File  Format
                ได้ชื่อมาจากคำเต็มว่า (material exchange format) และเป็นมาตรฐานที่ได้ยอมรับให้นำมาใช้งานกับอุปกรณ์วิดีโอแบบมืออาชีพจำพวกเครื่องตัดต่อแบบนอนลิเนียร์และอุปกรณ์จัดเก็บข้อมูลที่ใช้บันทึกวิดีโอ ข้อมูลทีเป็นแบบ MXF เป็นตัวบ่งชี้ว่าตัวที่ใช้บรรจุเอกสารภายในจะสามารถรองรับข้อมูลภาพและเสียงที่เป็นหลายประเภทได้ทำให้การเปิดแฟ้มข้อมูลเป็นไปตามมาตรฐาน ด้วยการทำให้มันมีตัวห่อหุ้มแฟ้มข้อมูลเหมือนกันซะเลย (ด้วยการกำหนดของMXF) นี่เป็นการช่วยให้มีความง่ายต่อการจัดส่งหรือการบันทึกเนื้อหาข้อมูลวิดีโอ  นอกจากนี้มันยังมีความสามารถทีรองรับการใช้งานแบบ metadata ซึ่งเป็นเรื่องที่สำคัญมากสำหรับสภาพแวดล้อมที่ประกอบด้วยอุปกรณ์หลายชนิดใช้งานร่วมกัน
File  Containers  and  Wrappers
 จากที่ผ่านมาจะเห็นได้ว่ามีมาตรฐานการบีบอัดและจัดเก็บข้อมูลเป็นแฟ้มข้อมูลวิดีโออยู่หลายแบบ บางชนิดก็เป็นแบบที่เป็นการใช้งานเฉพาะตัวเช่นวินโดว์มีเดียและเรียลวิดีโอ  แบบอื่นที่เหลือตั้งอยู่บนพื้นฐานของความแตกต่างของวิธีการห่อหุ้มข้อมูลภาพและเสียงที่ถูกบีบอัดตามมาตรฐาน ตัวห่อหุ้มจะทำหน้าที่กำหนดประเภทของภาพและเสียงที่นำเสนอ  และข้อมูลที่ประกอบด้วยชื่อหัวเรื่อง ชื่อของผู้ผลิตหรือรายละเอียดอื่นๆ    เรามักจะเห็นวิดีโอที่มีหลากหลายรูปแบบเช่นวิดีโอที่เกิดจากการส่งออกอากาศของสถานีส่ง  วิดีโอที่ผ่านเครือข่ายอินเตอร์เน็ทหรือาจเป็นวิดีโอที่อยู่ในรูปแบบของแฟ้มข้อมูล เราจะพบว่าแม้ดูจากภายนอกเป็นครั้งแรกดูเสมือนว่ามันเป็นความแตกต่างกันก็ตาม  แต่ในความเป็นจริงแล้วทั้งหมดตั้งอยู่บนพื้นฐานของมาตรฐานธรรมดาไม่กี่ชนิดเอง
          ในกรณีของภาพและเสียงที่จำเป็นต้องจัดเก็บให้อยู่ในรูปแบบแฟ้มข้อมูลแล้ว  วิธีการทั่วไปคือการใช้ภาชนะจัดเก็บหรือเรียกง่ายๆว่าหาถังมาบรรจุภาพและเสียง  ซึ่งต่อมาภาพและเสียงก็ถูกวางไว้ในตัวห่อหุ้มแฟ้มอีกทีหนึ่งที่จะทำหน้าที่บรรยายถึงชนิดของเนื้อหาภาพและเสียงรวมไปถึงข้อมูลรายละเอียดที่เกี่ยวข้อง  แฟ้มข้อมูลที่ถูกจัดเก็บเหล่านี้เป็นที่รู้จักรับรู้ได้โดยการใช้ตัวห่อหุ้มที่เหมาะสมเช่น QuickTime , Flash Video , MP4 , DivX , MPEG หรือชนิดอื่นใดก็ตาม
File  Format  Converters
                การเปลี่ยนแปลงไฟล์เป็นเรื่องจำเป็นต้องกระทำและพบบ่อยในมุมมองของการบันทึก การจัดเก็บ     การตัดต่อ และการจัดส่ง ในกรณีที่พบบ่อยมากที่สุดซึ่งแฟ้มข้อมูลเป็นระบบเปิด การแปลงรูปแบบไฟล์คือกระบวนการเปลี่ยนตัวห่อหุ้มให้อยู่ในรูปแบบที่ต้องการเช่น QuickTime ,  MXF ด้วยโปรแกรมแปลงไฟล์ที่มีหลายแบบให้เลือกใช้ตามต้องการ
Audio  Coding
                มีหลายวิธีในการนำเสนอสัญญาณเสียง ขึ้นอยู่กับว่าเป็นชนิดที่ถูกบีบอัดหรือไม่และใช้มาตรฐานการบีบอัดชนิดใด  รูปแบบของมันเป็นไปตามระบบปฏิบัติการของเครื่องคอมพิวเตอร์นั้นๆ
                มาตรฐานของระบบเสียงยังคงขึ้นอยู่กับการนำไปใช้งานด้านใด เช่นถ้าเป็นดนตรีต้องการเสียงที่มีคุณภาพสูงที่มีย่านความถี่ 20 – 20 KHz ที่มีสองช่องหรือมากกว่า  แต่ถ้าเป็นเครื่องโทรศัพท์เคลื่อนที่ใช้เพียง 100 Hz – 4 KHz สำหรับเสียงพูดคุยก็เพียงพอ
Audio Sampling Basics
                ย่านความถี่เสียงที่หูมนุษย์ได้ยินเริ่มต้นจาก 20 Hz ถึง 20 KHz และเพื่อให้รองรับย่านความถี่เสียงในแบบดิจิตอลแล้ว มีความจำเป็นต้องนำเอาความถี่เสียงมาสุ่มระดับค่าด้วยอัตราความถี่สูงเป็นอย่างน้อยของความถี่สูงสุด เช่นดังต่อไปนี้
-                   Audio CD : 44.1 KHz 16 bit
-                   DATs : (Digital Audio Tapes) : 48 KHz 16 bit
-                   DVDs : 48 – 192 KHz 16 – 24 bit
ยิ่งมีจำนวนบิทที่จำเป็นต้องเข้ารหัสมากขึ้นก็ยิ่งทำให้ได้รับระดับย่านของการเปลี่ยนแปลงระดับความดังของเสียงมากขึ้นตามไปด้วย  แต่ถ้าใช้จำนวนบิทน้อยก็จะทำให้เกิดสัญญาณรบกวนและสูญเสียความเป็นธรรมชาติไป  กระบวนการของการสุ่มเสียงและการเข้ารหัสก่อให้เกิดข้อมูลเสียงแบบ PCM (Pulse Code Modulated)  ที่นิยมใช้งานในห้องสตูดิโอบันทึกเสียง
Audio  Interfaces
                เมื่อนำเอาสัญญาณเสียงมาเข้ารหัสเช่นการแปลงให้เป็น PCM  มันจะประกอบด้วยข้อมูลที่เรียงต่อเนื่องกันไป (bit stream) ทำให้มีความจำเป็นต้องมีการเชื่อมต่อกันตามรูปแบบข้อมูลเสียงด้วย เช่นตัวอย่างของระบบ AES – 3 (Audio Engineering Society) หรือของ EBU (European Broadcast Union) เป็นมาตรฐานการเชื่อมต่อทางกายภาพของเสียงด้วยการใช้สายสองเส้นคู่และหุ้มฉนวนป้องกันการรบกวนที่สามารถใช้งานได้ที่ระยะประมาณไม่เกิน 100 เมตร ในกรณีตามปกติจะมีอัตราการส่งข้อมูลที่ระดับ 2 – 3 Mbps ขึ้นอยู่ที่อัตราการสุ่มข้อมูลAudio Compression
                ในการนำไปใช้งานเกือบทั้งหมด สัญญาณเสียงจำเป็นต้องถูกนำส่งด้วยระดับความเร็วต่ำเพื่อให้ใช้ช่องสัญญาณเท่าที่จำเป็น ดังนั้นจึงมีความจำเป็นต้องทำการบีบอัดก่อน
Audio Source
Frequency Band
Sampling Rate
Speech Telephony
Wideband Speech
Music
Music (CD Quality)
Music (Professional / Broadcast
200 Hz – 3.4 KHz
100 Hz – 7 KHz
50 Hz – 15 KHz
20 Hz – 20 KHz
20 Hz – 20 KHz

8 KHz
16 KHz
32 KHz
44.1 KHz
48 KHz
การบีบอัดสัญญาณเสียงตั้งอยู่บนพื้นฐานจากคุณลักษณะของหูคนที่ซึ่งไม่สามารถรับฟังเสียงทุกความถี่ได้เท่าเทียมกัน ด้วยการใช้คุณสมบัติประการสำคัญดังกล่าวทำให้สามารถนำเอามาใช้งานเพื่อการบีบอัดสัญญาณเสียงได้ หูของเราไม่สามารถแยกแยะเสียงที่เป็นสเตอริโอได้ที่ความถี่ต่ำกว่า 2 KHz  ดังนั้นจึงสามารถส่งสัญญาณที่มีความถี่ต่ำแบบโมโน  และถ้าเป็นระดับเสียงเบาๆแล้วหูก็จะได้ยินเฉพาะย่านความถี่เสียงกลางเท่านั้นเอง  แต่ถ้าเป็นระดับเสียงที่ดังมากๆแล้วมันจะกลบเสียงที่มีความถี่ใกล้เคียงไปเลย ในกรณีเช่นนี้การบีบอัดก็สามารถละทิ้งเสียงที่ใกล้เคียงดังกล่าวได้เลย
Audio Compression and Coding Principle
                การเข้ารหัสสัญญาณเสียงใช้ผลทีได้รับจากทฤษฎีที่มาจากการรับฟังเสียงของหูมนุษย์ด้วยการตัดข้อมูลที่ไม่จำเป็นออกไป เทคนิคที่สำคัญคือการแบ่งแยกเสียงออกเป็นหลายย่านความถี่จำนวนมาก แล้วตัดย่านความถี่ที่จะถูกบดบังด้วยเสียงที่ดังกว่าออกไป
 MPEG compression
                การเข้ารหัสแบบนี้ได้รับการพัฒนาให้เป็นมาตรฐานของการเข้ารหัสเสียงที่ยอมรับกันและถูกนำไปใช้อย่างกว้างขวางในวงการอุตสาหกรรมที่เกี่ยวข้อง สำหรับการเข้ารหัสเสียงหนึ่งที่นิยมใช้และรู้จักกันอย่างกว้างขวางคือแบบ MPEG – 1 Layer 3 (MP3)  ที่ถูกนำมาใช้ทั้งในเครื่องเล่นสื่อและบนอินเตอร์เน็ทรวมไปถึงการนำไปใช้กับระบบเสียงของ VCD อีกด้วย   อันที่จริง MPEG – 1 มันมีถึงสามระดับ (3 Layer)โดยมีความแตกต่างกันที่ความซับซ้อนและกระบวนการเข้ารหัส  เช่นระดับหนึ่งใช้งานใน digital compact cassettes  และระดับสองถูกนำมาใช้เพื่อการออกอากาศรายการวิทยุแบบดิจิตอล
Advanced Audio Coding (AAC)
                ด้วยเหตุที่ระบบมาตรฐานของการออกอากาศรายการโทรทัศน์แบบดิจิตอลคือ MPEG – 2 ทำให้มีมาตรฐานการเข้ารหัสเสียงแบบก้าวหน้าเกิดขึ้นเรียกว่าแบบ AAC  มันถูกพัฒนาขึ้นด้วยการนำเอา MP3 มาปรับปรุงให้มีประสิทธิภาพสูงขึ้น  และเช่นเดิมมันมีสามระดับด้วยกัน
Audio Codecs in MPEG – 4
                การเข้ารหัสของมันก็อยู่ในตระกูลเดียวกับที่ผ่านมาแต่ถูกทำให้มีความซับซ้อนมากยิ่งขึ้นเพื่อให้มีประสิทธิภาพในการบีบอัดข้อมูลได้สูงกว่าเดิมและมีความเข้ากันได้กับของเดิมเช่น MPEG – 4 AAC กับ MPEG – 2 AAC เป็นต้น  สำหรับการเข้ารหัสแบบนี้ได้รับความนิยมมากขึ้นเนื่องจากมันถูกนำไปใช้บนเครื่องเล่นของ Apple iPod และบนโปรแกรม iTunes  ข้อดีทางเทคนิคอื่นอีกคือมันสามารถนำไปใช้งานแบบมีเสียงหลายช่องได้และยังมีคุณสมบัติที่ปรับเปลี่ยนอัตราการส่งข้อมูลได้ทำให้เหมาะสมกับการใช้งานบนเครือข่ายอินเตอร์เน็ทมากยิ่งขึ้น
The AMR – WB + Codec
                มาจากคำเต็มว่า adaptive  multi rate wideband codec เนื่องจากความต้องการนำไปใช้งานบนสภาวะแวดล้อมของอุปกรณ์ประเภทพกพาเช่นโทรศัพท์มือถือ การเข้ารหัสจะสามารถรองรับเนื้อหาที่แตกต่างกันหลายประเภทเช่น เสียงคนพูด กีฬา ข่าว เพลง โดยที่มีอัตราการส่งข้อมูลต่ำๆแต่ยังมีคุณภาพที่ยอมรับได้ ด้วยเหตุนี้การปรับเปลี่ยนอัตราการรับส่งข้อมูลต้องมีความเร็วมากพออยู่ที่ตั้งแต่ 6 Kbps – 48 Kbps สำหรับเสียงแบบสเตอริโอ
Streaming
                การให้บริการเนื้อหาแบบต่อเนื่องเช่นวิดีโอเริ่มเป็นเทคโนโลยีที่นิยมมากยิ่งขึ้นเนื่องจากการเจริญเติบโตของอินเตอร์เน็ทตั้งแต่ปี 1990 เป็นต้นมา  ถ้าเป็นวิธีการดาวโหลดข้อมูลขนาด 20 MB ที่สามารถนำมาดูเพียงสามนาทีผู้ชมอาจต้องเสียเวลารอคอยมากกว่านั้นด้วยซ้ำไป  แต่ถ้าเป็นวิธีการแบบสตรีมมิ่งแล้วสัญญาณภาพและเสียงจะถูกนำส่งไปยังผู้รับอย่างต่อเนื่องตั้งแต่เริ่มต้นเลย ทำให้เป็นผลดีต่อผู้ใช้งาน
                กระบวนการเช่นนั้นมีความเป็นไปได้ด้วยการใช้วิธีการเข้ารหัสที่มีประสิทธิภาพสูงและวิธีการทำให้เกิดข้อมูลแบบต่อเนื่องด้วยการปรับเปลี่ยนจากรูปแบบที่ถูกจัดเก็บ (storage format)ไปเป็นรูปแบบที่บรรจุหีบห่อ (packetized format) พร้อมสำหรับการจัดส่งไปบนเครือข่ายอินเตอร์เน็ท
Streaming Network Architecture
                การจัดส่งข้อมูลแบบต่อเนื่องมีส่วนเกี่ยวข้องดังต่อไปนี้ นำเอาเนื้อหาที่ต้องการส่งมาเข้ารหัส  แล้วทำการแปลงข้อมูลให้พร้อมเพื่อส่งต่อไปยังเครื่องเซิฟเวอร์เพื่อให้ทำหน้าที่ส่งข้อมูลออกไปตามเครือข่าย  และเมื่อข้อมูลไปถึงผู้รับก็สามารถใช้โปรแกรมเล่นสื่อเพื่อการรับชมได้
                กระบวนการทำงานแบบส่งข้อมูลเนื้อหาแบบต่อเนื่องนี้ทำได้โดยการพัฒนาโปรแกรมของบริษัทชั้นนำเช่น  RealNetworks ,   Microsoft Windows Media Platforms , Apple QuickTime Multimedia โปรแกรมการใช้งานทั้งหลายเหล่านี้ได้รับความนิยมและนำไปใช้งานอย่างแพร่หลาย
The Capture and Encoding Processes
                การจัดเก็บภาพวิดีโอจะเป็นเรื่องเกี่ยวข้องกับการยอมรับให้ขบวนของข้อมูลภาพและเสียงที่เหมาะสมกับรูปแบบที่พีซีการ์ดรู้จักทำการบันทึกอย่างต่อเนื่อง สัญญาณขาเข้าของพีซีการ์ดอาจเป็นแบบที่ถูกบีบอัดมาก่อนแล้วหรือว่ายังไม่ถูกบีบอัดก็ได้ โดยที่ภายหลังจากผ่านการบีบอัดแล้วแฟ้มข้อมูลจะถูกจัดเก็บอยู่ในรูปแบบที่เหมาะสมเช่น .mpg หรืออาจเป็น .mp4 ขึ้นอยู่กับตัวเข้ารหัสนั้นๆ
File Conversion  To Streaming Format
 ในการต้องการทำให้แฟ้มข้อมูลถูกนำส่งออกไปแบบขบวนของภาพเคลื่อนไหวตามความเป็นจริง  มันจำเป็นต้องมีข้อมูลการควบคุมเรื่องของเวลา  ที่ซึ่งสามารถใช้โดยเครื่องเซิฟเวอร์สำหรับบริหารจัดการอัตราการนำส่ง  ด้วยวัตถุประสงค์เช่นนี้แฟ้มข้อมูลจึงถูกแปลงให้เป็นรูปแบบของกระแสข้อมูลที่เรียกว่าสตรีมมิ่ง ด้วยการเพิ่มข้อมูลการควบคุมเวลาลงไปด้วย
Streaming  Serving
เป็นวิธีการทำงานแบบพิเศษเฉพาะที่ถูกใช้ในเครื่องแม่ข่ายเพื่อการจัดส่งข้อมูลที่ถูกบรรจุลงในหีบห่อแล้วอย่างต่อเนื่องบนเครือข่ายอินเตอร์เน็ทไปยังเครื่องของลูกข่าย  การทำงานแบบนี้เป็นรูปแบบของการแลกเปลี่ยนสื่อผสมที่ได้มีการพัฒนาขึ้นมาโดยวิธีการหลายอย่างประกอบด้วย RTP (real time protocol)  RTCP (real time control protocol)  RTSP (real time streaming protocol)
กระบวนการเหล่านี้เกี่ยวข้องกับช่องทางสองช่องที่แยกออกจากกันคือช่องทางการควบคุมและช่องทางของข้อมูลวิดีโอก่อให้เกิดการนำส่งข่าวสารอย่างต่อเนื่อง  รวมไปถึงข้อมูลป้อนกลับของเครื่องลูกข่ายไปยังแม่ข่าย เช่นเครื่องลูกข่ายจะให้ข้อมูลถึงหมายเลขและจำนวนของพัสดุที่ได้รับรวมไปถึงคุณภาพของข้อมูล  ตัวแม่ข่ายก็จะทราบว่ามีสภาวะผิดปกติอะไรบ้างเพื่อทีจะได้จัดส่งข้อมูลตามที่เครื่องลูกข่ายต้องการเป็นต้น ตัวอย่างเช่นเครื่องแม่ข่ายอาจจัดส่งข้อมูลที่อัตราตั้งแต่ 64 Kbps , 128 Kbps , 256 Kpbs หรืออาจเลือกอัตราการสร้างภาพที่ต่ำลงมาเนื่องจากข้อจำกัดของช่องสัญญาณเอง
Streaming Serving and Bandwidth Management
           เครื่องแม่ข่ายและเครื่องลูกข่ายจะทำการเชื่อมต่อกันอยู่ในสภาวะของการร่วมมือกันทำงาน ถ้าหากว่าอัตราการส่งข้อมูลลดลงเนื่องจากการเชื่อมต่อมีปัญหา ตัวเครื่องลูกข่ายจำเป็นต้องส่งสัญญาณไปยังเครื่องแม่ข่ายเพื่อให้ทำการแก้ไขที่อาจมีการลดอัตราการสร้างภาพต่อวินาทีลง กระบวนการเช่นนี้เป็นการติดต่อกับลูกข่ายเฉพาะรายตัวไปและมีคำจำกัดความว่าเป็นการเชื่อมต่อแบบ Unicast สำหรับเครื่องลูกข่ายแต่ละเครื่องจะมีข้อมูลที่ส่งมาจากเครื่องแม่ข่ายเป็นอิสระจากข้อมูลที่ส่งไปยังเครื่องลูกข่ายอื่นๆ (เป็นอิสระจากกันทั้งช่องข้อมูลและช่องการควบคุม) นี่คือกระบวนการทำงานของการให้บริการแบบสตรีมมิ่งอย่างสมบูรณ์ การเชื่อมต่อแบบนี้อาจดูเหมือนว่าไม่ได้เป็นการทำงานตามอุดมคตินักเมื่อมีผู้เข้ามาใช้งานที่เป็นเนื้อหาเดียวกันจำนวนมาก และก่อให้เกิดการจัดส่งข้อมูลพร้อมกันทีเดียวหลายช่อง
Streaming  Player  and  Servers
                มีวิธีการเข้ารหัสและกระบวนการทำงานแบบแม่ข่ายสตรีมมิ่งอยู่หลายแบบ  แต่ที่ได้รับความนิยมและนำไปใช้งานอย่างแพร่หลายมีดังนี้
RealNetworks
                การทำงานประกอบด้วยตัวเข้ารหัสและตัวแม่ข่าย ตัวข้อมูลที่เป็น RealVideo เองตั้งอยู่บนกฎเกณฑ์ของการเข้ารหัสแบบ MPEG – 4  มันสามารถทำการเข้ารหัสด้วยอัตราที่แตกต่างกันได้และทำการส่งข้อมูลได้หลายระดับความเร็วเช่นกันด้วยการรับข้อมูลป้อนกลับจากเครื่องลูกข่ายเช่นจาก 64 Kbps – 128 Kbps
Microsoft  Windows  Media  Format
                ทั้งตัวเข้ารหัสและตัวถอดรหัสรวมไปถึงเครื่องเล่นสื่อเองทั้งหมดเป็นของบริษัทไมโครซอฟท์  สำหรับตัวเข้ารหัสรองรับวิดีโอได้หลายชนิดเช่น . avi  ,  . wmv  ,  .afs  โดยที่ทั้งหมดเป็นการทำงานภายใต้ระบบปฏิบัติการของวินโดว์เอง
Apple  QuickTime
                มันเป็นชุดเครื่องมือที่สมบูรณ์แบบที่รองรับสื่อผสมและการทำงานแบบสตรีมมิ่ง มีทั้งตัวเครื่องเล่นสื่อที่เป็นโปรแกรมและแบบที่เป็นชนิด plug – in บนโปรแกรมเบราเซอร์ มันสามารถรองรับทั้งภาพ  เสียง
บทสรุป
           เท่าที่ผ่านมาจะเห็นได้ว่าองค์ประกอบหลักของสื่อผสมก็คือภาพ ขนาดของภาพถูกกำหนดโดยจุดสร้างภาพ (pixel) และมีผลต่อขนาดของข้อมูลที่ต้องการนำเสนอ และขนาดของข้อมูลก็สามารถทำให้มีขนาดลดลงด้วยวิธีการบีบอัดเช่น JPEG  แต่ถ้าในกรณีของภาพเคลื่อนไหวแล้วมันก็คือชุดอนุกรมของภาพหลายๆภาพต่อเนื่องกันไป (Frames)  ระบบโทรทัศน์จะนำเสนอภาพที่อัตรา 25 – 30 frame / sec. มันมีวิธีการลดอัตราการส่งข้อมูลที่เป็นวิดีโอ ด้วยการบีบอัดข้อมูลหรือด้วยการลดอัตราการสร้างภาพต่อวินาทีลง  มันมีวิธีการบีบอัดข้อมูลอยู่หลายแบบ  เริ่มต้นจาก MPEG – 1    แล้วก็เพิ่มความซับซ้อนมากยิ่งขึ้นเป็น MPEG – 2   ที่ทุกวันนี้ถูกใช้งานเพื่อการออกอากาศรายการโทรทัศน์แบบดิจิตอล MPEG – 4 / H.264  เป็นระบบที่ได้รับการพัฒนาให้มีประสิทธิภาพในการลดอัตราการส่งข้อมูลลงทำให้สามารถนำไปใช้งานได้กับอุปกรณ์ประเภทพกพาและบนอินเตอร์เน็ทได้อย่างมีประสิทธิภาพมากยิ่งขึ้น  สำหรับเสียงก็มีความจำเป็นต้องทำการเข้ารหัสเช่นเดียวกันเริ่มต้นจาก MPEG – 1 Layer 3 (MP3)   ต่อมาเป็น AAC (MPEG – 2 part 7)  และเป็น MPEG – 4 AAC  สำหรับดนตรีและ AMR สำหรับเสียงพูด ทั้งหมดนี้จะเห็นได้ว่าวิธีการบีบอัดข้อมูลทำให้การรับส่งสื่อผสมเพื่อนำไปใช้งานในชีวิตประจำวันมีความเป็นไปได้
 

ความคิดเห็น

โพสต์ยอดนิยมจากบล็อกนี้

Automation solution

การจัดแสงไฟสำหรับการถ่ายวิดีโอ (Video Lighting Technique)

การถ่ายทอดสดนอกสถานที่(Outside Broadcasting)