สื่อผสมในรูปแบบดิจิตัล(Digital Multimedia Part 2)

Scaling

ในการใช้งานแบบที่สามารถทำให้ภาพมีขนาดหน้าต่างที่เล็กลง จำนวนของจุดภาพที่น้อยลงย่อมมีผลทำให้จำนวนข้อมูลที่จำเป็นต้องใช้ลดลงตามไปด้วย นอกจากนี้จำนวนของข้อมูลจะลดลงได้อีกด้วยวิธีการลดอัตราการสร้างภาพต่อวินาที (Frame Rate) แต่มันจะทำให้ภาพที่เคลื่อนไหวเร็วมีข้อจำกัด เช่นมีอาการภาพกระตุกเนื่องจากการสร้างภาพให้เห็นอย่างต่อเนื่องไม่เร็วพอ เช่นในกรณีการใช้งานบนเครื่องโทรศัพท์มือถือทีมีสภาวะแวดล้อมของเครือข่ายที่จำกัดอาจลดอัตราการสร้างภาพเหลือเพียง 7 – 15 fps.

Video Compression

การบีบอัดสัญญาณวิดีโอให้มีขนาดเล็กลงเป็นกระบวนการที่ซับซ้อนและจำเป็นต้องใช้เทคนิคหลายอย่างเพื่อทำการบีบอัดให้ได้อย่างน้อยหนึ่งร้อยเท่าหรือมากกว่า ในขณะที่ยังคงรักษาระดับของคุณภาพให้เป็นไปตามวัตถุประสงค์การใช้งานได้ การบีบอัดสัญญาณวิดีโอใช้เทคนิคที่มาจากการบีบอัดข้อมูลภาพเช่นในการบีบอัดภาพแบบ JPEG ที่ใช้วิธีการของ DCT และด้วยเหตุที่แต่ละเฟรมนำเสนอภาพที่ซ้ำๆกันเพียงแต่มีการเคลื่อนไหวเปลี่ยนแปลงเฉพาะบางส่วนของภาพเท่านั้น ดังนั้นการนำเทคนิคการพยากรณ์เฟรมถัดไปแล้วนำมาแทรกเพิ่มเข้าไปจึงถูกนำมาใช้งาน

เทคนิคการบีบอัดทั้งหมดใช้จุดเด่นของการนำมาทดแทนกันได้ของการนำเสนอสัญญาณวิดีโอเพื่อที่จะลดข้อมูลลงสำหรับการใช้งานโทรทัศน์ระบบดิจิตอล โทรทัศน์ระบบพกพา โทรทัศน์อินเตอร์เน็ท

หรือบนเครือข่ายอื่นๆ การบีบอัดข้อมูลมีทั้งแบบสูญเสียข้อมูลบางส่วนกับแบบไม่สูญเสียข้อมูล (Lossy or Lossless) ในกรณีชนิดที่สูญเสียข้อมูลไม่ว่าในกรณีใดๆจะไม่สามารถสร้างภาพตามข้อมูลดั้งเดิมที่มีรายละเอียดสูงได้อีก

Spatial Redundancy

ในภาพตามปกติทั่วไปจะมีพื้นที่บางส่วนหรือหลายส่วนที่มีข้อมูลเป็นจุดสร้างภาพเหมือนกันเช่น ท้องฟ้าหรือก้อนเมฆ ในกรณีเช่นนี้การเปลี่ยนแปลงจากจุดสร้างภาพหนึ่งไปยังจุดสร้างภาพอื่นมีน้อยมาก ดังที่ได้ทราบแล้วว่าแต่ละจุดสร้างภาพประกอบด้วยข้อมูลของการส่องสว่างและข้อมูลของสี ทั้งหมดนี้สามารถเข้ารหัสข้อมูลด้วยการทดแทนทางสถิติ เช่นการเข้ารหัสแบบ Run Length Encoding ทียอมให้นำเอาเฉพาะข้อมูลทีมีตัวแปรจะพบได้บ่อยเท่านั้นด้วยข้อมูลไม่กี่บิท

Temporal Redundancy

ในกรณีของภาพเคลื่อนไหว แต่ละเฟรมจะมีเฉพาะบางจุดสร้างภาพเท่านั้นที่มีการเปลี่ยนแปลงจากเฟรมก่อนหน้าและทำให้เกิดเป็นภาพเคลื่อนไหว อย่างไรก็ดีนี่ไม่ใช่กรณีที่จุดสร้างภาพจะมีข้อมูลที่เหมือนกันทั้งหมด ที่อัตราการสร้างภาพตามปกติระดับ 25 – 30 เฟรมต่อวินาทียังมีการนำพาข้อมูลของแต่ละเฟรมที่ไม่มีความเกี่ยวข้องกับภาพเดิม ข้อมูลที่จำเป็นคือข้อมูลการเปลี่ยนแปลงจากของเดิมเท่านั้น เช่นทิศทางการเคลื่อนไหวของวัตถุในแต่ละเฟรมไปยังภาพของเฟรมอื่นก็ต้องถูกบรรจุลงไป มันมีความเป็นไปได้ที่จะมีการกำหนดให้มีเฟรมที่ถูกบรรจุข้อมูลของภาพทั้งหมดก่อนและมันจะถูกเรียกว่า I – Frame (Intra Frame) ที่จำเป็นต้องให้ข้อมูลเพียงพอสำหรับการสร้างภาพ แล้วตามมาด้วยเฟรมที่ได้รับจากการทำนายล่วงหน้า สำหรับเฟรมที่เกิดจากการทำนายทิศทางการเคลื่อนที่ด้วยข้อมูลจากเฟรมก่อนหน้าจะถูกเรียกว่า P - Frame (Prediction Frame) ในกรณีของการบีบอัดแบบ MPEG – 2 ยังมีรูปแบบการทำนายเฟรมล่วงหน้าอีกอย่างทีเรียกว่า B – Frame (Bi direction Frame) ที่เกิดจากการอ้างอิงข้อมูลของเฟรมทั้งสองชนิดรวมกัน

Perceptual Redundancy

ดวงตาของมนุษย์โดยปกติตามธรรมชาติแล้วมีความสามารถแยกแยะรายละเอียดขอบเขตวัตถุแบบขาวดำที่ระยะไกลได้มากกว่าการแยกแยะรายละเอียดของวัตถุที่เป็นสี ด้วยคุณสมบัติการมองเห็นของดวงตามนุษย์ที่เป็นแบบนี้ทำให้มีผลดีต่อการเข้ารหัสภาพแบบ Object – Base และ Contour – Base เช่นที่มีการนำมาใช้ในระบบของ MPEG – 4

Statistical Redundancy

ในภาพตามธรรมชาติแล้วไม่ใช่ว่าองค์ประกอบของภาพที่ปรากฏให้เห็นด้วยความน่าจะเป็นเสมอไป ข้อเท็จจริงเช่นนี้สามารถนำมาใช้ในการเข้ารหัสองค์ประกอบของภาพที่ปรากฏบ่อยๆได้ด้วยข้อมูลจำนวนน้อยๆ และถ้าเป็นภาพที่ไม่ค่อยได้ปรากฏบ่อยๆด้วยข้อมูลจำนวนมาก รูปแบบการเข้ารหัสชนิดนี้ทำให้สามารถนำพาจุดสร้างภาพจำนวนมากด้วยข้อมูลจำนวนน้อยๆเรียกว่า Huffman Coding

Scaling : reducing pixel count

ตัวการสำคัญที่ทำให้ข้อมูลภาพมีจำนวนมากคือจำนวนของจุดสร้างภาพที่จำเป็นต้องส่งออกไป โดยที่แต่ละจุดสร้างภาพอาจจำเป็นต้องเข้ารหัสด้วยข้อมูลขนาด 24 bit

ดังตัวอย่างต่อไปนี้ ในกรณีของสัญญาณวิดีโอแบบความคมชัดปกติคือ 720 x 480 , MPEG – 1 หมายถึงมีจุดสร้างภาพทั้งหมด 345.6 K pixel แต่ในกรณีของคุณภาพระดับ VCD จะมีรายละเอียดของจุดภาพอยู่ที่ 352 x 288 เท่ากับมีจุดสร้างภาพทั้งหมดจำนวน 101.3 K pixel จะเห็นได้ว่าจำนวนจุดสร้างภาพมีเพียงแค่หนึ่งในสามเท่านั้นเอง

Compression Format	Picture Representation	Application	Bit Rate
MPEG – 1 MPEG – 2 MPEG – 4	352 x 288 SIF 720 x 480 CCIR 176 x 144 QCIF 352 x 288 QSIF	Video CD Broadcast TV,DVD Internet,Mobile TV	0 – 1.5 Mbps 1.5 – 15 Mbps 28.8 – 512 Kbps

Compression Standard

รูปแบบการบีบอัดสัญญาณมีหลากหลายขึ้นอยู่กับการนำไปใช้งาน ที่ผ่านมาในอดีตวิธีการบีบอัดที่มีหลายแบบเกิดจากวิวัฒนาการของเทคโนโลยีและนับวันยิ่งมีความซับซ้อนมากยิ่งขึ้น เนื่องจากมีการพัฒนาอุปกรณ์อิเลคทรอนิคส์ให้มีความสามารถสูงขึ้นแต่มีราคาลดลงจากอดีตเป็นอย่างมาก

MPEG – 1

นี่คือมาตรฐานการเข้ารหัสสื่อผสมยุคเริ่มต้น มันถูกออกแบบสำหรับใช้งานกับแผ่น CD และด้วยข้อจำกัดที่รายละเอียดภาพ 352 x 288 25 fps PAL , 352 x 240 30 fps NTSC เท่ากับระบบอนาลอกแต่มันใช้วิธีการสแกนแบบ progressive โดยมีอัตราการส่งข้อมูลอยู่ที่ระดับ 1.5 Mbps สามารถมีสัญญาณเสียงสองช่องที่ต่อมาระบบของการบันทึกเสียงแบบนี้ได้รับความนิยมมากคือ MP3

MPEG – 2

เป็นมาตรฐานการบีบอัดที่ในปัจจุบันถูกนำมาใช้งานอย่างกว้างขวาง เริ่มต้นประกาศใช้งานอย่างเป็นทางการในปี 1994 และปัจจุบันถูกนำมาใช้เป็นมาตรฐานเพื่อการออกอากาศโทรทัศน์มากที่สุดพอๆกับการนำไปใช้งานเพื่อการบันทึกแผ่นดีวีดี มันถูกออกแบบให้รองรับวิดีโอที่มีรายละเอียดสูงสุดรวมทั้งวิดีโอแบบ HDTV สำหรับสัญญาณวิดีโอที่มีความคมชัดตามปกติแล้วจะมีอัตราการส่งตั้งแต่ 1.5 – 15 Mbps สำหรับการใช้งานเพื่อส่งสัญญาณไปออกอากาศตามมาตรฐานของ CCIR601 จะอยู่ที่ระดับ 15 Mbps แต่ในทางปฏิบัติแล้วแค่ระดับ 2.5 Mbps ก็พอใช้งานได้แล้ว สำหรับการใช้งานเพื่อทำงานในห้องสตูดิโอจะใช้เฉพาะ I – Frame ไม่ได้นำเอา B – Frame กับ P –Frame มาร่วมด้วยเพื่อให้เหมาะสมกับการตัดต่อทำให้อัตราความเร็วอยู่ทีระดับ 50 Mbps

MPEG – 2 มีโครงสร้างที่สามารถรองรับการนำไปใช้งานเพื่อการเชื่อมโยงสัญญาณที่อาจจะมีภาพกับเสียงรวมถึงข้อมูลจำนวนหลายช่องได้ ซึ่งมันจะมีข้อมูลเพื่อบ่งชี้และรวมสัญญาณไปด้วยกันทีเรียกว่า PAT (Program Association Table) นอกจากนี้ยังมีความสอดคล้องเข้ากันได้กับ MPEG – 1 และสามารถถูกนำพาโดยสื่อทีแตกต่างกันได้ รวมไปถึงการนำไปใช้งานเพื่อการออกอากาศเพื่อเครื่องรับประเภทพกพาเคลื่อนที่ได้อีกหลายประเภท

MPEG – 4

เป็นวิธีการบีบอัดสัญญาณวิดีโอด้วยความแตกต่างจากรูปแบบเดิมของทั้ง MPEG – 1 , MPEG – 2 ด้วยการพิจารณาองค์ประกอบของภาพว่าประกอบด้วยฉากพื้นหลังและวัตถุที่เป็นองค์ประกอบในภาพนั้น ภายใต้การทำงานของ MPEG – 4 ภาพจะถูกวิเคราะห์และบ่งชี้ว่าอะไรคือฉากพื้นหลังและมีวัตถุหลายอย่างที่มีการเคลื่อนไหวซ้อนทับอยู่ในภาพ ตัววัตถุจะถูกบ่งชี้แล้วทำการบีบอัดข้อมูลแยกออกต่างหาก ตัวข้อมูลของวัตถุทีมีการเคลื่อนไหวจะถูกรวมเข้าไปเป็นส่วนหนึ่งของสัญญาณวิดีโอ เมื่อมันถูกส่งไปถึงปลายทางตัวถอดรหัสจะทำการสร้างภาพขึ้นใหม่ด้วยการรวมฉากพื้นหลังเข้ากับวัตถุที่เคลื่อนไหวแต่ละอันรวมไปถึงทิศทางการเคลื่อนที่เข้าไปด้วย ทำให้ระบบของ MPEG – 4 มีความสามารถทำการบีบอัดข้อมูลได้มากกว่าและมีอัตราการส่งข้อมูลที่น้อยกว่าแบบ MPEG – 2 ทำให้มีความเหมาะสมต่อการนำไปใช้เพื่อการส่งวิดีโอแบบต่อเนื่อง (streaming) และด้วยเหตุที่มีมาตรฐานในการแยกวัตถุต่างๆออกจากกัน ทำให้เหมาะสมต่อการใช้งานในรูปแบบภาพสามมิติทั้งประเภทเกมและสื่อผสมอื่นๆ เช่นบนอินเตอร์เน็ท การผลิตและการออกอากาศรายการโทรทัศน์แบบดิจิตอล

PROFILE	LEVEL VIDEO	RESOLUTION BIT RATE	MAX NO OFF OBJECTS
Simple Profile	L1 QCIF L2 CIF L3 CIF	176 x 144 64 Kbps 352 X 288 128Kpbs 352 x 288 384Kpbs	4 4 4
Core Profile	L1 QCIF L2 CIF	176 x 144 384Kbps 352 x 288 2 M bps	4 16
Main Profile	L2 CIF L3 ITU 601 L4 HD	352 x 288 2 M bps 720 x 480 15 M bps 1920 x 1088 38.4 Mbps	16 32 32

นอกจากนี้การเข้ารหัสแบบ MPEG – 4 ยังได้รับการพัฒนาต่อมาอีกด้วยความร่วมมือกันระหว่าง MPEG (Moving Picture Expert Group) และ VCEG (Video Coding Expert Group) โดยมีการประกาศมาตรฐานการเข้ารหัสแบบใหม่ในปี 2003 เรียกว่าระบบ H.264/AVC โดยมีการปรับปรุงและพัฒนาให้การเข้ารหัสมีประสิทธิภาพมากยิ่งขึ้นและเหมาะสมต่อการปรับเปลี่ยนการใช้งานบนเครือข่ายของอินเตอร์เน็ททั้งแบบมีสายและแบบไร้สาย รวมไปถึงการนำไปใช้เป็นมาตรฐานของ HD – DVD และ Blue – ray DVD เป็นต้น

TV and Video

มันเป็นเรื่องสำคัญทีจะทำความเข้าใจถึงความแตกต่างกันระหว่างทั้งสองประเภทนี้โดยพิจารณาเปรียบเทียบโดยละเอียดระหว่างวิดีกับโทรทัศน์ ในโลกของโทรทัศน์คือคุณสมบัติของการใช้วิธีสแกนแบบแทรกสอดเพื่อให้ประหยัดช่องสัญญาณส่งออกอากาศที่มีจำกัด และใช้ข้อกำหนดอัตราการสร้างภาพกับรายละเอียดภาพและสีด้วยวิธีการแบบอนาลอก ทำให้มีมาตรฐานระบบต่างกันเป็น NTSC , PAL , SECAM และถึงแม้ว่าในระบบทีวีแบบดิจิตอลเองแล้วยังต้องมีความแตกต่างกัน ว่าอิงกับระบบอนาลอกเดิมแบบใดเช่นอัตราการสร้างภาพ จำนวนจุดภาพทั้งแนวตั้งและแนวนอนที่มีความแตกต่างกัน แต่ในโลกของวิดีโอมันจะไปเกี่ยวข้องกับการนำไปใช้งานบนเครือข่ายอินเตอร์เน็ทและถูกนำเสนอบนจอภาพของเครื่องคอมพิวเตอร์ที่ใช้วิธีการสร้างภาพแบบ Progressive scan

Video Files

ข้อมูลที่เป็นวิดีโอไม่จำเป็นต้องถูกนำส่งออกไปภายหลังจากการบีบอัดข้อมูลเสมอไป ตามปกติมันจำเป็นต้องถูกจัดเก็บอยู่ในรูปแบบของแฟ้มข้อมูลและใช้งานเกี่ยวข้องกับอุตสาหกรรมสื่อผสม แฟ้มข้อมูลมีอยู่หลายแบบที่ต้องขึ้นอยู่กับระบบปฏิบัติการโดยเฉพาะของมันเองและส่วนมากถูกจัดเก็บไว้ในเครื่องคอมพิวเตอร์ หรือไม่ก็ขึ้นอยู่กับมาตรฐานการบีบอัดที่นำมาใช้งาน ในปัจจุบันนี้การแปลงไฟล์ของวิดีโอกระทำได้ง่ายมากด้วยการใช้ซอฟแวร์ที่มีหลากหลายโปรแกรมให้เลือกใช้

The Window AVI Format (. Avi)

AVI (Audio Video Interleaved) เป็นมาตรฐานสำหรับวิดีโอที่ใช้งานอยู่บนเครื่องคอมพิวเตอร์ที่ใช้ระบบปฏิบัติการวินโดว์ ที่มีอุปกรณ์เข้ารหัสติดมาด้วยสำหรับสร้างวิดีโอแบบ AVI ด้วยการสุ่มสัญญาณภาพและเสียงที่ป้อนให้โดยปราศจากการบีบอัด ด้วยเหตุนี้มันถูกใช้เพื่อการจัดเก็บไว้ภายในเครื่องคอมพิวเตอร์แต่ไม่ใช่สำหรับส่งผ่านเครือข่าย

Window Media Format (.wmv)

เป็นรูปแบบวิดีโอของบริษัทไมโครซอฟท์และใช้งานอยู่บนวินโดว์มีเดีย 9 ที่เป็นทั้งตัวเข้ารหัสกับถอดรหัสและเป็นเครื่องเล่นสื่อด้วย แต่ถ้าต้องการเอามันไปใช้บนเครื่องคอมพิวเตอร์ที่มีระบบปฏิบัติการแบบอื่นก็จำเป็นต้องมีซอฟแวร์เฉพาะ

MPEG Format (. mpg)

เป็นดังชื่อของมันเองคือวิดีโอและออดิโอที่ถูกบีบอัดให้เป็นทั้งแบบ MPEG – 1 , MPEG – 2 ข้อมูลไฟล์แบบนี้ถือว่าเป็นมาตรฐานสากล เพราะเครื่องคอมพิวเตอร์ที่มีระบบปฏิบัติการทั้งแมคและวินโดว์รองรับการใช้งานทั้งคู่

Quick Time Format (. mov)

ควิคไทม์เป็นรูปแบบวิดีโอที่เป็นของบริษัทแอปเปิ้ลคอมพิวเตอร์ มันถูกนำไปใช้งานทั้งในวงการอุตสาหกรรมวิดีโอพอๆกับการใช้งานด้านกราฟฟิคและการนำเสนอผลงาน อย่างไรก็ดีมันมีความใกล้เคียงกับระบบ MPEG – 4 และระบบของ H.264/AVC เครื่องเล่นสื่อแบบควิคไทม์พบเห็นได้ในระบบปฏิบัติการของเครื่องคอมพิวเตอร์เกือบทั้งหมด

RealMedia Format (. rm)

รูปแบบของมันเริ่มเป็นที่นิยมมากขึ้นตามปริมาณการใช้งานบนอินเตอร์เน็ท ทั้งนี้ตัวโปรแกรมในการผลิตและเครื่องเล่นสื่อแบบพื้นฐาน สามารถหาดาวโหลดได้ฟรี ตัวเว็บไซด์เองทั้งหมดรองรับเนื้อหาที่เป็นเรียลฟอร์แมท

Flash Video (. flv)

รูปแบบวิดีโอแบบนี้ได้รับความนิยมมากขึ้นเนื่องจากมันถูกใช้งานเพื่อการนำส่งวิดีโอชนิดที่เรียกว่า web – based การนำไฟล์ไปใช้งานทำได้ด้วยโปรแกรม Adobe Flash Player รวมไปถึงโปรแกรมแบบที่มีมาพร้อมกับตัวเว็บเบราเซอร์เอง (Plug – in) มันถูกนำมาใช้กับเว็บไซด์ยอดนิยมอย่าง YouTube , Google , Yahoo ตัวโปรแกรมเครื่องเล่นสื่อสามารถหาดาวโหลดและติดตั้งได้ฟรี

The DivX Format

ได้ชื่อมาจากตัวเข้ารหัสที่เป็นของบริษัท DivX Inc. ที่นอกจากจะสามารถใช้เครื่องเล่นด้วยตัวโปรแกรมเล่นสื่อของตัวเองแล้ว ยังสามารถนำตัวโปรแกรมของมันไปไว้บนโปรแกรมเล่นสื่ออื่นเช่นวินโดว์มีเดียก็ได้ ตัวสื่อเองก็ทำให้เป็นทั้งวิดีโอสตรีมและออดิโอสตรีมได้หลายช่องพร้อมกันและยังสามารถใส่ซับไตเติ้ลลงไปได้อีก มีรายละเอียดภาพให้เลือกใช้ได้หลายระดับตั้งแต่การใช้งานสำหรับอุปกรณ์ประเภทพกพาไปจนถึงระดับความชัดเจนสูงแบบ HD และที่สำคัญคือมันสามารถบีบอัดข้อมูลของแผ่น DVD ตามปกติที่มีข้อมูลขนาด 4.7 GB ให้เหลือเพียงแค่ 700 MB ซึ่งมีผลดีทำให้การดาวโหลดข้อมูลจากอินเตอร์เน็ทใช้เวลาน้อยลงไป นอกจากนี้มันยังถูกนำไปใช้กับเครื่องเล่นเกมเช่น Sony PlayStation

MXF File Format

ได้ชื่อมาจากคำเต็มว่า (material exchange format) และเป็นมาตรฐานที่ได้ยอมรับให้นำมาใช้งานกับอุปกรณ์วิดีโอแบบมืออาชีพจำพวกเครื่องตัดต่อแบบนอนลิเนียร์และอุปกรณ์จัดเก็บข้อมูลที่ใช้บันทึกวิดีโอ ข้อมูลทีเป็นแบบ MXF เป็นตัวบ่งชี้ว่าตัวที่ใช้บรรจุเอกสารภายในจะสามารถรองรับข้อมูลภาพและเสียงที่เป็นหลายประเภทได้ทำให้การเปิดแฟ้มข้อมูลเป็นไปตามมาตรฐาน ด้วยการทำให้มันมีตัวห่อหุ้มแฟ้มข้อมูลเหมือนกันซะเลย (ด้วยการกำหนดของMXF) นี่เป็นการช่วยให้มีความง่ายต่อการจัดส่งหรือการบันทึกเนื้อหาข้อมูลวิดีโอ นอกจากนี้มันยังมีความสามารถทีรองรับการใช้งานแบบ metadata ซึ่งเป็นเรื่องที่สำคัญมากสำหรับสภาพแวดล้อมที่ประกอบด้วยอุปกรณ์หลายชนิดใช้งานร่วมกัน

File Containers and Wrappers

จากที่ผ่านมาจะเห็นได้ว่ามีมาตรฐานการบีบอัดและจัดเก็บข้อมูลเป็นแฟ้มข้อมูลวิดีโออยู่หลายแบบ บางชนิดก็เป็นแบบที่เป็นการใช้งานเฉพาะตัวเช่นวินโดว์มีเดียและเรียลวิดีโอ แบบอื่นที่เหลือตั้งอยู่บนพื้นฐานของความแตกต่างของวิธีการห่อหุ้มข้อมูลภาพและเสียงที่ถูกบีบอัดตามมาตรฐาน ตัวห่อหุ้มจะทำหน้าที่กำหนดประเภทของภาพและเสียงที่นำเสนอ และข้อมูลที่ประกอบด้วยชื่อหัวเรื่อง ชื่อของผู้ผลิตหรือรายละเอียดอื่นๆ เรามักจะเห็นวิดีโอที่มีหลากหลายรูปแบบเช่นวิดีโอที่เกิดจากการส่งออกอากาศของสถานีส่ง วิดีโอที่ผ่านเครือข่ายอินเตอร์เน็ทหรือาจเป็นวิดีโอที่อยู่ในรูปแบบของแฟ้มข้อมูล เราจะพบว่าแม้ดูจากภายนอกเป็นครั้งแรกดูเสมือนว่ามันเป็นความแตกต่างกันก็ตาม แต่ในความเป็นจริงแล้วทั้งหมดตั้งอยู่บนพื้นฐานของมาตรฐานธรรมดาไม่กี่ชนิดเอง

ในกรณีของภาพและเสียงที่จำเป็นต้องจัดเก็บให้อยู่ในรูปแบบแฟ้มข้อมูลแล้ว วิธีการทั่วไปคือการใช้ภาชนะจัดเก็บหรือเรียกง่ายๆว่าหาถังมาบรรจุภาพและเสียง ซึ่งต่อมาภาพและเสียงก็ถูกวางไว้ในตัวห่อหุ้มแฟ้มอีกทีหนึ่งที่จะทำหน้าที่บรรยายถึงชนิดของเนื้อหาภาพและเสียงรวมไปถึงข้อมูลรายละเอียดที่เกี่ยวข้อง แฟ้มข้อมูลที่ถูกจัดเก็บเหล่านี้เป็นที่รู้จักรับรู้ได้โดยการใช้ตัวห่อหุ้มที่เหมาะสมเช่น QuickTime , Flash Video , MP4 , DivX , MPEG หรือชนิดอื่นใดก็ตาม

File Format Converters

การเปลี่ยนแปลงไฟล์เป็นเรื่องจำเป็นต้องกระทำและพบบ่อยในมุมมองของการบันทึก การจัดเก็บ การตัดต่อ และการจัดส่ง ในกรณีที่พบบ่อยมากที่สุดซึ่งแฟ้มข้อมูลเป็นระบบเปิด การแปลงรูปแบบไฟล์คือกระบวนการเปลี่ยนตัวห่อหุ้มให้อยู่ในรูปแบบที่ต้องการเช่น QuickTime , MXF ด้วยโปรแกรมแปลงไฟล์ที่มีหลายแบบให้เลือกใช้ตามต้องการ

Audio Coding

มีหลายวิธีในการนำเสนอสัญญาณเสียง ขึ้นอยู่กับว่าเป็นชนิดที่ถูกบีบอัดหรือไม่และใช้มาตรฐานการบีบอัดชนิดใด รูปแบบของมันเป็นไปตามระบบปฏิบัติการของเครื่องคอมพิวเตอร์นั้นๆ

มาตรฐานของระบบเสียงยังคงขึ้นอยู่กับการนำไปใช้งานด้านใด เช่นถ้าเป็นดนตรีต้องการเสียงที่มีคุณภาพสูงที่มีย่านความถี่ 20 – 20 KHz ที่มีสองช่องหรือมากกว่า แต่ถ้าเป็นเครื่องโทรศัพท์เคลื่อนที่ใช้เพียง 100 Hz – 4 KHz สำหรับเสียงพูดคุยก็เพียงพอ

Audio Sampling Basics

ย่านความถี่เสียงที่หูมนุษย์ได้ยินเริ่มต้นจาก 20 Hz ถึง 20 KHz และเพื่อให้รองรับย่านความถี่เสียงในแบบดิจิตอลแล้ว มีความจำเป็นต้องนำเอาความถี่เสียงมาสุ่มระดับค่าด้วยอัตราความถี่สูงเป็นอย่างน้อยของความถี่สูงสุด เช่นดังต่อไปนี้

- Audio CD : 44.1 KHz 16 bit

- DATs : (Digital Audio Tapes) : 48 KHz 16 bit

- DVDs : 48 – 192 KHz 16 – 24 bit

ยิ่งมีจำนวนบิทที่จำเป็นต้องเข้ารหัสมากขึ้นก็ยิ่งทำให้ได้รับระดับย่านของการเปลี่ยนแปลงระดับความดังของเสียงมากขึ้นตามไปด้วย แต่ถ้าใช้จำนวนบิทน้อยก็จะทำให้เกิดสัญญาณรบกวนและสูญเสียความเป็นธรรมชาติไป กระบวนการของการสุ่มเสียงและการเข้ารหัสก่อให้เกิดข้อมูลเสียงแบบ PCM (Pulse Code Modulated) ที่นิยมใช้งานในห้องสตูดิโอบันทึกเสียง

Audio Interfaces

เมื่อนำเอาสัญญาณเสียงมาเข้ารหัสเช่นการแปลงให้เป็น PCM มันจะประกอบด้วยข้อมูลที่เรียงต่อเนื่องกันไป (bit stream) ทำให้มีความจำเป็นต้องมีการเชื่อมต่อกันตามรูปแบบข้อมูลเสียงด้วย เช่นตัวอย่างของระบบ AES – 3 (Audio Engineering Society) หรือของ EBU (European Broadcast Union) เป็นมาตรฐานการเชื่อมต่อทางกายภาพของเสียงด้วยการใช้สายสองเส้นคู่และหุ้มฉนวนป้องกันการรบกวนที่สามารถใช้งานได้ที่ระยะประมาณไม่เกิน 100 เมตร ในกรณีตามปกติจะมีอัตราการส่งข้อมูลที่ระดับ 2 – 3 Mbps ขึ้นอยู่ที่อัตราการสุ่มข้อมูลAudio Compression

ในการนำไปใช้งานเกือบทั้งหมด สัญญาณเสียงจำเป็นต้องถูกนำส่งด้วยระดับความเร็วต่ำเพื่อให้ใช้ช่องสัญญาณเท่าที่จำเป็น ดังนั้นจึงมีความจำเป็นต้องทำการบีบอัดก่อน

Audio Source	Frequency Band	Sampling Rate
Speech Telephony Wideband Speech Music Music (CD Quality) Music (Professional / Broadcast	200 Hz – 3.4 KHz 100 Hz – 7 KHz 50 Hz – 15 KHz 20 Hz – 20 KHz 20 Hz – 20 KHz	8 KHz 16 KHz 32 KHz 44.1 KHz 48 KHz

การบีบอัดสัญญาณเสียงตั้งอยู่บนพื้นฐานจากคุณลักษณะของหูคนที่ซึ่งไม่สามารถรับฟังเสียงทุกความถี่ได้เท่าเทียมกัน ด้วยการใช้คุณสมบัติประการสำคัญดังกล่าวทำให้สามารถนำเอามาใช้งานเพื่อการบีบอัดสัญญาณเสียงได้ หูของเราไม่สามารถแยกแยะเสียงที่เป็นสเตอริโอได้ที่ความถี่ต่ำกว่า 2 KHz ดังนั้นจึงสามารถส่งสัญญาณที่มีความถี่ต่ำแบบโมโน และถ้าเป็นระดับเสียงเบาๆแล้วหูก็จะได้ยินเฉพาะย่านความถี่เสียงกลางเท่านั้นเอง แต่ถ้าเป็นระดับเสียงที่ดังมากๆแล้วมันจะกลบเสียงที่มีความถี่ใกล้เคียงไปเลย ในกรณีเช่นนี้การบีบอัดก็สามารถละทิ้งเสียงที่ใกล้เคียงดังกล่าวได้เลย

Audio Compression and Coding Principle

การเข้ารหัสสัญญาณเสียงใช้ผลทีได้รับจากทฤษฎีที่มาจากการรับฟังเสียงของหูมนุษย์ด้วยการตัดข้อมูลที่ไม่จำเป็นออกไป เทคนิคที่สำคัญคือการแบ่งแยกเสียงออกเป็นหลายย่านความถี่จำนวนมาก แล้วตัดย่านความถี่ที่จะถูกบดบังด้วยเสียงที่ดังกว่าออกไป

MPEG compression

การเข้ารหัสแบบนี้ได้รับการพัฒนาให้เป็นมาตรฐานของการเข้ารหัสเสียงที่ยอมรับกันและถูกนำไปใช้อย่างกว้างขวางในวงการอุตสาหกรรมที่เกี่ยวข้อง สำหรับการเข้ารหัสเสียงหนึ่งที่นิยมใช้และรู้จักกันอย่างกว้างขวางคือแบบ MPEG – 1 Layer 3 (MP3) ที่ถูกนำมาใช้ทั้งในเครื่องเล่นสื่อและบนอินเตอร์เน็ทรวมไปถึงการนำไปใช้กับระบบเสียงของ VCD อีกด้วย อันที่จริง MPEG – 1 มันมีถึงสามระดับ (3 Layer)โดยมีความแตกต่างกันที่ความซับซ้อนและกระบวนการเข้ารหัส เช่นระดับหนึ่งใช้งานใน digital compact cassettes และระดับสองถูกนำมาใช้เพื่อการออกอากาศรายการวิทยุแบบดิจิตอล

Advanced Audio Coding (AAC)

ด้วยเหตุที่ระบบมาตรฐานของการออกอากาศรายการโทรทัศน์แบบดิจิตอลคือ MPEG – 2 ทำให้มีมาตรฐานการเข้ารหัสเสียงแบบก้าวหน้าเกิดขึ้นเรียกว่าแบบ AAC มันถูกพัฒนาขึ้นด้วยการนำเอา MP3 มาปรับปรุงให้มีประสิทธิภาพสูงขึ้น และเช่นเดิมมันมีสามระดับด้วยกัน

Audio Codecs in MPEG – 4

การเข้ารหัสของมันก็อยู่ในตระกูลเดียวกับที่ผ่านมาแต่ถูกทำให้มีความซับซ้อนมากยิ่งขึ้นเพื่อให้มีประสิทธิภาพในการบีบอัดข้อมูลได้สูงกว่าเดิมและมีความเข้ากันได้กับของเดิมเช่น MPEG – 4 AAC กับ MPEG – 2 AAC เป็นต้น สำหรับการเข้ารหัสแบบนี้ได้รับความนิยมมากขึ้นเนื่องจากมันถูกนำไปใช้บนเครื่องเล่นของ Apple iPod และบนโปรแกรม iTunes ข้อดีทางเทคนิคอื่นอีกคือมันสามารถนำไปใช้งานแบบมีเสียงหลายช่องได้และยังมีคุณสมบัติที่ปรับเปลี่ยนอัตราการส่งข้อมูลได้ทำให้เหมาะสมกับการใช้งานบนเครือข่ายอินเตอร์เน็ทมากยิ่งขึ้น

The AMR – WB + Codec

มาจากคำเต็มว่า adaptive multi rate wideband codec เนื่องจากความต้องการนำไปใช้งานบนสภาวะแวดล้อมของอุปกรณ์ประเภทพกพาเช่นโทรศัพท์มือถือ การเข้ารหัสจะสามารถรองรับเนื้อหาที่แตกต่างกันหลายประเภทเช่น เสียงคนพูด กีฬา ข่าว เพลง โดยที่มีอัตราการส่งข้อมูลต่ำๆแต่ยังมีคุณภาพที่ยอมรับได้ ด้วยเหตุนี้การปรับเปลี่ยนอัตราการรับส่งข้อมูลต้องมีความเร็วมากพออยู่ที่ตั้งแต่ 6 Kbps – 48 Kbps สำหรับเสียงแบบสเตอริโอ

Streaming

การให้บริการเนื้อหาแบบต่อเนื่องเช่นวิดีโอเริ่มเป็นเทคโนโลยีที่นิยมมากยิ่งขึ้นเนื่องจากการเจริญเติบโตของอินเตอร์เน็ทตั้งแต่ปี 1990 เป็นต้นมา ถ้าเป็นวิธีการดาวโหลดข้อมูลขนาด 20 MB ที่สามารถนำมาดูเพียงสามนาทีผู้ชมอาจต้องเสียเวลารอคอยมากกว่านั้นด้วยซ้ำไป แต่ถ้าเป็นวิธีการแบบสตรีมมิ่งแล้วสัญญาณภาพและเสียงจะถูกนำส่งไปยังผู้รับอย่างต่อเนื่องตั้งแต่เริ่มต้นเลย ทำให้เป็นผลดีต่อผู้ใช้งาน

กระบวนการเช่นนั้นมีความเป็นไปได้ด้วยการใช้วิธีการเข้ารหัสที่มีประสิทธิภาพสูงและวิธีการทำให้เกิดข้อมูลแบบต่อเนื่องด้วยการปรับเปลี่ยนจากรูปแบบที่ถูกจัดเก็บ (storage format)ไปเป็นรูปแบบที่บรรจุหีบห่อ (packetized format) พร้อมสำหรับการจัดส่งไปบนเครือข่ายอินเตอร์เน็ท

Streaming Network Architecture

การจัดส่งข้อมูลแบบต่อเนื่องมีส่วนเกี่ยวข้องดังต่อไปนี้ นำเอาเนื้อหาที่ต้องการส่งมาเข้ารหัส แล้วทำการแปลงข้อมูลให้พร้อมเพื่อส่งต่อไปยังเครื่องเซิฟเวอร์เพื่อให้ทำหน้าที่ส่งข้อมูลออกไปตามเครือข่าย และเมื่อข้อมูลไปถึงผู้รับก็สามารถใช้โปรแกรมเล่นสื่อเพื่อการรับชมได้

กระบวนการทำงานแบบส่งข้อมูลเนื้อหาแบบต่อเนื่องนี้ทำได้โดยการพัฒนาโปรแกรมของบริษัทชั้นนำเช่น RealNetworks , Microsoft Windows Media Platforms , Apple QuickTime Multimedia โปรแกรมการใช้งานทั้งหลายเหล่านี้ได้รับความนิยมและนำไปใช้งานอย่างแพร่หลาย

The Capture and Encoding Processes

การจัดเก็บภาพวิดีโอจะเป็นเรื่องเกี่ยวข้องกับการยอมรับให้ขบวนของข้อมูลภาพและเสียงที่เหมาะสมกับรูปแบบที่พีซีการ์ดรู้จักทำการบันทึกอย่างต่อเนื่อง สัญญาณขาเข้าของพีซีการ์ดอาจเป็นแบบที่ถูกบีบอัดมาก่อนแล้วหรือว่ายังไม่ถูกบีบอัดก็ได้ โดยที่ภายหลังจากผ่านการบีบอัดแล้วแฟ้มข้อมูลจะถูกจัดเก็บอยู่ในรูปแบบที่เหมาะสมเช่น .mpg หรืออาจเป็น .mp4 ขึ้นอยู่กับตัวเข้ารหัสนั้นๆ

File Conversion To Streaming Format

ในการต้องการทำให้แฟ้มข้อมูลถูกนำส่งออกไปแบบขบวนของภาพเคลื่อนไหวตามความเป็นจริง มันจำเป็นต้องมีข้อมูลการควบคุมเรื่องของเวลา ที่ซึ่งสามารถใช้โดยเครื่องเซิฟเวอร์สำหรับบริหารจัดการอัตราการนำส่ง ด้วยวัตถุประสงค์เช่นนี้แฟ้มข้อมูลจึงถูกแปลงให้เป็นรูปแบบของกระแสข้อมูลที่เรียกว่าสตรีมมิ่ง ด้วยการเพิ่มข้อมูลการควบคุมเวลาลงไปด้วย

Streaming Serving

เป็นวิธีการทำงานแบบพิเศษเฉพาะที่ถูกใช้ในเครื่องแม่ข่ายเพื่อการจัดส่งข้อมูลที่ถูกบรรจุลงในหีบห่อแล้วอย่างต่อเนื่องบนเครือข่ายอินเตอร์เน็ทไปยังเครื่องของลูกข่าย การทำงานแบบนี้เป็นรูปแบบของการแลกเปลี่ยนสื่อผสมที่ได้มีการพัฒนาขึ้นมาโดยวิธีการหลายอย่างประกอบด้วย RTP (real time protocol) RTCP (real time control protocol) RTSP (real time streaming protocol)

กระบวนการเหล่านี้เกี่ยวข้องกับช่องทางสองช่องที่แยกออกจากกันคือช่องทางการควบคุมและช่องทางของข้อมูลวิดีโอก่อให้เกิดการนำส่งข่าวสารอย่างต่อเนื่อง รวมไปถึงข้อมูลป้อนกลับของเครื่องลูกข่ายไปยังแม่ข่าย เช่นเครื่องลูกข่ายจะให้ข้อมูลถึงหมายเลขและจำนวนของพัสดุที่ได้รับรวมไปถึงคุณภาพของข้อมูล ตัวแม่ข่ายก็จะทราบว่ามีสภาวะผิดปกติอะไรบ้างเพื่อทีจะได้จัดส่งข้อมูลตามที่เครื่องลูกข่ายต้องการเป็นต้น ตัวอย่างเช่นเครื่องแม่ข่ายอาจจัดส่งข้อมูลที่อัตราตั้งแต่ 64 Kbps , 128 Kbps , 256 Kpbs หรืออาจเลือกอัตราการสร้างภาพที่ต่ำลงมาเนื่องจากข้อจำกัดของช่องสัญญาณเอง

Streaming Serving and Bandwidth Management

เครื่องแม่ข่ายและเครื่องลูกข่ายจะทำการเชื่อมต่อกันอยู่ในสภาวะของการร่วมมือกันทำงาน ถ้าหากว่าอัตราการส่งข้อมูลลดลงเนื่องจากการเชื่อมต่อมีปัญหา ตัวเครื่องลูกข่ายจำเป็นต้องส่งสัญญาณไปยังเครื่องแม่ข่ายเพื่อให้ทำการแก้ไขที่อาจมีการลดอัตราการสร้างภาพต่อวินาทีลง กระบวนการเช่นนี้เป็นการติดต่อกับลูกข่ายเฉพาะรายตัวไปและมีคำจำกัดความว่าเป็นการเชื่อมต่อแบบ Unicast สำหรับเครื่องลูกข่ายแต่ละเครื่องจะมีข้อมูลที่ส่งมาจากเครื่องแม่ข่ายเป็นอิสระจากข้อมูลที่ส่งไปยังเครื่องลูกข่ายอื่นๆ (เป็นอิสระจากกันทั้งช่องข้อมูลและช่องการควบคุม) นี่คือกระบวนการทำงานของการให้บริการแบบสตรีมมิ่งอย่างสมบูรณ์ การเชื่อมต่อแบบนี้อาจดูเหมือนว่าไม่ได้เป็นการทำงานตามอุดมคตินักเมื่อมีผู้เข้ามาใช้งานที่เป็นเนื้อหาเดียวกันจำนวนมาก และก่อให้เกิดการจัดส่งข้อมูลพร้อมกันทีเดียวหลายช่อง

Streaming Player and Servers

มีวิธีการเข้ารหัสและกระบวนการทำงานแบบแม่ข่ายสตรีมมิ่งอยู่หลายแบบ แต่ที่ได้รับความนิยมและนำไปใช้งานอย่างแพร่หลายมีดังนี้

RealNetworks

การทำงานประกอบด้วยตัวเข้ารหัสและตัวแม่ข่าย ตัวข้อมูลที่เป็น RealVideo เองตั้งอยู่บนกฎเกณฑ์ของการเข้ารหัสแบบ MPEG – 4 มันสามารถทำการเข้ารหัสด้วยอัตราที่แตกต่างกันได้และทำการส่งข้อมูลได้หลายระดับความเร็วเช่นกันด้วยการรับข้อมูลป้อนกลับจากเครื่องลูกข่ายเช่นจาก 64 Kbps – 128 Kbps

Microsoft Windows Media Format

ทั้งตัวเข้ารหัสและตัวถอดรหัสรวมไปถึงเครื่องเล่นสื่อเองทั้งหมดเป็นของบริษัทไมโครซอฟท์ สำหรับตัวเข้ารหัสรองรับวิดีโอได้หลายชนิดเช่น . avi , . wmv , .afs โดยที่ทั้งหมดเป็นการทำงานภายใต้ระบบปฏิบัติการของวินโดว์เอง

Apple QuickTime

มันเป็นชุดเครื่องมือที่สมบูรณ์แบบที่รองรับสื่อผสมและการทำงานแบบสตรีมมิ่ง มีทั้งตัวเครื่องเล่นสื่อที่เป็นโปรแกรมและแบบที่เป็นชนิด plug – in บนโปรแกรมเบราเซอร์ มันสามารถรองรับทั้งภาพ เสียง

บทสรุป

เท่าที่ผ่านมาจะเห็นได้ว่าองค์ประกอบหลักของสื่อผสมก็คือภาพ ขนาดของภาพถูกกำหนดโดยจุดสร้างภาพ (pixel) และมีผลต่อขนาดของข้อมูลที่ต้องการนำเสนอ และขนาดของข้อมูลก็สามารถทำให้มีขนาดลดลงด้วยวิธีการบีบอัดเช่น JPEG แต่ถ้าในกรณีของภาพเคลื่อนไหวแล้วมันก็คือชุดอนุกรมของภาพหลายๆภาพต่อเนื่องกันไป (Frames) ระบบโทรทัศน์จะนำเสนอภาพที่อัตรา 25 – 30 frame / sec. มันมีวิธีการลดอัตราการส่งข้อมูลที่เป็นวิดีโอ ด้วยการบีบอัดข้อมูลหรือด้วยการลดอัตราการสร้างภาพต่อวินาทีลง มันมีวิธีการบีบอัดข้อมูลอยู่หลายแบบ เริ่มต้นจาก MPEG – 1 แล้วก็เพิ่มความซับซ้อนมากยิ่งขึ้นเป็น MPEG – 2 ที่ทุกวันนี้ถูกใช้งานเพื่อการออกอากาศรายการโทรทัศน์แบบดิจิตอล MPEG – 4 / H.264 เป็นระบบที่ได้รับการพัฒนาให้มีประสิทธิภาพในการลดอัตราการส่งข้อมูลลงทำให้สามารถนำไปใช้งานได้กับอุปกรณ์ประเภทพกพาและบนอินเตอร์เน็ทได้อย่างมีประสิทธิภาพมากยิ่งขึ้น สำหรับเสียงก็มีความจำเป็นต้องทำการเข้ารหัสเช่นเดียวกันเริ่มต้นจาก MPEG – 1 Layer 3 (MP3) ต่อมาเป็น AAC (MPEG – 2 part 7) และเป็น MPEG – 4 AAC สำหรับดนตรีและ AMR สำหรับเสียงพูด ทั้งหมดนี้จะเห็นได้ว่าวิธีการบีบอัดข้อมูลทำให้การรับส่งสื่อผสมเพื่อนำไปใช้งานในชีวิตประจำวันมีความเป็นไปได้

ค้นหาบล็อกนี้

TV and IT

สื่อผสมในรูปแบบดิจิตัล(Digital Multimedia Part 2)

ความคิดเห็น

แสดงความคิดเห็น

โพสต์ยอดนิยมจากบล็อกนี้

การจัดแสงไฟสำหรับการถ่ายวิดีโอ (Video Lighting Technique)

ห้องผลิตรายการโทรทัศน์และฉากเสมือนจริง (TV studio and Virtual studio)

การถ่ายทอดสดนอกสถานที่(Outside Broadcasting)