สื่อผสมในรูปแบบดิจิตัล(Digital Multimedia Part 2)
Scaling
Video Compression
การบีบอัดสัญญาณวิดีโอให้มีขนาดเล็กลงเป็นกระบวนการที่ซับซ้อนและจำเป็นต้องใช้เทคนิคหลายอย่างเพื่อทำการบีบอัดให้ได้อย่างน้อยหนึ่งร้อยเท่าหรือมากกว่า ในขณะที่ยังคงรักษาระดับของคุณภาพให้เป็นไปตามวัตถุประสงค์การใช้งานได้ การบีบอัดสัญญาณวิดีโอใช้เทคนิคที่มาจากการบีบอัดข้อมูลภาพเช่นในการบีบอัดภาพแบบ JPEG ที่ใช้วิธีการของ DCT และด้วยเหตุที่แต่ละเฟรมนำเสนอภาพที่ซ้ำๆกันเพียงแต่มีการเคลื่อนไหวเปลี่ยนแปลงเฉพาะบางส่วนของภาพเท่านั้น ดังนั้นการนำเทคนิคการพยากรณ์เฟรมถัดไปแล้วนำมาแทรกเพิ่มเข้าไปจึงถูกนำมาใช้งาน
เทคนิคการบีบอัดทั้งหมดใช้จุดเด่นของการนำมาทดแทนกันได้ของการนำเสนอสัญญาณวิดีโอเพื่อที่จะลดข้อมูลลงสำหรับการใช้งานโทรทัศน์ระบบดิจิตอล โทรทัศน์ระบบพกพา โทรทัศน์อินเตอร์เน็ท
หรือบนเครือข่ายอื่นๆ การบีบอัดข้อมูลมีทั้งแบบสูญเสียข้อมูลบางส่วนกับแบบไม่สูญเสียข้อมูล (Lossy or Lossless) ในกรณีชนิดที่สูญเสียข้อมูลไม่ว่าในกรณีใดๆจะไม่สามารถสร้างภาพตามข้อมูลดั้งเดิมที่มีรายละเอียดสูงได้อีก
Spatial Redundancy
ในภาพตามปกติทั่วไปจะมีพื้นที่บางส่วนหรือหลายส่วนที่มีข้อมูลเป็นจุดสร้างภาพเหมือนกันเช่น ท้องฟ้าหรือก้อนเมฆ ในกรณีเช่นนี้การเปลี่ยนแปลงจากจุดสร้างภาพหนึ่งไปยังจุดสร้างภาพอื่นมีน้อยมาก ดังที่ได้ทราบแล้วว่าแต่ละจุดสร้างภาพประกอบด้วยข้อมูลของการส่องสว่างและข้อมูลของสี ทั้งหมดนี้สามารถเข้ารหัสข้อมูลด้วยการทดแทนทางสถิติ เช่นการเข้ารหัสแบบ Run Length Encoding ทียอมให้นำเอาเฉพาะข้อมูลทีมีตัวแปรจะพบได้บ่อยเท่านั้นด้วยข้อมูลไม่กี่บิท
Temporal Redundancy
ในกรณีของภาพเคลื่อนไหว แต่ละเฟรมจะมีเฉพาะบางจุดสร้างภาพเท่านั้นที่มีการเปลี่ยนแปลงจากเฟรมก่อนหน้าและทำให้เกิดเป็นภาพเคลื่อนไหว อย่างไรก็ดีนี่ไม่ใช่กรณีที่จุดสร้างภาพจะมีข้อมูลที่เหมือนกันทั้งหมด ที่อัตราการสร้างภาพตามปกติระดับ 25 – 30 เฟรมต่อวินาทียังมีการนำพาข้อมูลของแต่ละเฟรมที่ไม่มีความเกี่ยวข้องกับภาพเดิม ข้อมูลที่จำเป็นคือข้อมูลการเปลี่ยนแปลงจากของเดิมเท่านั้น เช่นทิศทางการเคลื่อนไหวของวัตถุในแต่ละเฟรมไปยังภาพของเฟรมอื่นก็ต้องถูกบรรจุลงไป มันมีความเป็นไปได้ที่จะมีการกำหนดให้มีเฟรมที่ถูกบรรจุข้อมูลของภาพทั้งหมดก่อนและมันจะถูกเรียกว่า I – Frame (Intra Frame) ที่จำเป็นต้องให้ข้อมูลเพียงพอสำหรับการสร้างภาพ แล้วตามมาด้วยเฟรมที่ได้รับจากการทำนายล่วงหน้า สำหรับเฟรมที่เกิดจากการทำนายทิศทางการเคลื่อนที่ด้วยข้อมูลจากเฟรมก่อนหน้าจะถูกเรียกว่า P - Frame (Prediction Frame) ในกรณีของการบีบอัดแบบ MPEG – 2 ยังมีรูปแบบการทำนายเฟรมล่วงหน้าอีกอย่างทีเรียกว่า B – Frame (Bi direction Frame) ที่เกิดจากการอ้างอิงข้อมูลของเฟรมทั้งสองชนิดรวมกัน
Perceptual Redundancy
ดวงตาของมนุษย์โดยปกติตามธรรมชาติแล้วมีความสามารถแยกแยะรายละเอียดขอบเขตวัตถุแบบขาวดำที่ระยะไกลได้มากกว่าการแยกแยะรายละเอียดของวัตถุที่เป็นสี ด้วยคุณสมบัติการมองเห็นของดวงตามนุษย์ที่เป็นแบบนี้ทำให้มีผลดีต่อการเข้ารหัสภาพแบบ Object – Base และ Contour – Base เช่นที่มีการนำมาใช้ในระบบของ MPEG – 4
Statistical Redundancy
ในภาพตามธรรมชาติแล้วไม่ใช่ว่าองค์ประกอบของภาพที่ปรากฏให้เห็นด้วยความน่าจะเป็นเสมอไป ข้อเท็จจริงเช่นนี้สามารถนำมาใช้ในการเข้ารหัสองค์ประกอบของภาพที่ปรากฏบ่อยๆได้ด้วยข้อมูลจำนวนน้อยๆ และถ้าเป็นภาพที่ไม่ค่อยได้ปรากฏบ่อยๆด้วยข้อมูลจำนวนมาก รูปแบบการเข้ารหัสชนิดนี้ทำให้สามารถนำพาจุดสร้างภาพจำนวนมากด้วยข้อมูลจำนวนน้อยๆเรียกว่า Huffman Coding
Scaling : reducing pixel count
ตัวการสำคัญที่ทำให้ข้อมูลภาพมีจำนวนมากคือจำนวนของจุดสร้างภาพที่จำเป็นต้องส่งออกไป โดยที่แต่ละจุดสร้างภาพอาจจำเป็นต้องเข้ารหัสด้วยข้อมูลขนาด 24 bit
ดังตัวอย่างต่อไปนี้ ในกรณีของสัญญาณวิดีโอแบบความคมชัดปกติคือ 720 x 480 , MPEG – 1 หมายถึงมีจุดสร้างภาพทั้งหมด 345.6 K pixel แต่ในกรณีของคุณภาพระดับ VCD จะมีรายละเอียดของจุดภาพอยู่ที่ 352 x 288 เท่ากับมีจุดสร้างภาพทั้งหมดจำนวน 101.3 K pixel จะเห็นได้ว่าจำนวนจุดสร้างภาพมีเพียงแค่หนึ่งในสามเท่านั้นเอง
Compression
Format
|
Picture Representation
|
Application
|
Bit Rate
|
MPEG – 1
MPEG – 2
MPEG – 4
|
352 x 288 SIF
720 x 480 CCIR
176 x 144 QCIF
352 x 288 QSIF
|
Video CD
Broadcast TV,DVD
Internet,Mobile TV
|
0 – 1.5 Mbps
1.5 – 15 Mbps
28.8 – 512 Kbps
|
Compression Standard
MPEG – 1
นี่คือมาตรฐานการเข้ารหัสสื่อผสมยุคเริ่มต้น มันถูกออกแบบสำหรับใช้งานกับแผ่น CD และด้วยข้อจำกัดที่รายละเอียดภาพ 352 x 288 25 fps PAL , 352 x 240 30 fps NTSC เท่ากับระบบอนาลอกแต่มันใช้วิธีการสแกนแบบ progressive โดยมีอัตราการส่งข้อมูลอยู่ที่ระดับ 1.5 Mbps สามารถมีสัญญาณเสียงสองช่องที่ต่อมาระบบของการบันทึกเสียงแบบนี้ได้รับความนิยมมากคือ MP3
MPEG – 2
เป็นมาตรฐานการบีบอัดที่ในปัจจุบันถูกนำมาใช้งานอย่างกว้างขวาง เริ่มต้นประกาศใช้งานอย่างเป็นทางการในปี 1994 และปัจจุบันถูกนำมาใช้เป็นมาตรฐานเพื่อการออกอากาศโทรทัศน์มากที่สุดพอๆกับการนำไปใช้งานเพื่อการบันทึกแผ่นดีวีดี มันถูกออกแบบให้รองรับวิดีโอที่มีรายละเอียดสูงสุดรวมทั้งวิดีโอแบบ HDTV สำหรับสัญญาณวิดีโอที่มีความคมชัดตามปกติแล้วจะมีอัตราการส่งตั้งแต่ 1.5 – 15 Mbps สำหรับการใช้งานเพื่อส่งสัญญาณไปออกอากาศตามมาตรฐานของ CCIR601 จะอยู่ที่ระดับ 15 Mbps แต่ในทางปฏิบัติแล้วแค่ระดับ 2.5 Mbps ก็พอใช้งานได้แล้ว สำหรับการใช้งานเพื่อทำงานในห้องสตูดิโอจะใช้เฉพาะ I – Frame ไม่ได้นำเอา B – Frame กับ P –Frame มาร่วมด้วยเพื่อให้เหมาะสมกับการตัดต่อทำให้อัตราความเร็วอยู่ทีระดับ 50 Mbps
MPEG – 2 มีโครงสร้างที่สามารถรองรับการนำไปใช้งานเพื่อการเชื่อมโยงสัญญาณที่อาจจะมีภาพกับเสียงรวมถึงข้อมูลจำนวนหลายช่องได้ ซึ่งมันจะมีข้อมูลเพื่อบ่งชี้และรวมสัญญาณไปด้วยกันทีเรียกว่า PAT (Program Association Table) นอกจากนี้ยังมีความสอดคล้องเข้ากันได้กับ MPEG – 1 และสามารถถูกนำพาโดยสื่อทีแตกต่างกันได้ รวมไปถึงการนำไปใช้งานเพื่อการออกอากาศเพื่อเครื่องรับประเภทพกพาเคลื่อนที่ได้อีกหลายประเภท
MPEG – 4
เป็นวิธีการบีบอัดสัญญาณวิดีโอด้วยความแตกต่างจากรูปแบบเดิมของทั้ง MPEG – 1 , MPEG – 2 ด้วยการพิจารณาองค์ประกอบของภาพว่าประกอบด้วยฉากพื้นหลังและวัตถุที่เป็นองค์ประกอบในภาพนั้น ภายใต้การทำงานของ MPEG – 4 ภาพจะถูกวิเคราะห์และบ่งชี้ว่าอะไรคือฉากพื้นหลังและมีวัตถุหลายอย่างที่มีการเคลื่อนไหวซ้อนทับอยู่ในภาพ ตัววัตถุจะถูกบ่งชี้แล้วทำการบีบอัดข้อมูลแยกออกต่างหาก ตัวข้อมูลของวัตถุทีมีการเคลื่อนไหวจะถูกรวมเข้าไปเป็นส่วนหนึ่งของสัญญาณวิดีโอ เมื่อมันถูกส่งไปถึงปลายทางตัวถอดรหัสจะทำการสร้างภาพขึ้นใหม่ด้วยการรวมฉากพื้นหลังเข้ากับวัตถุที่เคลื่อนไหวแต่ละอันรวมไปถึงทิศทางการเคลื่อนที่เข้าไปด้วย ทำให้ระบบของ MPEG – 4 มีความสามารถทำการบีบอัดข้อมูลได้มากกว่าและมีอัตราการส่งข้อมูลที่น้อยกว่าแบบ MPEG – 2 ทำให้มีความเหมาะสมต่อการนำไปใช้เพื่อการส่งวิดีโอแบบต่อเนื่อง (streaming) และด้วยเหตุที่มีมาตรฐานในการแยกวัตถุต่างๆออกจากกัน ทำให้เหมาะสมต่อการใช้งานในรูปแบบภาพสามมิติทั้งประเภทเกมและสื่อผสมอื่นๆ เช่นบนอินเตอร์เน็ท การผลิตและการออกอากาศรายการโทรทัศน์แบบดิจิตอล
PROFILE
|
LEVEL VIDEO
|
RESOLUTION BIT RATE
|
MAX NO OFF OBJECTS
|
Simple Profile
|
L1 QCIF
L2 CIF
L3 CIF
|
176 x 144 64 Kbps
352 X 288 128Kpbs
352 x 288 384Kpbs
|
4
4
4
|
Core Profile
|
L1 QCIF
L2 CIF
|
176 x 144 384Kbps
352 x 288 2 M bps
|
4
16
|
Main Profile
|
L2 CIF
L3 ITU 601
L4 HD
|
352 x 288 2 M bps
720 x 480 15 M bps
1920 x 1088 38.4 Mbps
|
16
32
32
|
นอกจากนี้การเข้ารหัสแบบ MPEG – 4 ยังได้รับการพัฒนาต่อมาอีกด้วยความร่วมมือกันระหว่าง MPEG (Moving Picture Expert Group) และ VCEG (Video Coding Expert Group) โดยมีการประกาศมาตรฐานการเข้ารหัสแบบใหม่ในปี 2003 เรียกว่าระบบ H.264/AVC โดยมีการปรับปรุงและพัฒนาให้การเข้ารหัสมีประสิทธิภาพมากยิ่งขึ้นและเหมาะสมต่อการปรับเปลี่ยนการใช้งานบนเครือข่ายของอินเตอร์เน็ททั้งแบบมีสายและแบบไร้สาย รวมไปถึงการนำไปใช้เป็นมาตรฐานของ HD – DVD และ Blue – ray DVD เป็นต้น
TV and Video
มันเป็นเรื่องสำคัญทีจะทำความเข้าใจถึงความแตกต่างกันระหว่างทั้งสองประเภทนี้โดยพิจารณาเปรียบเทียบโดยละเอียดระหว่างวิดีกับโทรทัศน์ ในโลกของโทรทัศน์คือคุณสมบัติของการใช้วิธีสแกนแบบแทรกสอดเพื่อให้ประหยัดช่องสัญญาณส่งออกอากาศที่มีจำกัด และใช้ข้อกำหนดอัตราการสร้างภาพกับรายละเอียดภาพและสีด้วยวิธีการแบบอนาลอก ทำให้มีมาตรฐานระบบต่างกันเป็น NTSC , PAL , SECAM และถึงแม้ว่าในระบบทีวีแบบดิจิตอลเองแล้วยังต้องมีความแตกต่างกัน ว่าอิงกับระบบอนาลอกเดิมแบบใดเช่นอัตราการสร้างภาพ จำนวนจุดภาพทั้งแนวตั้งและแนวนอนที่มีความแตกต่างกัน แต่ในโลกของวิดีโอมันจะไปเกี่ยวข้องกับการนำไปใช้งานบนเครือข่ายอินเตอร์เน็ทและถูกนำเสนอบนจอภาพของเครื่องคอมพิวเตอร์ที่ใช้วิธีการสร้างภาพแบบ Progressive scan
Video Files
ข้อมูลที่เป็นวิดีโอไม่จำเป็นต้องถูกนำส่งออกไปภายหลังจากการบีบอัดข้อมูลเสมอไป ตามปกติมันจำเป็นต้องถูกจัดเก็บอยู่ในรูปแบบของแฟ้มข้อมูลและใช้งานเกี่ยวข้องกับอุตสาหกรรมสื่อผสม แฟ้มข้อมูลมีอยู่หลายแบบที่ต้องขึ้นอยู่กับระบบปฏิบัติการโดยเฉพาะของมันเองและส่วนมากถูกจัดเก็บไว้ในเครื่องคอมพิวเตอร์ หรือไม่ก็ขึ้นอยู่กับมาตรฐานการบีบอัดที่นำมาใช้งาน ในปัจจุบันนี้การแปลงไฟล์ของวิดีโอกระทำได้ง่ายมากด้วยการใช้ซอฟแวร์ที่มีหลากหลายโปรแกรมให้เลือกใช้
The Window AVI Format (. Avi)
AVI (Audio Video Interleaved) เป็นมาตรฐานสำหรับวิดีโอที่ใช้งานอยู่บนเครื่องคอมพิวเตอร์ที่ใช้ระบบปฏิบัติการวินโดว์ ที่มีอุปกรณ์เข้ารหัสติดมาด้วยสำหรับสร้างวิดีโอแบบ AVI ด้วยการสุ่มสัญญาณภาพและเสียงที่ป้อนให้โดยปราศจากการบีบอัด ด้วยเหตุนี้มันถูกใช้เพื่อการจัดเก็บไว้ภายในเครื่องคอมพิวเตอร์แต่ไม่ใช่สำหรับส่งผ่านเครือข่าย
Window Media Format (.wmv)
เป็นรูปแบบวิดีโอของบริษัทไมโครซอฟท์และใช้งานอยู่บนวินโดว์มีเดีย 9 ที่เป็นทั้งตัวเข้ารหัสกับถอดรหัสและเป็นเครื่องเล่นสื่อด้วย แต่ถ้าต้องการเอามันไปใช้บนเครื่องคอมพิวเตอร์ที่มีระบบปฏิบัติการแบบอื่นก็จำเป็นต้องมีซอฟแวร์เฉพาะ
MPEG Format (. mpg)
เป็นดังชื่อของมันเองคือวิดีโอและออดิโอที่ถูกบีบอัดให้เป็นทั้งแบบ MPEG – 1 , MPEG – 2 ข้อมูลไฟล์แบบนี้ถือว่าเป็นมาตรฐานสากล เพราะเครื่องคอมพิวเตอร์ที่มีระบบปฏิบัติการทั้งแมคและวินโดว์รองรับการใช้งานทั้งคู่
Quick Time Format (. mov)
ควิคไทม์เป็นรูปแบบวิดีโอที่เป็นของบริษัทแอปเปิ้ลคอมพิวเตอร์ มันถูกนำไปใช้งานทั้งในวงการอุตสาหกรรมวิดีโอพอๆกับการใช้งานด้านกราฟฟิคและการนำเสนอผลงาน อย่างไรก็ดีมันมีความใกล้เคียงกับระบบ MPEG – 4 และระบบของ H.264/AVC เครื่องเล่นสื่อแบบควิคไทม์พบเห็นได้ในระบบปฏิบัติการของเครื่องคอมพิวเตอร์เกือบทั้งหมด
RealMedia Format (. rm)
รูปแบบของมันเริ่มเป็นที่นิยมมากขึ้นตามปริมาณการใช้งานบนอินเตอร์เน็ท ทั้งนี้ตัวโปรแกรมในการผลิตและเครื่องเล่นสื่อแบบพื้นฐาน สามารถหาดาวโหลดได้ฟรี ตัวเว็บไซด์เองทั้งหมดรองรับเนื้อหาที่เป็นเรียลฟอร์แมท
Flash Video (. flv)
รูปแบบวิดีโอแบบนี้ได้รับความนิยมมากขึ้นเนื่องจากมันถูกใช้งานเพื่อการนำส่งวิดีโอชนิดที่เรียกว่า web – based การนำไฟล์ไปใช้งานทำได้ด้วยโปรแกรม Adobe Flash Player รวมไปถึงโปรแกรมแบบที่มีมาพร้อมกับตัวเว็บเบราเซอร์เอง (Plug – in) มันถูกนำมาใช้กับเว็บไซด์ยอดนิยมอย่าง YouTube , Google , Yahoo ตัวโปรแกรมเครื่องเล่นสื่อสามารถหาดาวโหลดและติดตั้งได้ฟรี
The DivX Format
ได้ชื่อมาจากตัวเข้ารหัสที่เป็นของบริษัท DivX Inc. ที่นอกจากจะสามารถใช้เครื่องเล่นด้วยตัวโปรแกรมเล่นสื่อของตัวเองแล้ว ยังสามารถนำตัวโปรแกรมของมันไปไว้บนโปรแกรมเล่นสื่ออื่นเช่นวินโดว์มีเดียก็ได้ ตัวสื่อเองก็ทำให้เป็นทั้งวิดีโอสตรีมและออดิโอสตรีมได้หลายช่องพร้อมกันและยังสามารถใส่ซับไตเติ้ลลงไปได้อีก มีรายละเอียดภาพให้เลือกใช้ได้หลายระดับตั้งแต่การใช้งานสำหรับอุปกรณ์ประเภทพกพาไปจนถึงระดับความชัดเจนสูงแบบ HD และที่สำคัญคือมันสามารถบีบอัดข้อมูลของแผ่น DVD ตามปกติที่มีข้อมูลขนาด 4.7 GB ให้เหลือเพียงแค่ 700 MB ซึ่งมีผลดีทำให้การดาวโหลดข้อมูลจากอินเตอร์เน็ทใช้เวลาน้อยลงไป นอกจากนี้มันยังถูกนำไปใช้กับเครื่องเล่นเกมเช่น Sony PlayStation
MXF File Format
File Containers and Wrappers
ในกรณีของภาพและเสียงที่จำเป็นต้องจัดเก็บให้อยู่ในรูปแบบแฟ้มข้อมูลแล้ว วิธีการทั่วไปคือการใช้ภาชนะจัดเก็บหรือเรียกง่ายๆว่าหาถังมาบรรจุภาพและเสียง ซึ่งต่อมาภาพและเสียงก็ถูกวางไว้ในตัวห่อหุ้มแฟ้มอีกทีหนึ่งที่จะทำหน้าที่บรรยายถึงชนิดของเนื้อหาภาพและเสียงรวมไปถึงข้อมูลรายละเอียดที่เกี่ยวข้อง แฟ้มข้อมูลที่ถูกจัดเก็บเหล่านี้เป็นที่รู้จักรับรู้ได้โดยการใช้ตัวห่อหุ้มที่เหมาะสมเช่น QuickTime , Flash Video , MP4 , DivX , MPEG หรือชนิดอื่นใดก็ตาม
File Format Converters
Audio Coding
มีหลายวิธีในการนำเสนอสัญญาณเสียง ขึ้นอยู่กับว่าเป็นชนิดที่ถูกบีบอัดหรือไม่และใช้มาตรฐานการบีบอัดชนิดใด รูปแบบของมันเป็นไปตามระบบปฏิบัติการของเครื่องคอมพิวเตอร์นั้นๆ
มาตรฐานของระบบเสียงยังคงขึ้นอยู่กับการนำไปใช้งานด้านใด เช่นถ้าเป็นดนตรีต้องการเสียงที่มีคุณภาพสูงที่มีย่านความถี่ 20 – 20 KHz ที่มีสองช่องหรือมากกว่า แต่ถ้าเป็นเครื่องโทรศัพท์เคลื่อนที่ใช้เพียง 100 Hz – 4 KHz สำหรับเสียงพูดคุยก็เพียงพอ
Audio Sampling Basics
ย่านความถี่เสียงที่หูมนุษย์ได้ยินเริ่มต้นจาก 20 Hz ถึง 20 KHz และเพื่อให้รองรับย่านความถี่เสียงในแบบดิจิตอลแล้ว มีความจำเป็นต้องนำเอาความถี่เสียงมาสุ่มระดับค่าด้วยอัตราความถี่สูงเป็นอย่างน้อยของความถี่สูงสุด เช่นดังต่อไปนี้
- Audio CD : 44.1 KHz 16 bit
- DATs : (Digital Audio Tapes) : 48 KHz 16 bit
- DVDs : 48 – 192 KHz 16 – 24 bit
ยิ่งมีจำนวนบิทที่จำเป็นต้องเข้ารหัสมากขึ้นก็ยิ่งทำให้ได้รับระดับย่านของการเปลี่ยนแปลงระดับความดังของเสียงมากขึ้นตามไปด้วย แต่ถ้าใช้จำนวนบิทน้อยก็จะทำให้เกิดสัญญาณรบกวนและสูญเสียความเป็นธรรมชาติไป กระบวนการของการสุ่มเสียงและการเข้ารหัสก่อให้เกิดข้อมูลเสียงแบบ PCM (Pulse Code Modulated) ที่นิยมใช้งานในห้องสตูดิโอบันทึกเสียง
Audio Interfaces
เมื่อนำเอาสัญญาณเสียงมาเข้ารหัสเช่นการแปลงให้เป็น PCM มันจะประกอบด้วยข้อมูลที่เรียงต่อเนื่องกันไป (bit stream) ทำให้มีความจำเป็นต้องมีการเชื่อมต่อกันตามรูปแบบข้อมูลเสียงด้วย เช่นตัวอย่างของระบบ AES – 3 (Audio Engineering Society) หรือของ EBU (European Broadcast Union) เป็นมาตรฐานการเชื่อมต่อทางกายภาพของเสียงด้วยการใช้สายสองเส้นคู่และหุ้มฉนวนป้องกันการรบกวนที่สามารถใช้งานได้ที่ระยะประมาณไม่เกิน 100 เมตร ในกรณีตามปกติจะมีอัตราการส่งข้อมูลที่ระดับ 2 – 3 Mbps ขึ้นอยู่ที่อัตราการสุ่มข้อมูลAudio Compression
ในการนำไปใช้งานเกือบทั้งหมด สัญญาณเสียงจำเป็นต้องถูกนำส่งด้วยระดับความเร็วต่ำเพื่อให้ใช้ช่องสัญญาณเท่าที่จำเป็น ดังนั้นจึงมีความจำเป็นต้องทำการบีบอัดก่อน
Audio Source
|
Frequency Band
|
Sampling Rate
|
Speech Telephony
Wideband Speech
Music
Music (CD Quality)
Music (Professional / Broadcast
|
200 Hz – 3.4 KHz
100 Hz – 7 KHz
50 Hz – 15 KHz
20 Hz – 20 KHz
20 Hz – 20 KHz
|
8 KHz
16 KHz
32 KHz
44.1 KHz
48 KHz
|
การบีบอัดสัญญาณเสียงตั้งอยู่บนพื้นฐานจากคุณลักษณะของหูคนที่ซึ่งไม่สามารถรับฟังเสียงทุกความถี่ได้เท่าเทียมกัน ด้วยการใช้คุณสมบัติประการสำคัญดังกล่าวทำให้สามารถนำเอามาใช้งานเพื่อการบีบอัดสัญญาณเสียงได้ หูของเราไม่สามารถแยกแยะเสียงที่เป็นสเตอริโอได้ที่ความถี่ต่ำกว่า 2 KHz ดังนั้นจึงสามารถส่งสัญญาณที่มีความถี่ต่ำแบบโมโน และถ้าเป็นระดับเสียงเบาๆแล้วหูก็จะได้ยินเฉพาะย่านความถี่เสียงกลางเท่านั้นเอง แต่ถ้าเป็นระดับเสียงที่ดังมากๆแล้วมันจะกลบเสียงที่มีความถี่ใกล้เคียงไปเลย ในกรณีเช่นนี้การบีบอัดก็สามารถละทิ้งเสียงที่ใกล้เคียงดังกล่าวได้เลย
Audio Compression and Coding Principle
การเข้ารหัสสัญญาณเสียงใช้ผลทีได้รับจากทฤษฎีที่มาจากการรับฟังเสียงของหูมนุษย์ด้วยการตัดข้อมูลที่ไม่จำเป็นออกไป เทคนิคที่สำคัญคือการแบ่งแยกเสียงออกเป็นหลายย่านความถี่จำนวนมาก แล้วตัดย่านความถี่ที่จะถูกบดบังด้วยเสียงที่ดังกว่าออกไป
MPEG compression
การเข้ารหัสแบบนี้ได้รับการพัฒนาให้เป็นมาตรฐานของการเข้ารหัสเสียงที่ยอมรับกันและถูกนำไปใช้อย่างกว้างขวางในวงการอุตสาหกรรมที่เกี่ยวข้อง สำหรับการเข้ารหัสเสียงหนึ่งที่นิยมใช้และรู้จักกันอย่างกว้างขวางคือแบบ MPEG – 1 Layer 3 (MP3) ที่ถูกนำมาใช้ทั้งในเครื่องเล่นสื่อและบนอินเตอร์เน็ทรวมไปถึงการนำไปใช้กับระบบเสียงของ VCD อีกด้วย อันที่จริง MPEG – 1 มันมีถึงสามระดับ (3 Layer)โดยมีความแตกต่างกันที่ความซับซ้อนและกระบวนการเข้ารหัส เช่นระดับหนึ่งใช้งานใน digital compact cassettes และระดับสองถูกนำมาใช้เพื่อการออกอากาศรายการวิทยุแบบดิจิตอล
Advanced Audio Coding (AAC)
Audio Codecs in MPEG – 4
The AMR – WB + Codec
มาจากคำเต็มว่า adaptive multi rate wideband codec เนื่องจากความต้องการนำไปใช้งานบนสภาวะแวดล้อมของอุปกรณ์ประเภทพกพาเช่นโทรศัพท์มือถือ การเข้ารหัสจะสามารถรองรับเนื้อหาที่แตกต่างกันหลายประเภทเช่น เสียงคนพูด กีฬา ข่าว เพลง โดยที่มีอัตราการส่งข้อมูลต่ำๆแต่ยังมีคุณภาพที่ยอมรับได้ ด้วยเหตุนี้การปรับเปลี่ยนอัตราการรับส่งข้อมูลต้องมีความเร็วมากพออยู่ที่ตั้งแต่ 6 Kbps – 48 Kbps สำหรับเสียงแบบสเตอริโอ
Streaming
การให้บริการเนื้อหาแบบต่อเนื่องเช่นวิดีโอเริ่มเป็นเทคโนโลยีที่นิยมมากยิ่งขึ้นเนื่องจากการเจริญเติบโตของอินเตอร์เน็ทตั้งแต่ปี 1990 เป็นต้นมา ถ้าเป็นวิธีการดาวโหลดข้อมูลขนาด 20 MB ที่สามารถนำมาดูเพียงสามนาทีผู้ชมอาจต้องเสียเวลารอคอยมากกว่านั้นด้วยซ้ำไป แต่ถ้าเป็นวิธีการแบบสตรีมมิ่งแล้วสัญญาณภาพและเสียงจะถูกนำส่งไปยังผู้รับอย่างต่อเนื่องตั้งแต่เริ่มต้นเลย ทำให้เป็นผลดีต่อผู้ใช้งาน
กระบวนการเช่นนั้นมีความเป็นไปได้ด้วยการใช้วิธีการเข้ารหัสที่มีประสิทธิภาพสูงและวิธีการทำให้เกิดข้อมูลแบบต่อเนื่องด้วยการปรับเปลี่ยนจากรูปแบบที่ถูกจัดเก็บ (storage format)ไปเป็นรูปแบบที่บรรจุหีบห่อ (packetized format) พร้อมสำหรับการจัดส่งไปบนเครือข่ายอินเตอร์เน็ท
Streaming Network Architecture
การจัดส่งข้อมูลแบบต่อเนื่องมีส่วนเกี่ยวข้องดังต่อไปนี้ นำเอาเนื้อหาที่ต้องการส่งมาเข้ารหัส แล้วทำการแปลงข้อมูลให้พร้อมเพื่อส่งต่อไปยังเครื่องเซิฟเวอร์เพื่อให้ทำหน้าที่ส่งข้อมูลออกไปตามเครือข่าย และเมื่อข้อมูลไปถึงผู้รับก็สามารถใช้โปรแกรมเล่นสื่อเพื่อการรับชมได้
กระบวนการทำงานแบบส่งข้อมูลเนื้อหาแบบต่อเนื่องนี้ทำได้โดยการพัฒนาโปรแกรมของบริษัทชั้นนำเช่น RealNetworks , Microsoft Windows Media Platforms , Apple QuickTime Multimedia โปรแกรมการใช้งานทั้งหลายเหล่านี้ได้รับความนิยมและนำไปใช้งานอย่างแพร่หลาย
The Capture and Encoding Processes
การจัดเก็บภาพวิดีโอจะเป็นเรื่องเกี่ยวข้องกับการยอมรับให้ขบวนของข้อมูลภาพและเสียงที่เหมาะสมกับรูปแบบที่พีซีการ์ดรู้จักทำการบันทึกอย่างต่อเนื่อง สัญญาณขาเข้าของพีซีการ์ดอาจเป็นแบบที่ถูกบีบอัดมาก่อนแล้วหรือว่ายังไม่ถูกบีบอัดก็ได้ โดยที่ภายหลังจากผ่านการบีบอัดแล้วแฟ้มข้อมูลจะถูกจัดเก็บอยู่ในรูปแบบที่เหมาะสมเช่น .mpg หรืออาจเป็น .mp4 ขึ้นอยู่กับตัวเข้ารหัสนั้นๆ
File Conversion To Streaming Format
ในการต้องการทำให้แฟ้มข้อมูลถูกนำส่งออกไปแบบขบวนของภาพเคลื่อนไหวตามความเป็นจริง มันจำเป็นต้องมีข้อมูลการควบคุมเรื่องของเวลา ที่ซึ่งสามารถใช้โดยเครื่องเซิฟเวอร์สำหรับบริหารจัดการอัตราการนำส่ง ด้วยวัตถุประสงค์เช่นนี้แฟ้มข้อมูลจึงถูกแปลงให้เป็นรูปแบบของกระแสข้อมูลที่เรียกว่าสตรีมมิ่ง ด้วยการเพิ่มข้อมูลการควบคุมเวลาลงไปด้วย
Streaming Serving
กระบวนการเหล่านี้เกี่ยวข้องกับช่องทางสองช่องที่แยกออกจากกันคือช่องทางการควบคุมและช่องทางของข้อมูลวิดีโอก่อให้เกิดการนำส่งข่าวสารอย่างต่อเนื่อง รวมไปถึงข้อมูลป้อนกลับของเครื่องลูกข่ายไปยังแม่ข่าย เช่นเครื่องลูกข่ายจะให้ข้อมูลถึงหมายเลขและจำนวนของพัสดุที่ได้รับรวมไปถึงคุณภาพของข้อมูล ตัวแม่ข่ายก็จะทราบว่ามีสภาวะผิดปกติอะไรบ้างเพื่อทีจะได้จัดส่งข้อมูลตามที่เครื่องลูกข่ายต้องการเป็นต้น ตัวอย่างเช่นเครื่องแม่ข่ายอาจจัดส่งข้อมูลที่อัตราตั้งแต่ 64 Kbps , 128 Kbps , 256 Kpbs หรืออาจเลือกอัตราการสร้างภาพที่ต่ำลงมาเนื่องจากข้อจำกัดของช่องสัญญาณเอง
Streaming Serving and Bandwidth Management
Streaming Player and Servers
RealNetworks
การทำงานประกอบด้วยตัวเข้ารหัสและตัวแม่ข่าย ตัวข้อมูลที่เป็น RealVideo เองตั้งอยู่บนกฎเกณฑ์ของการเข้ารหัสแบบ MPEG – 4 มันสามารถทำการเข้ารหัสด้วยอัตราที่แตกต่างกันได้และทำการส่งข้อมูลได้หลายระดับความเร็วเช่นกันด้วยการรับข้อมูลป้อนกลับจากเครื่องลูกข่ายเช่นจาก 64 Kbps – 128 Kbps
Microsoft Windows Media Format
Apple QuickTime
มันเป็นชุดเครื่องมือที่สมบูรณ์แบบที่รองรับสื่อผสมและการทำงานแบบสตรีมมิ่ง มีทั้งตัวเครื่องเล่นสื่อที่เป็นโปรแกรมและแบบที่เป็นชนิด plug – in บนโปรแกรมเบราเซอร์ มันสามารถรองรับทั้งภาพ เสียง
บทสรุป
เท่าที่ผ่านมาจะเห็นได้ว่าองค์ประกอบหลักของสื่อผสมก็คือภาพ ขนาดของภาพถูกกำหนดโดยจุดสร้างภาพ (pixel) และมีผลต่อขนาดของข้อมูลที่ต้องการนำเสนอ และขนาดของข้อมูลก็สามารถทำให้มีขนาดลดลงด้วยวิธีการบีบอัดเช่น JPEG แต่ถ้าในกรณีของภาพเคลื่อนไหวแล้วมันก็คือชุดอนุกรมของภาพหลายๆภาพต่อเนื่องกันไป (Frames) ระบบโทรทัศน์จะนำเสนอภาพที่อัตรา 25 – 30 frame / sec. มันมีวิธีการลดอัตราการส่งข้อมูลที่เป็นวิดีโอ ด้วยการบีบอัดข้อมูลหรือด้วยการลดอัตราการสร้างภาพต่อวินาทีลง มันมีวิธีการบีบอัดข้อมูลอยู่หลายแบบ เริ่มต้นจาก MPEG – 1 แล้วก็เพิ่มความซับซ้อนมากยิ่งขึ้นเป็น MPEG – 2 ที่ทุกวันนี้ถูกใช้งานเพื่อการออกอากาศรายการโทรทัศน์แบบดิจิตอล MPEG – 4 / H.264 เป็นระบบที่ได้รับการพัฒนาให้มีประสิทธิภาพในการลดอัตราการส่งข้อมูลลงทำให้สามารถนำไปใช้งานได้กับอุปกรณ์ประเภทพกพาและบนอินเตอร์เน็ทได้อย่างมีประสิทธิภาพมากยิ่งขึ้น สำหรับเสียงก็มีความจำเป็นต้องทำการเข้ารหัสเช่นเดียวกันเริ่มต้นจาก MPEG – 1 Layer 3 (MP3) ต่อมาเป็น AAC (MPEG – 2 part 7) และเป็น MPEG – 4 AAC สำหรับดนตรีและ AMR สำหรับเสียงพูด ทั้งหมดนี้จะเห็นได้ว่าวิธีการบีบอัดข้อมูลทำให้การรับส่งสื่อผสมเพื่อนำไปใช้งานในชีวิตประจำวันมีความเป็นไปได้
ความคิดเห็น
แสดงความคิดเห็น