Технологія MPEG-4
Одночасне відтворення декількох об'єктів MPEG-4 координується окремим рівнем, виділеним спеціально для забезпечення синхронізації. Елементарні потоки розбиваються на пакети, після чого проводиться їхнє тактування (розподіл часових інтервалів). Після цього пакети готові для передачі на так називаний транспортний рівень.
Потоки тут, потоки там…
Тимчасова інформація необхідна для декодування даних. У ній зберігається тактова частота синхронізатора (таймера) кодера й оцінки часу вхідних потоків відносно цього синхронізатора. Оцінки часу можна розділити на два типи. Оцінки першого типу вказують, коли повинна декодуватися чергова порція інформації, другого - для вказівки моменту готовності інформації до відтворення.
Варто розрізняти ці два типи оцінок. У деяких алгоритмах стиску відеоінформації деякі кадри визначаються шляхом інтерполяції попереднього і наступного кадрів. Таким чином, поки черговий кадр декодується і готується до відтворення, наступний вже повинний бути декодований і поміщений у буфер. Тому, для забезпечення більшої продуктивності декодера в тимчасову інформацію, як правило, додатково записують і параметри буферизації.
Висловлюючись термінологією семирівневої комунікаційної моделі ISO, MPEG-4 не використовує ніякий принципово новий механізм передачі даних. Існуючих на той час засобів виявився цілком достатньо: потік передачі MPEG-2, асинхронний режим передачі (ATM) і Internet-протокол передачі в реальному часі (RTP). Доречі, потік передачі MPEG-2, використовуваний у цифровому телебаченні, згодом зробив істотний вплив на визначення стандартів радіомовлення.
Для кожного потоку даних може встановлюватися окремий канал передачі. Тому у випадках, коли сцена MPEG-4 містить досить велику кількість таких потоків, процес стає громіздким і неефективним. Щоб уникнути подібних ситуацій у MPEG-4 був включений додатковий інструмент, так званий FlexMux, що грає роль проміжної ланки для перетворення даних у зручну для передачі форму. Пізніше в MPEG-4 був доданий ще один інтерфейс, що дозволяє прикладній програмі посилати запит на з'єднання по заданих параметрах: пропускній здібності устаткування, коефіцієнту помилок, параметрам затримки і т.п.
З погляду прикладної програми цей інтерфейс однаковий як для широкомовних каналів зв'язку й інтерактивних сеансів так і для локальної роботи. У зв'язку з цим розробникам при написанні коду навіть не доводиться замислюватися про те, які механізми лежать в основі. Наступний реліз MPEG-4 уже дозволяв використовувати різні канали передачі на протилежних вузлах мережі для прийому/передача.
Ще одним істотним нововведенням другої версії було введення формату mp4 і засобів конвертації з форматів попередніх версій. Раніш, при використанні MPEG-1 і MPEG-2, таких засобів не було, але для MPEG-4, передбаченого для використання в Internet, вони були просто необхідні.
Візуалізація об'єктів
Класичне "прямокутне" відео є одним із стандартних візуальних об'єктів. Об'єкти довільної форми могли кодуватися окремо від фону, а вже згодом сполучатися з ним і іншими об'єктами.
MPEG-4 пропонує два методи опису об'єктів довільної форми, кожний із який має свої переваги. Відповідно до першого (двійкового) методу будь-який піксел (заданого кольору, яскравості і т.п.) може бути або не бути частиною розглянутого об'єкта. Такий найпростіший, але досить "сирий" підхід ефективний для роботи при низкою швидкості передачі даних. Однак його наслідки - явна "незграбність" елементів зображення, зазублини на вигинах кривих - можуть дратувати.
Для одержання високоякісного зображення використовується інша методика, так називана шкала півтонів (gray scale). Відповідно до цієї методики, кожний пыксел незалежно від того, до якого об'єкта він належить, крім значень "включений" і "виключений" характеризується ступенем прозорості. Завдяки цьому забезпечується ефект згладженого фону та усіх видимих об'єктів.
Класичний приклад згладженого зображення можна побачити по телевізоріу під час трансляції прогнозу погоди. Здається, що карта знаходиться за спиною в диктора, що знаходиться на передньому плані. Насправді вона генерується окремо, після чого об'єкти сполучаються.Технологія MPEG не визначає точний алгоритм формування візуальних об'єктів. Цей алгоритм, названий відеосегментацією, усе ще залишається метою інтенсивних досліджень. Відомі на сьогоднішній день методи дозволяють вирішити цю задачу, однак вони мають деякі обмеження. Одним із способів відтворення складних об'єктів є їхній запис на блакитному або зеленому фоні (кольори, що потім легко відфільтрувати).