gulus_news_007_page6.php3 from Gulus at Krugle
Show gulus_news_007_page6.php3 syntax highlighted
<HTML>
<HEAD>
<TITLE>Gulus_News.007</TITLE>
</HEAD>
<BODY LINK="#101010" VLINK="#000000">
<BR><BR><CENTER>
<TABLE CELLSPACING="0" CELLPADDING="0" BORDER="0" WIDTH="774">
<TR>
<TD WIDTH="17"><IMG SRC="images/top_left.gif" WIDTH="17" HEIGHT="58" ALT=" "></TD>
<TD WIDTH="738" BACKGROUND="images/top_middle.gif"> </TD>
<TD WIDTH="19"><IMG SRC="images/top_right.gif" WIDTH="19" HEIGHT="58" ALT=" "></TD>
</TR>
<TR>
<TD WIDTH="17" BACKGROUND="images/middle_left.gif"> </TD>
<TD WIDTH="738" BACKGROUND="images/middle_middle.gif">
<!--// MAIN STUFF GOES HERE //-->
<CENTER><H1>MPEG-4</H1>
<IMG SRC="images/split.gif" WIDTH="675" HEIGHT="27" ALT=" - . . . -"><BR><BR>
<TABLE CELLSPACING="0" CELLPADDING="1" BORDER="0" BACKGROUND="images/couleur_noir.gif" WIDTH="95%">
<TD WIDTH="100%">
<TABLE CELLSPACING="0" CELLPADDING="5" BORDER="0" BACKGROUND="images/couleur_cyan.gif" WIDTH="100%">
<TD WIDTH="100%"><FONT COLOR="#000000">
<PRE>
--[4. MPEG-4]---------------------------------------------[Benoit Leblanc]--
Ça passe ou ça casse! Les poursuites semblent se poursuivent et
s'en chaînent. Que ce soit DESCCD, RIAA, Napster, MP3.com, mp3boards,
MPAA, tous résultent d'un même tronc: la technologie qui ne cesse de
progresser commence à faire perdre le marché des compagnies depuis
longtemps établies dans le domaine. L'idéale serait que ce soit eux qui
s'ajustent à ces nouvelles technologies pour en profiter à leur avantage,
et pourquoi ne participeraient-ils pas au progrès de ces technologies?
Mais, ils semblent préférer avoir recours à leur avocats pour faire
ralentir, autant qu'il leur soit possible, cette technologie qui met en
danger leurs futur profits potentiels.
Heureusement, ce n'est pas le cas de toutes les compagnies. Un bon
exemple d'une telle technologie est MPEG4. Cela fait déjà plus de trois
ans qu'on entends parler ici et là de cette technologie, dite
révolutionnaire, qui permettra à l'InterNet de remplacer nos postes de
télévisions par notre modeste ordinateur. Le standard mpeg-4 ISO/IEC qui
fût développé par MPEG (Moving Picture Experts Group), le comité qui a
aussi développé les normes MPEG1 (VCD) et MPEG2 (télévision numérique)
s'est fait accepté en octobre 1998. Cet article tentera de faire la
lumière sur cette nouvelle technologie qui fera surface d'ici quelques
mois sur vos sites web préférés.
La meilleur façon de comprendre MPEG-4 est de comprendre d'où elle
provient. Ce standard n'est rien de plus que la fusion de trois monde:
l'informatique, les télécommunications et la télévision. Il est le
résultat d'un effort international regroupant des centaines d'ingénieurs
et de chercheurs du mon entier et de divers milieux: université, centre
de recherche, grands groupes informatique (IBM, Microsoft, Sun, ..) et de
télécommunications (AT&T, France Telecom, ..) et autre grands groupes
industriels (Phillips, Sony, ..). Le but de cette technologie est
d'assurer une standardisation technologique à tous les niveaux:
production, distribution et diffusion.
Les toutes premières versions du standard MPEG permettaient d'encoder
les images ainsi que le son d'une façon optimum en encodant que les
pixels changeants d'une image à l'autre (et quelques autres techniques
de compression d'images). Mais cette compression n'était pas tellement
distribuable. Un film d'une durée de 1h30 compressé par la méthode
MPEG-1 prend environ 1.5 gig, difficilement copiable sur un cdrom qui
n'offre qu'une capacité de 650 megs! Maintenant, avec la nouvelle
façon d'encoder une scène avec l'orienté objet, 1h30 encodé avec MPEG-4
prend 525 megs! Il y a encore de la place pour y copier différentes
traductions et pourquoi pas de l'information sur les objets affichés
(Quand le nom de famille du personnage de Tracy Flick, du film Election,
est écrit en lettres majuscules, il peut facilement être confondu avec un
certain mot profane. ).
Ce niveau de compression est atteint par la représentation d'une scène
en tant que plusieurs objets plustôt que de pixels. Par exemple, une
scène comportant une table et un personnage serait représenté comme
ceci: le personnage (composé d'une tête (composé de deux yeux et une
bouche, et le reste), deux bras, deux jambes, un chandail, un pantalon,
des souliers et un chapeau, et le reste), une table (composée d'une
lampe, et tout le reste), et tout le reste. L'objet "tout le reste"
serait les éléments statique, qui ne changement pas tout au long de la
scène. Ces éléments seraient les oreilles, le nez, les cheveux, le coup,
les pattes de la table et le fond de la pièce (composé des tableaux, de
la tapisserie, des rideaux, et de la fenêtre). Le langage utilisé pour
décrire une scène ressemble étrangement au VRML dans sa structure et ses
fonctionnalités. Cette façon de décomposer une scène en plusieurs objets
et sous objets, permet une "scability" qui offre une multirésolution
basée sur le contenu de la scène.
Je ne peux vous cacher mon enthousiasme devant cette nouvelle
technologie. Par sa façon d'encoder les images, MPEG-4 offre une
liberté jamais atteinte par aucune technologie précédente. En effet,
grâce à sa façon regrouper les sous-objets en objets, MPEG-4 offre des
transformations géométriques et acoustiques sur tous les composants d'une
scène vidéo. Il est donc possible de déplacer un objet, par exemple, le
rayon laser d'un blaster, seulement en modifiant ses coordonnées X,Y en
relation avec les autre éléments de la scène. Il est aussi possible de
changer la position de la caméra selon la préférence du spectateur (ce
mot prendra d'ailleurs tout son sens lorsque cette technologie fera
surface).
Pour entrer plus dans les détails de cette technique d'encodage, la
description d'une scène est composée par les informations suivantes:
i. La façon de coder un groupement d'objets.
Une scène MPEG-4 suit une structure hiérarchique qui
peut être représentée comme un graphe acyclique. Chaque
feuille représent un objet média. La structure de
l'arbre est dynamique. Il est possible de déplacer,
d'ajouter ou d'effacer des feuilles de l'arbre.
ii. Le positionnement spatial et temporel des objets.
Tous les objets audiovisuels sont à la fois spatiaux et
temporels. Chaque objet média a un système de coordonnées
locales. Les objets média sont disposés dans la scène
après avoir subi une transformation du repère local au
repère global, transformation définie par un de ses
parents.
iii. La valeur attribuée à la sélection.
Chaque noeud et feuille de l'arbre contient en ensemble
d'informations. Certaines sont accessible et d'autre
restent fixes. Il est alors possible de les paramètrer
comme on veut suivant les informations données par
l'acteur et des contraintes définies par l'auteur.
iv. Un autre type de transformation pour les objets média.
La structure d'une scène MPEG4 ressemble étrangement à
celle du VRML et ses possibilités d'interaction. Ceci
représente l'ambition majeure de MPEG4.
Au risque de m'étendre éternellement sur les incroyables possibilités
que permet MPEG-4 à tous les cinéastes en herbe, je vais simplement
terminer cet article en parlant des outils qu'offre ce standard, ainsi
qu'un exemple de leurs implémentations. MPEG4 permet le stockage, la
transmission et la manipulation de tous les objets visuels de manière
simple et efficace.
Les outils provenant du standard permettent également le décodage et la
représentation des images ou des vidéos contenus dans les VO (Vidéo
Objetcs) et de les associer à d'autres AVOI (Audio-Video Objects) pour
créer une scène. C'est avec cette capacité en tête que les auteurs de
MPEG4 proposent des solutions et des algorithmes regroupant la plupart
des fonctionnalités requises par MPEG4:
1. la compression des images et des vidéos
2. la compression des textures mapping pour les maillages
2D et 3D
3. la compression des maillages 2D implicites
4. la compression des champs d'animation géométrique des
maillages
5. l'accès aléatoire de tous types de VO
6. l'extension des fonctionnalités de manipulation des images et
des séquences vidéo
7. le codage des vidéos et des images basées sur le contenu
8. le redimensionnement des objets basés sur le contenu
9. le redimensionnement spatial, temporel et qualitatif
10. la robustesse et la résistance aux erreurs quel que soit
l'environnement
Pour vous donner un exemple sur l'utilisation de ces outils, j'ai choisi
d'expliquer comment animer le visage d'un personnage. Dans le domaine de
l'imagerie par ordinateur, les objets synthétiques englobent une partie
importante. Ces objets sont décrits de façon paramétrique, suivant un
modèle que l'on peut diviser en quatre parties:
1. la description synthétique du visage et du corps humain
2. l'animation des champs du visage et du corps
3. le codage dynamique et statique du maillage avec les textures
4. le codage des textures suivant les vues
L'animation du visage se fait à partir d'un modèle ayant une expression
neutre (FDP: Facial Definition Parameter) contrôlée par une série de
paramètres contenus dans le FAP (Facial Animation Parametre). Pour
animer une visage, il suffira donc de télécharger le modèle, et d'envoyer
les paramètres contrôlant les mouvements du visage qui se traduiront
alors sur le visage neutre à l'aide d'un système prévu à cet effet par
MPEG4 (FIT: Face Interpolation Technique).
La partie standard relative à l'animation des visage permet d'envoyer
des paramètres de calibration et d'animatino des visages synthétiques.
Ces paramètres sont:
- définition et codage des paramètre d'animation
- positions et orientation des points caractéristiques
(points-clefs) pour l'animation du maillage du visage
- configuration des lèvres correspondant aux phonèmes de
la parole
- positions 3D des points caractéristiques
- calibration du maillage 3D pour l'animation
- carte des textures du visage
- caractéristiques personnelles
- codage des textures du visage
Comme vous l'avez constatez, MPEG-4 est bien plus d'une nouvelle version
du standard MPEG, il offre un tout nouveau éventail de possibilités. Je
n'ai pas de mal à m'imaginer que cette technologie ouvrira la porte à une
vague de réalisateurs amateurs qui distribuerons leurs films via InterNET
d'ici un an ou deux. Enfin, il nous sera possible de dire, une fois pour
toute, nos adieux à ReadVidéo!!
--
Benoit Leblanc - extrema@ottawa.com
----------------------------------------------------------------------------
</PRE>
<BR>
<DIV ALIGN="RIGHT"><A HREF="gulus_news_007_page7.php3">Next: Entrevue avec KDE</A>
</TD>
</TABLE>
</TD>
</TABLE>
</CENTER><BR><BR>
<!--// END OF MAIN STUFF //-->
</TD>
<TD WIDTH="19" BACKGROUND="images/middle_right.gif"> </TD>
</TR>
<TR>
<TD WIDTH="17"><IMG SRC="images/bottom_left.gif" WIDTH="17" HEIGHT="60" ALT=" "></TD>
<TD WIDTH="738" BACKGROUND="images/bottom_middle.gif" VALIGN="TOP"><FONT SIZE="1"><BR></FONT><?php echo date("D, j M Y : g");?>h<? echo date("i A");?></TD>
<TD WIDTH="19"><IMG SRC="images/bottom_right.gif" WIDTH="19" HEIGHT="60" ALT=" "></TD>
</TR>
</TABLE>
</BODY>
</HTML>
See more files for this project here