Aide mmoire La Vido numrique Note Il nest

Aide mémoire La Vidéo numérique Note : Il n’est pas possible de traiter de

Un petit rappel de la vision humaine… n n Sur l’image numérique, lorsqu’un rayon

Un petit rappel de la vision humaine… De forme approximativement sphérique, l'œil est l'organe

Un petit rappel de la vision humaine… cellules sensibles : n La rétine de

Un petit rappel de la vision humaine… Quand l’image réelle s’introduit dans l’œil n

Signal vidéo : n n n Sur un récepteur de télévision, une image est

Signal vidéo : n n n NTSC : standard de diffusion TV du continent

Signal vidéo : n Image en continuité parfaite : n n n Les demi-images

Signal vidéo : Dans le standard PAL, à raison de 625 lignes par image,

Signal vidéo : 1 octet = 8 bits O O I I O I

Co. Dec pour COmpression / DECompression) n n Problème : Une image d'une vidéo

Le MPEG Moving Pictures Experts Group)) q Dans de nombreuses séquences vidéos, de nombreuses

Caractéristiques du MPEG-1 n La norme MPEG-1 représente chaque image comme un ensemble de

Standards et normes vidéos n n n le MPEG-1, développé en 1988, est un

Formats vidéos n n Le format Div. X est un format de compression/décompression vidéo

Slides: 15

Download presentation

Aide mémoire La Vidéo numérique Note : Il n’est pas possible de traiter de manière approfondie un sujet comme la vidéo numérique. Cette courte présentation n’a comme prétention que de vous donner un aperçu des possibilités de montages de vidéo numérique. Des manuels destinés au grand public sont en vente dans les grandes surfaces (Vidéo numérique pour les nuls qui, contrairement à sa destination contenue dans le titre, vous donnera toutes les informations sur le sujet). Consultez l’ouvrage avant de l’acheter. ) 1

Un petit rappel de la vision humaine… n n Sur l’image numérique, lorsqu’un rayon lumineux frappe notre rétine, des terminaisons nerveuses spécialisées (ou bâtonnets) réagissent à la quantité de lumière alors que d’autres cellules (ou cônes) réagissent sélectivement au rouge, au vert et au bleu, permettant ainsi la perception des couleurs grâce à l’analyse colorimétrique de la lumière blanche. Nos yeux décomposent donc la lumière en intensité et en couleurs, ce qui signifie la décomposition en informations de luminance et de chrominance : cette 1 ere étape est réalisée quasiment à l’identique par une caméra vidéo (analogique ou numérique) par d’autres moyens, la lumière issue de l’objectif est décomposée, grâce à un procédé de filtrage, en ses 3 composantes primaires RVB. chaque composante est ensuite envoyée sur un capteur qui réagit à l’énergie lumineuse reçue (en émettant des électrons) : le signal lumineux est alors transformé en signal électrique analogue. 2

Un petit rappel de la vision humaine… De forme approximativement sphérique, l'œil est l'organe de base de la vision. Il comporte un ensemble d'éléments destinés à recevoir le rayonnement incident, former l'image des objets perçus et traiter (transférer) les informations recueillies au cerveau. n 1. 2. 3. 4. 5. L'iris: il fonctionne comme un diaphragme en dosant la quantité de lumière qui pénètre dans l'œil. Son ouverture centrale est la pupille. Le cristallin: il fonctionne comme une lentille à focale variable, grâce à sa capacité de modifier sa courbure. La rétine: c'est sur elle que se forment les images provenant de l'extérieur. La rétine contient deux types de cellules photosensibles: les cônes et les bâtonnets. La macula: appelée également tache jaune, contient en son centre une petite dépression, la fovéa. Cette dernière est la zone d'acuité maximum de l'œil. Le nerf optique: il conduit les informations au cerveau, en passant par un relais très important, le 3 corps genouillé latéral, chargé d'effectuer une première analyse des données.

Un petit rappel de la vision humaine… cellules sensibles : n La rétine de l'œil contient deux types de cellules sensibles: les cônes et les bâtonnets. n Les bâtonnets sont responsables de la vision nocturne (vision scotopique) et possèdent un maximum de sensibilité vers 510 nm. Leur sensibilité est liée à un colorant, la rhodopsine, qui blanchit à la lumière du jour, expliquant par là leur insensibilité la journée. Les bâtonnets ne fournissent qu'une réponse photométrique et ne permettent donc pas de déterminer les couleurs: la nuit, tous les chats sont gris. n Les cônes fournissent une réponse photométrique et chromatique, grâce à des pigments dont les maximums d'absorption se situent dans le bleu, le vert ou le rouge. C'est là la base de la vision des couleurs et son aspect trichromatique. 4

Un petit rappel de la vision humaine… Quand l’image réelle s’introduit dans l’œil n n n Des quantités de rayons lumineux diffusés par les objets extérieurs pénètrent dans l’œil jusqu’à la rétine située au fond de celui-ci : Un rayon lumineux traverse tout d’abord à la vitesse de 300 000 km/s la cornée, principale lentille de l’œil et qui assure 80% de la réfraction de la lumière. La rétine est parfois considérée comme une partie de « cerveau » car elle se situe à l’extrémité du nerf optique conduisant une quantité d’informations au cerveau. Les 800 000 fibres du nerf optique transmettent un tel flux d’informations au cerveau qu’elles sont considérées comme le canal de communication le plus dense de l’univers ! aucun appareil technologique n’égalise cette merveille du corps humain. Le rayon lumineux arrive dans le nerf optique sous forme chimique : il est entièrement décodé de sorte à parvenir jusqu’au cerveau en une fraction de seconde. Si le rayon vient de l’œil gauche, il passera principalement dans l’hémisphère droite du cerveau, via les fibres du nerf optique, et vice-versa. Au centre du cerveau, non loin de l’hypothalamus, se trouve le « chiasma optique » , faisceau de fibres nerveuses qui assurent la liaison entre les informations provenant des moitiés « gauches » et « droites » de chacune des deux rétines. Ce centre permet la formation d’une image CONTINUE au niveau de la « frontière » entre les 2 champs de vision. 5

Signal vidéo : n n n Sur un récepteur de télévision, une image est obtenue par balayage électronique successif des lignes de luminophores constituant l’écran. Un écran au standard PAL ou SECAM comprend 625 lignes, alors qu’un écran au standard NTSC n’en possède que 525. On sait que, pour donner à l’œil humain une impression d’éclairement continu à l’aide d’une source lumineuse émettant de façon discontinue (vidéo projecteur, projecteur de cinéma, écran TV, … ), il faut au moins 40 éclats par seconde : n n n Une fréquence de 20 à 40 éclats provoque une impression de scintillement Une fréquence au-dessous de 20 éclats, l’éclairement paraît saccadé Pour obtenir une impression de continuité parfaite avec 25 images/s, on divise chaque image en 2 demi-images projetées successivement, provoquant ainsi 50 sensations différentes par seconde. 6

Signal vidéo : n n n NTSC : standard de diffusion TV du continent nord-américain et du Japon, la fréquence du courant électrique est 60 Hz, la fréquence d’affichage est de 30 images/s (exactement 29, 97 im/s) sur 525 lignes. PAL : standard de diffusion TV couleur, qui a été mis point en Allemagne vers 1960. Son principal avantage relativement au standard américain dont il est très proche, est de remédier aux erreurs de phase dont souffre ce dernier. SECAM : standard français, il comporte 625 lignes et 25 images/s. la fréquence du courant électrique distribué en Europe est en effet de 50 Hz. 7

Signal vidéo : n Image en continuité parfaite : n n n Les demi-images ou trames sont obtenues par balayage des seules lignes paires dans un 1 er temps, puis des lignes impaires dans un 2 e temps. l’image complète est obtenue par entrelacement des 2 trames. Exemple : n le signal vidéo analogique est donc découpé en 25 ou 29, 97 images/s (en. frames), elles-mêmes divisées en 25 x 2 = 50 ou en 29, 97 x 2 = 59, 94 trames (en. fields) , celles-ci étant à leur tour analysées en 312, 5 ou 262, 5 lignes. + Trame paire = Trame impaire image 8

Signal vidéo : Dans le standard PAL, à raison de 625 lignes par image, de 864 points par ligne et de 25 images/seconde, on obtient : 625 lignes/image x 864 points/ligne x 25 images/s = 13 500 000 points/s si 1 seconde de vidéo correspond à 13 500 000 points et si l’on veut conserver toute l’information concernant ces points alors il est nécessaire de les décrire individuellement. pour 1 seconde vidéo, on doit définir 13 500 000 échantillons : la fréquence d’échantillonnage requise dans ces conditions est donc de 13, 5 MHz Quantifier directement les valeurs RVB issues des capteurs CCD (l'acronyme de "Charged Coupled Device « ou capteurs de lumière qui constituent la "pellicule numérique"), soit 3 valeurs/échantillon avec un codage de 8 bits/valeur, le débit nécessaire au transport du signal numérique serait : 13 500 000 échantillons/s x 3 valeurs/échantillon 8 bits/s = ~40 Mo/s 9

Signal vidéo : 1 octet = 8 bits O O I I O I O O O I I O O 4 7 2 0 9 1 3 2 3 octets pour définir la couleur d’un seul pixel 10

Co. Dec pour COmpression / DECompression) n n Problème : Une image d'une vidéo non compressée occupe une taille d'environ 1 Mo (en fonction du capteur de l’appareil). Afin d'obtenir une vidéo paraissant fluide il est nécessaire d'avoir une fréquence d'au moins 25 ou 30 images par seconde, ce qui produit un flux de données d'environ de 30 à 40 Mo/s, soit plus de 1. 5 Go par minute. Il est évident que ce type de débit est peu compatible avec les espaces de stockage des ordinateurs personnels ni même avec les connexions réseau de particuliers ou de petites ou moyennes entreprises. Solution : Afin de pallier cette difficulté, il est possible de recourir à des algorithmes permettant de réduire significativement les flux de données en compressant / décompressant les données vidéos. On appelle ces algorithmes Co. Dec. 11

Le MPEG Moving Pictures Experts Group)) q Dans de nombreuses séquences vidéos, de nombreuses scènes sont fixes ou bien changent très peu, c'est ce que l'on nomme la redondance temporelle. q Lorsque seules lèvres de l'acteur bougent, presque seuls les pixels de la bouche vont être modifiés d'une image à l'autre, il suffit donc de ne décrire seulement le changement d'une image à l'autre. C'est là la différence majeure entre le MPEG (Moving Pictures Experts Group) et le M-JPEG. Cependant cette méthode aura beaucoup moins d'impact sur une scène d'action. 12

Caractéristiques du MPEG-1 n La norme MPEG-1 représente chaque image comme un ensemble de blocs 16 x 16. Elle permet d'obtenir une résolution de: n n 352 x 240 à 30 images par seconde en NTSC 352 x 288 à 25 images par seconde en PAL/SECAM Le MPEG-1 permet d'obtenir des débits de l'ordre de 1. 2 Mbps (exploitable sur un lecteur de CD-ROM). Le MPEG-1 permet d'encoder une vidéo grâce à plusieurs techniques : n Intra coded frames (Frames I, correspondant à un codage interne): les images n n n sont codées séparément sans faire référence aux images précédentes Predictive coded frames (Frames P ou codage prédictif): les images sont décrites par différence avec les images précédentes Bidirectionally predictive coded frames (Frames B): les images sont décrites par différence avec l'image précédente et l'image suivante DC Coded frames: les images sont décodées en faisant des moyennes par bloc 13

Standards et normes vidéos n n n le MPEG-1, développé en 1988, est un standard pour la compression des données vidéos et des canaux audio associés (jusqu'à 2 canaux pour une écoute stéréo). Il permet le stockage de vidéos à un débit de 1. 5 Mbps dans une qualité proche des cassettes VHS sur un support CD appelé VCD (Vidéo CD). le MPEG-2, un standard dédié originalement à la télévision numérique ( HDTV) offrant une qualité élevé à un débit pouvant aller jusqu'à 40 Mbps, et 5 canaux audio surround. Le MPEG-2 permet de plus une identification et une protection contre le piratage. Il s'agit du format utilisé par les DVD vidéos. le MPEG-4, un standard destiné à permettre le codage de données multimédia sous formes d'objets numériques, afin d'obtenir une plus grande interactivité, ce qui rend son usage particulièrement adapté au Web et aux périphériques mobiles. le MPEG-7, un standard visant à fournir une représentation standard des données audio et visuelles afin de rendre possible la recherche d'information dans de tels flux de données. Ce standard est ainsi également intitulé Multi. Media Content Description Interface. le MPEG-21, en cours d'élaboration, dont le but est de fournir un cadre de travail (en anglais Framework) pour l'ensemble des acteurs du numériques (producteurs, consommateurs, . . . ) afin de standardiser la gestion de ces contenus, les droits d'accès, les droits d'auteurs, . . . 14

Formats vidéos n n Le format Div. X est un format de compression/décompression vidéo permettant d'obtenir des vidéos compressées très peu volumineuses avec une perte de qualité très raisonnable. Ainsi le format Div. X permet de stocker un film complet sur un CD-ROM de 650 ou 700 Mo Le format Xvi. D est une implémentation Open. Source du codec Divx, développée à partir de 2001, à l'occasion du passage du format Div. X original (porté par le groupe Project Mayo) à un format propriétaire. Le format Xvi. D propose ainsi une compression de très bonne qualité. Le format VP 3 est un format alternatif Open Source développé par la société On 2. La qualité des vidéos est moindre qu'en Div. X mais le format VP 3 est avant tout destiné à une utilisation en streaming. Le format 3 iv. X est un format de compression vidéo alternatif permettant une compression MPEG-4 dans des fichiers Apple Quick. Time (extension . mov), ce qui le rend particulièrement apprécié des utilisateurs de Mac. Le format 3 iv. X souffre toutefois d'une qualité bien moindre que le format Div. X. 15