La vidéo numérique DV et miniDV

Cassette miniDVCompte tenu de l’énorme parc des matériels en service dans le monde, les formats analogiques présents dans notre présentation des formats vidéo ne sont pas prêts de disparaître. Mais grâce à une qualité image et son digne des systèmes professionnels, le nouveau format vidéo numérique DV et miniDV apparut en 1995 a déjà tout pour séduire le vidéaste engagé.

Dès la généralisation du camescope, les fabricants avaient choisi leur camp : soit le format VHS puis ses dérivés VHS-C et S-VHS, soit le format 8 mm et Hi-8. La guerre des formats est révolue, puisqu’à ce jour 54 fabricants, dont tous les grands, ont signé pour un standard commun et universel de vidéo numérique grand public : le Digital Video ou DV. A la Funkausstellung de Berlin en 1995, il y avait des camescopes miniDV compatibles entre eux, aussi bien chez Sony (camp du 8 mm), que chez JVC et Panasonic (camp du VHS). Les spécifications d’un format numérique haute définition grand public DV HD ont également  été publiées : il sera compatible « descendant » avec le DV. Actuellement en cours d’études, les versions ATS et VBS essentiellement conçues pour l’enregistrement des émissions TV numériques par satellites. Dans la même famille, il existe aussi le système professionnel DVCPRO dont certaines performances sont plus élevées. Toutes ces  versions utiliseront les mêmes processus de numérisation et cassettes mais avec des durées différentes.

Avantages du DV

DV v/s analogiqueC’est donc un format numérique, d’abord conçu pour le praticien de la vidéo active. Dans un camescope miniDV, tout est traité en numérique, depuis la capture d’image jusqu’à l’enregistrement des signaux sur la cassette. Cependant, les appareils « destination » que nous utilisons aujourd’hui, téléviseur, magnétoscope, systèmes de montage, etc., étant analogiques, il va de soi que le camescope comporte d’abord une sortie numérique DV Out qui servira à visionner et copier les cassettes camescope sur des appareils également numériques compatibles, sans aucune perte de la qualité. En outre, des sorties vidéo et audio classiques vidéo composite Pal ou S-Vidéo — permettent de visionner, copier ou monter images et son selon les procédures et avec les équipements actuels. Compacité de la cassette : la cassette Mini DV mesure 66×48×12,2 mm et offre une autonomie de tournage de 60 mn. Ceci permet de créer des camescopes encore plus compacts, tels le prototype JVC pesant environ 500 grammes. La définition horizontale de l’image en luminance est portée à 500 points/ligne (au lieu de 250 en VHS/8 mm ou de 400 en SVHS/Hi-8). En chrominance, la résolution est six fois plus grande qu’en analogique. Sur l’écran, les couleurs semblent aussi nettes que les plus fins détails de l’image Pour en bénéficier totalement, il faut cependant que le système imageur du camescope assure lui-même cette haute résolution : raison pour laquelle les plus performants des premiers camescopes numériques sont tri-CCD.

Un son PCM de très haute qualité

Les spécifications indiquent les possibilités suivantes : à l’enregistrement, deux voies stéréo 12 bits/32 kHz (seule la voie Stéréo 1 étant utilisée) et, en lecture seulement, une voie stéréo 16 bits/44,1 kHz et une voie stéréo 16 bits/48 kHz, de qualité DAT ou CD audio.

Caméscope miniDV sur TV
Ci-dessus, la connexion lecteur numérique téléviseur. Très simple, il suffit de passer par les sorties analogiques du camescope.

Possibilités illimitées d’insertion image et son et de doublage de manière indépendante, notamment en conservant l’audio enregistré à la prise de vues, opération impossible en 8 mm : insertion audio seule, insertion vidéo seule et insertion vidéo + audio. Ci-dessus, la connexion lecteur numérique téléviseur. Très simple, il suffit de passer par les sorties analogiques du camescope.

Autres atouts d’image fixe (photo vidéo) — durée 5 secondes — permettant de tirer ultérieurement des images papier sur une imprimante compatible. La haute qualité « photographique » des tirages est due à la mémoire numérique interne du camescope qui capture l’image complète et non pas, comme avec la plupart des systèmes vidéo analogiques actuels, le contenu d’une seule trame, avec une résolution verticale deux fois plus faible. On a le droit de se demander si, pour bien des applications, cette méthode de photo numérique n’est pas aussi efficace et surtout moins onéreuse que celle utilisant un capteur CCD de grand format intégrant plus de deux millions de pixels et une carte RAM à très haute densité ou un disque dur portable.

MiniDV sur enregistreur analogique
Ci-dessus, la connexion lecteur numérique enregistreur analogique. Même compatibilité et câblage que pour la liaison lecteur/téléviseur.

Autre avantage, la photo vidéo du camescope peut  capturer l’image au flash électronique. Une qualité image et son inaltérable, par copie directe (un seul câble de liaison) pour le montage sur un (futur) magnétoscope enregistreur DV utilisant la plus grande cassette DV Standard de 4h30 mn d’autonomie. Celui-ci acceptera la MiniDV du camescope sans adaptateur.

Lorsqu’on relie entre eux deux appareils DV (DV In/Out), il n’y a ni compression/décompression, ni conversion A/N et N/A du signal, mais la transmission intégrale sans pertes de toutes les données numériques de la source à la destination.

Autres capacités du DV

Le time code de structure classique (SMPTE) numérote systématiquement et définitivement chaque image. Enregistrement du Data Code (date, heure, éventuellement les réglages caméra). « Marquage » (ou indexation) de points précis de la bande avec constitution de listes de séquences ou de Still photos sur le moniteur. Correcteur de base de temps (TBC) incorporé à l’appareil et code de correction d’erreurs assurant une régénération continue du signal en lecture.

Le miniDV : aspects techniques

Nous avons affaire ici à un système ayant pour objet de délivrer, y compris après recopie et montage, la plus haute qualité vidéo/audio possible.

Numérisation du signal vidéo.

Comme dans les systèmes numériques professionnels, la procédure d’enregistrement adoptée est celle des composantes numériques avec laquelle la luminance Y est enregistrée d’une part, et la chrominance C en deux sous signaux de différence de couleurs (R-Y) et (B-Y), d’autre part.

Echantillonnage de la luminance.

Qu’il s’agisse du système de télévision européen à 625 lignes/50 Hz (Pal pour simplifier) ou américain 525 lignes/60 Hz (NTSC pour simplifier), la luminance Y est échantillonnée à 13,5 MHz.

Explication. En Pal, en une seconde, le signal de luminance est donc divisé en 13,5 millions d’échantillons pour une fréquence vidéo horizontale de 25 x 625 = 15 625 lignes. On enregistre donc 15 625/13 500 000 =1 100 bits d’information par ligne, soit (puisqu’il faut un peu plus de 2 bits pour faire un point/ligne) la définition horizontale annoncée de 500 points environ.

Echantillonnage de la chrominance.

La procédure n’est pas la même selon qu’il s’agit du Pal ou du NTSC. En Pal, les deux signaux R-Y et B-Y sont échantillonnés à la moitié de la fréquence Y, soit 13,5/2 =6,75 MHz. En NTSC, pour des raisons propres au système 525 lignes, ces deux signaux R-Y et B-Y sont échantillonnés au quart de la fréquence Y, soit 13,5/4 = 3,375 MHz.

Explication. Dans les systèmes vidéo analogiques courants, la fréquence de la sous-porteuse de chrominance est voisine de 1 MHz. Ainsi, en numérique DV, la résolution en chrominance (c’est-à-dire la « netteté » des plages de couleur) est, elle, trois fois plus élevée en NTSC et six fois plus élevée en Pal, qu’en analogique.

Nota. La structure d’échantillonnage adoptée en Pal (spécifications CCIR 601) est également connue sous le nom de 4.2.2. Le 4 fait référence à la fréquence d’échantillonnage 13,5 MHz de la luminance et les deux 2, à la fréquence deux fois plus faible 6,75 MHz des deux sous signaux de chrominance. En NTSC, la structure d’échantillonnage est appelée 4:1:1, car les deux signaux de chrominance sont échantillonnés à 3,375 MHz, 1/4 de la fréquence luminance. Cette appellation n’est nullement normalisée. C’est ainsi que Sony appelle le signal vidéo numérique composantes du DV (NTSC) « 4:2:0 ».

Quantification.

Tous les éléments vidéo sont quantifiés à 8 bits, soit avec 28 = 256 niveaux. Cela veut dire que l’on peut théoriquement restituer sur un moniteur, 256 valeurs de gris en luminance, et en  chrominance 256 valeurs par couleur.

Combien de données le signal vidéo numérisé comporte-t-il ?

C’est très facile à calculer : Pour Y : 13,5 MHz × 8 bits = 108 Mbits/s. Pour R-Y : 3,375 MHz × 8 bits = 27 Mbits/s. Pour B-Y : 3,375 MHz x 8 bits = 27 Mbits/s. Soit un total de 162 Mbits/s.

Compression du signal vidéo numérique

Un débit numérique de 162 Mbits/s (pour la seule vidéo), c’est beaucoup plus que ne peut accepter une cassette miniDV. Il est donc nécessaire de compresser le signal à un débit adéquat. Mais, pour conserver la plus haute qualité, le DV a adopté un principe de compression sans perte, dit aussi « compression réversible symétrique », ne provoquant aucune perte d’information sensible sur le vidéogramme terminé. En revanche, et contrairement aux principes de compression « avec perte » utilisés en informatique et en transmission TV numérique (MPEG-2 par exemple), il a fallu adopter un modeste taux de compression de 5:1.

Principe de compression

  1. Si l’on ne considère que la partie visible de l’image vidéo (sans les lignes de suppression, ni les parties de l’image masquées par le cadre du téléviseur), le taux de données vidéo à enregistrer descend déjà des 162 Mbits/s ci-dessus à 127 Mbits/s.
  2. La compression DV ne joue que sur les redondances spatiales à l’intérieur de l’image complète, sans chercher à réduire, comme en MPEG par exemple, les redondances temporelles. Pour ce faire, on considère que certaines régions d’une image vidéo ne se modifient pas par rapport aux images voisines. Si l’on divise, par groupes de pixels, le signal vidéo en régions comportant les mêmes éléments et en régions où les éléments se sont profondément modifiés d’une image à la suivante, il devient possible de réduire considérablement le nombre de données à enregistrer pour les régions inchangées. Cette technique permet de réduire le nombre de données à transmettre au 1/5. Ainsi, le nombre global de données vidéo à enregistrer passe de 127 Mbits/s à environ 25 Mbits/s : valeur spécifiée pour le DV.

Explication simplifiée : Pour y parvenir, les algorithmes détectent la fréquence d’occurrence des différentes valeurs de blocs de pixels, puis les calculs affectent moins de bits aux valeurs les plus probables qu’aux valeurs moins probables : c’est le codage à longueur variable (VLC), par ailleurs utilisé dans toutes les méthodes de compression vidéo. Un processus mathématique complexe appelé Transformée en Cosinus Discrète (DCT) attribue un très petit nombre de bits aux occurrences les plus probables (celles des régions inchangées de l’image) et un grand nombre de bits aux occurrences imprévisibles (ce qui change dans l’image). Cette méthode de compression est dite « intra-trame », ce qui dans ce cas signifie qu’elle traite séparément et identiquement chacune des images vidéo, lesquelles contiennent exactement le même « poids » d’informations. C’est pourquoi, au cours des générations successives, le DV et miniDV conserve les mêmes capacités opérationnelles qu’un système vidéo professionnel : montage ultra précis (plus précis qu’en Pal analogique, avec lequel il y a une parité trame à respecter), la commutation des sources, la recherche, le ralenti, etc

Principe d’enregistrement

MiniDV.Analyse par balayage hélicoïdal.Comme dans les systèmes analogiques, l’enregistrement est hélicoïdal : la bande magnétique de 6,35 mm de large défile lentement (à environ 18 mm/s) devant un tambour de 21,7 mm de diamètre incliné de quelques degrés, tournant à 9 000 tours par minute (150 tr/s). Ce tambour porte deux têtes d’enregistrement/ lecture (de toutes les informations). De cette manière, s’inscrivent de longues pistes parallèles (environ 33 mm de long), à raison de deux pistes par  tour de tambour. En une seconde, le système enregistre donc 300 pistes, soit 300/25 = 12 pistes par image en Pal ou 300/30 = 10 pistes en NTSC. D’après nos calculs, qui restent à vérifier, une piste a 10 pm de large en NTSC et 8,33 pm de large en Pal. Pour les curieux, la vitesse relative tête/bande dite vitesse d’inscription (Vi) se calcule aisément : 300 pistes de 33 mm de long par seconde, donne une Vi de 300 x 0,033 = 9,90 m/s, c’est justement la valeur qui nous a été donnée par les constructeurs.

Données enregistrées sur chaque piste

Sur chaque piste (12 par image en Pal, 10 par image en NTSC), le système enregistre la vidéo, l’audio et d’autres signaux, sur des secteurs séparés. Cela permet, par exemple, l’insertion vidéo seule. Une piste est divisée en quatre secteurs de longueurs différentes assurant séquentiellement l’enregistrement (puis la lecture) des données suivantes :

  1. Secteur ITI. Les signaux pilotes de suivi de piste dits de Tracking.
  2. Secteur audio. Enregistrement et lecture des différentes voies audio, avec possibilité de doublage son.
  3. Secteur vidéo + données auxiliaires. Outre le signal vidéo numérique, ce secteur assure également l’enregistrement en multiplexage des données auxiliaires ou Aux. Bien qu’elles soient inscrites sur le même secteur, les données vidéo et Aux s’enregistrent et peuvent se lire indépendamment. De cette manière en lecture, les données Aux sont affichables à la demande sur l’écran du moniteur. Les nombreuses données Aux se classent en deux catégories : données standard et données optionnelles.
    • Données standard. Enregistrement automatique de la date et de l’heure — Reconnaissance d’enregistrement/lecture en mode écran large 16:9 — Enregistrement de l’information de la source d’entrée d’origine, par exemple un numéro de canal.
    • Données optionnelles. Enregistrement d’informations relatives aux réglages de la section caméra du camescope, par exemple la valeur « f» du diaphragme — Provision pour l’enregistrement éventuel d’autres informations (qui ne sont pas précisées dans les premières spécifications).
  4. Secteur Sub Code. Il enregistre trois séries d’informations.
    • Le time code. L’enregistrement automatique d’un numéro de time code différent (progressif, selon le standard SMPTE) sur chaque image. Le camescope intégrant un générateur/lecteur de TC, celui-ci est définitif et systématique sur chaque bande enregistrée, même après insertion image et/ou son.
    • Index ID. Signal permettant de rechercher très rapidement le début d’une séquence vidéo préalablement indexée.
    • PP-ID. A l’enregistrement, il marque automatiquement et permet de retrouver très rapidement en lecture les images fixes de 5 secondes sur la bande.

La cassette miniDV et sa mémoire

La mémoire cassette est une option inédite du système DV. Il s’agit d’un circuit intégré de mémoire (de 4 ko) incorporé à la cassette, circuit qui communique avec le microprocesseur du camescope ou magnétoscope par quatre contacts. Outre les données de base concernant la bande (durée, type et grade de bande, etc.), la mémoire cassette a la capacité d’enregistrer de nombreuses données supplémentaires, comme par exemple le TOC (Table of Contents = table des matières), affichant dans le viseur camescope ou sur l’écran moniteur la liste détaillée des séquences indexées ou bien des images fixes (Still Photos) contenues dans la cassette, puis d’y donner rapidement accès. La structure de données de la mémoire cassette est conçue pour être compatible avec des appareils de différentes origines. La décision d’utiliser ou non des cassettes à mémoire, ainsi que les types d’informations à mémoriser est laissée au libre choix du fabricant. En l’absence de cassette à mémoire, seules les données de base sont prises en compte par le système d’identification cassette (équipé d’un circuit électronique d’identification ou ID Board).

Caractéristiques miniDV

  • Fréquence d’échantillonnage luminance Y : 13,5 MHz
  • Fréquence d’échantillonnage chrominance
    • R-Y et B-Y en 625 lignes (Pal) : 6,75 MHz (4:2:2)
    • R-Y et B-Y en 525 lignes (NTSC) : 3,375 MHz (4:1:1)
  • Quantification (Y, R-Y, B-Y) : 8 bits
  • Diamètre du tambour (deux têtes) : 21,7 mm
  • Vitesse de rotation du tambour : 9000 tr/mn (150 tr/s)
  • Vitesse d’inscription (Vi) : 9,9 m/s environ
  • Nombre de pistes par image : 12 (Pal), 10 (NTSC)
  • Largeur des pistes : 8,33 µm* (Pal), 10 µm (NTSC).
  • Longueur piste : 33 mm environ*
  • Vitesse de défilement de la bande (Vd) : 17,797 mm/s*
  • Dimensions/durée cassette Mini DV : 66 x 48 x 12,2 mm/60 mn
  • Dimensions/durée cassette standard DV (270 mn) : 125 × 78 × 14,6 mm
    * Ces valeurs ne nous ayant pas été communiquées, nous les avons calculées par déduction à partir de celles que nous possédions.

Les autres formats vidéo