Épisode 8 - Les besoins techniques d’une captation vidéo et de sa mise en ligne sur le Web
Partagez le sur vos réseaux sociaux
Suivez-Nous
- Quelques notions à découvrir
Aussi appelé en anglais Codec (coding/decoding), le Codage/Décodage est le type de mise en forme et de compression d’un flux audio ou audiovisuel selon les normes et les standards en vigueur publiés. Chaque logiciel ou matériel permettant de faire de la webdiffusion opère donc un encodage du fichier pour le webdiffuser et offre le choix du type codage du fichier pour s’assurer qu’il puisse être lu par le.a spectateur.trice de la webdiffusion.
La compression est un système de réduction de la taille d’un fichier informatique ou d’un flux audio ou audiovisuel. La réduction de la taille du fichier lui permet d’occuper moins d’espace-disque dans les moyens de stockage en réduisant le nombre de Mbit nécessaires. Par conséquent, en webdiffusion, la compression est nécessaire afin que le flux demande moins de vitesse du débit de la connexion Internet.
Une forte compression permet de réaliser des flux pouvant passer dans une connexion à faible débit, mais l’image et le son (selon le taux de compression) peuvent alors se dégrader. Une faible compression améliore la qualité du flux, mais nécessite un plus fort débit. La compression est indépendante du codage/encodage. Par exemple, on peut encoder un flux audiovisuel dans la norme H264, ou H265, mais on peut, en parallèle, décider de le compresser plus ou moins pour que la taille du fichier ne soit pas trop grande par rapport au débit de la connexion
La vitesse du débit Internet est la mesure du nombre de mégabits par seconde (ou Mbps). Il peut s’agir de téléchargement d’un fichier (download speed) ou de téléversement (upload speed). La vitesse de la connexion internet est un facteur crucial d’une webdiffusion, mais aussi, en général de la participation à la communauté numérique. Selon le site du Gouvernement du Canada, la vitesse d’une connexion dite “rapide” devrait être de 50 Mb par seconde (ou Mbps) en téléchargement et de 10 Mbps en téléversement. La vitesse nécessaire à la réalisation d’une webdiffusion dépend surtout de quatre facteurs. La résolution du flux (Full HD, 4K, etc.), le nombre d’images par seconde (généralement 30 ou 60), le type d’encodage/décodage et le type de compression.
Pour la webdiffusion en direct par téléphone, une connexion 4G minimale est nécessaire afin que l’image et le son soient de suffisamment bonne qualité en résolution et en nombre d’images par seconde.
À la suite, à titre indicatif, on détaille les fourchettes de vitesses nécessaires conseillées à une webdiffusion dans la résolution la plus courante (Full HD ou 1920 x 1080 pixels) par rapport au taux d’images par seconde. Les plages de variation sont en fonction de la qualité de l’encodage/décodage et de la compression 24 IPS ou 30 entre 3 et 6 Mbps, 60 IPS entre 5 et 9 Mbps.
Le besoin croissant d’un internet stable et à haut débit est un défi dans un grand pays comme le Canada spécialement pour les zones rurales et éloignées des grandes villes, même si des solutions propriétaires et satellitaires comme le Starlink sont possibles et rendent les hauts débits plus faciles dans les zones plus reculées. Mais ces solutions sont encore rares et chères. La question du débit Internet est donc une question tout aussi technique, que politique et d’inclusion.
Procédé technique de mixage et format de finalisation audio d’un projet permettant une écoute immersive du son avec une très grande précision spatiale. Chaque artiste peut donc placer chaque son, chaque voix, chaque instrument musical dans une position précise de l’espace sonore.
Certains studios de production proposent l’enregistrement audio des captations ou des vidéodanses en Dolby Atmos. Ce format nécessite du matériel certifié Dolby Atmos mais est déjà largement adopté par nombre de constructeurs de dispositifs de diffusion audio et d’ordinateurs fixes ou portables. Par exemple, tous les ordinateurs et même les casques audio de la marque Apple, certains ordinateurs Intel, Lenovo, Huawei, et beaucoup d’autres encore sont certifiés avec le standard Dolby Atmos. L’autre caractéristique fondamentale du Dolby Atmos c’est qu’il permet d’être écouté sur tout matériel de toute marque étant certifié. Ce format n’est donc pas lié à une marque ni à une configuration spécifique d’enceintes acoustiques : si le dispositif est certifié, on peut avoir un système 2.1 (deux enceintes et un caisson de basses), un système 5.1, 7.1 ou encore un casque. Dans toutes ces configurations on peut bénéficier d’un son immersif Dolby Atmos. Peu importe le nombre des enceintes.
Une dernière caractéristique essentielle de ce format est que le fichier enregistré dans ce format peut être lu sur des enceintes traditionnelles mono, stéréo ou surround non certifiées.
Aussi appelé en anglais Frames per second ou FPS, le nombre (ou taux) d’images par seconde ou IPS, ou encore i/s est la quantité d’images enregistrées par une caméra vidéo ou cinématographique en une seconde. Par conséquent, c’est aussi le nombre d’images par seconde lues par le.a spectateur.trice d’une webdiffusion. Plus le nombre d’IPS est élevé, plus l’image des mouvements du corps, de la caméra ou des objets est fluide et nette. Par contre, un taux élevé d’images par seconde fait grossir de manière considérable la taille du fichier ce qui génère, comme conséquence, le besoin d’une connexion internet plus rapide. Le taux d’IPS est l’un des quatre facteurs principaux de la qualité d’un flux de webdiffusion, impactant sur les vitesses de téléversement et de téléchargement. Les autres facteurs sont la résolution, le système d’encodage/décodage du flux et le type de compression du fichier. Nous pourrions résumer les taux d’IPS plus courants pour la webdiffusion en direct plus utilisés au Canada comme étant les suivants:
– 24 (Le taux le plus utilisé en pellicule au cinéma, mais qui est aussi utilisé en webdiffusion, captation et vidéodanse)
– 29.97 ou 30 (les taux le plus courants)
– 60 (image plus fluide et nette, mais moins utilisé puisqu’il demande le double de Mbs par seconde en vitesse de téléversement et de téléchargement de la part des spectateurs.trices.
L’habillage est l’ensemble des éléments graphiques ajoutés avant, pendant ou après une webdiffusion permettant de placer des informations additionnelles. En webdiffusion, par exemple ce sont : la première image d’avant la transmission annonçant qu’elle va commencer, l’éventuel compte à rebours avant son début, une image signalant un éventuel problème technique, les images avec les crédits artistiques et de production à placer à la fin du spectacle, etc. D’autres exemples d’habillage sont les bandeaux placés dans le tiers inférieur de l’image contenant le.s nom.s des personnes parlant à l’image, les logos des théâtres et des coproducteurs, etc.
La résolution est le nombre de pixels capteur vidéo. Les capteurs vidéo sont tous rectangulaires et leur résolution est exprimée en nombre de pixels disposés à l’horizontale (résolution horizontale) et de pixels disposés à la verticale. Quand on parle de résolution Full HD on sait qu’à l’horizontale le capteur mesure 1920 pixels et à la verticale 1080 pixels pour un total d’un peu plus que deux millions de pixels. La résolution appelée 4K est 4 fois la résolution Full HD, c’est à dire 3840 à l’horizontale et 2160 à la verticale. Ainsi de suite le 8K est encore 4 fois la surface du 4k etc. Plus la résolution est haute, plus l’image est riche en détails et est perçue comme réaliste. Si la grande majorité des webdiffusions se fait en résolution Full HD c’est parce que pour envoyer par Internet un flux 4k demande un très haut débit, soit quatre fois supérieur à celui de la résolution FUll HD. Vitesse que tout le monde n’a pas nécessairement à la maison. Cela dit, il est important que l’enregistrement de la webdiffusion soit d’une résolution 4k, 6k ou plus car cela permet, en postproduction de recadrer l’image sans perte de qualité et sans dégradation de l’image.
Aussi appelé en anglais Real Time, le Temps réel est un traitement informatique des médias (audio, vidéo, texte, etc,) perçu comme immédiat. En réalité, on a la sensation qu’un traitement est fait en temps réel quand le délai de ce traitement est inférieur au temps de latence de la perception humaine. Par exemple, deux sons déclenchés avec un retard entre eux de moins de 5 millisecondes sont perçus par l’oreille humaine comme un seul son. Ce qui veut dire que le temps de latence de la perception sonore est inférieur à cinq millisecondes. Au-delà des calculs savants, cette notion est importante pour comprendre que l’interaction en temps réel a besoin d’être programmée sur des machines capables de nous donner l’illusion de l’immédiateté, c’est-à-dire de traiter l’information de manière très rapide.
Aussi appelé.e en anglais Focus puller le.a tireur.euse de point est la personne qui, lorsque nécessaire, ne fait qu’ajuster la mise au point de l’objectif. Concrètement, si le.a DOP est engagé.e physiquement dans les mouvements de la caméra il.elle ne pourra pas ajuster manuellement la mise au point en même temps.
Aussi appelée en anglais Broadcast la transmission se réfère à la fois à la diffusion et/ou au fait de diffuser (to broadcast ou a broadcast). Dans l’histoire des moyens de communication de masse on parle de broadcast dans le cas de la transmission via ondes radio de la télévision parce que l’on diffuse (cast) à partir d’un point vers une large (broad) audience. Dans le cas spécifique d’une diffusion sur Internet on parle de webdiffusion qui est donc une nouvelle version de broadcast, via le réseau plutôt par ondes radio.