Étonnant, je pensais qu'on voyait plus les dégradations avec une copie d'écran (si possible avec un zoom sur une partie de l'image) que sur un flux en mouvement, sachant qu'on a le même nombre d'images par seconde et le même nombre de pixels (1920 x 1080).
Je pense qu'on peut dire que ça dépend du contenu de la vidéo
Mais en général on peut difficilement comparer deux encodages uniquement avec des images fixes. Je sais que c'est un peu ironique étant donné mon article, mais ça n'en reste pas moins vrai.
De ce que je comprends de ce vaste domaine, la grosse majorité des améliorations apportées par VP9 et AV1 viennent de deux choses : 1) la structure des macroblocs (H.264 était limité à 8x8, maintenant on va jusqu'à 128x128 pixels, et avec des schémas de division beaucoup plus complexes qu'auparavant), et 2) l'interpolation de l'état d'un bloc d'un instant T à un instant T+1.
Je m'étais amusé à voir ce qu'on pouvait faire avec seulement 600 kilooctets (la limite des MMS aujourd'hui) en réencodant des bouts de vidéo directement avec ffmpeg sur mon téléphone.
Article ici.Je souhaite attirer votre attention sur ces deux fichiers :
H.265/HEVC :
et AV1 :
Si on compare seulement des images fixes, le résultat est similaire, mais en mouvement, on peut voir que AV1 est beaucoup plus propre.
Je ne suis pas complètement sûr de ce que je vais dire, mais j'ai l'impression que, en gros, si on imagine un seul « bloc » de l'image :
* Avec H.264/AVC, il y avait forcément deux blocs distincts avec une image et la suivante
* Avec H.265/HEVC, chaque bloc peut « sauter » une image, et il y a un fondu d'interpolation entre image 1 / bloc A, image 2 = bloc A/B image 3 = bloc B
* Avec AV1, il y a une limite qui est beaucoup plus haute
D'où la complexité d'encodage et de décodage logiciel qui sont décuplées. Mais ça permet des gains avec des bitrates ultra-bas qui sont énormes.
On peut plus ou moins deviner le phénomène que je décris si on regarde les reflets dans l'eau au dessus des pontons en bois dans cette vidéo :
Et on peut pousser le vice jusqu'à faire 30 secondes de 480p, toujours en seulement 600 kilooctets :
Il y a une stabilité temporelle de l'image qui est franchement bluffante.
Pour en revenir au sujet, malheureusement, je suis presque sûr que les encodeurs AV1 de YouTube n'exploitent pas à fond tout le potentiel du standard, mais bon ! Peut-être que leur prochaine génération d'encodeurs matériel arriveront a en tirer mieux parti.