Committed to connecting the world

  •  
ITU GSR 2024

ITU-T Recommendations

Search by number:
Others:
Skip Navigation Links
Content search
Advanced search
Provisional name
Equivalent number
Formal description
Study Groups tree viewExpand Study Groups tree view

ITU-T G.711.1 (09/2012)

عربي | 中文 | English | Español | Français | Русский
Extension intégrée large bande du système de modulation par impulsions et codage G.711
La Recommandation UIT-T G.711.1 décrit un algorithme de codage vocal et audio intégré à bande élargie UIT-T G.711 fonctionnant à 64, 80 et 96 kbit/s.
Le signal d'entrée du codeur et les signaux de sortie du décodeur sont échantillonnés à 16 kHz par défaut, mais un échantillonnage à 8 kHz est également pris en charge. Pour un échantillonnage à 16 kHz, le codeur UIT-T G.711.1 produit des signaux avec une bande comprise entre 50 et 7 000 Hz à 80 et 96 kbit/s, et pour un échantillonnage à 8 kHz, il produit des signaux avec une bande comprise entre 50 et 4 000 Hz à 64 et 80 kbit/s (la largeur de bande du signal de sortie à bande étroite du décodeur dépend de la banque intégrée de filtres à bande partagée qui a une fréquence de coupure à 4000 Hz). A 64 kbit/s, la Recommandation UIT-T G.711.1 est compatible avec la Recommandation UIT-T G.711, ce qui devrait permettre un déploiement efficace dans les infrastructures existantes de téléphonie IP (VoIP) UIT-T G.711. Le codeur s'applique à des trames de 5 ms, a un délai algorithmique maximal de 11,875 ms, et présente une complexité de calcul dans le cas le plus défavorable de 8,70 millions pondérés d'opérations par seconde (WMOPS).
Le codeur produit un flux binaire intégré structuré en trois couches correspondant aux trois débits binaires disponibles: 64, 80 et 96 kbit/s. Le flux binaire peut être tronqué par le décodeur ou par tout élément du système de communication afin d'ajuster le débit binaire à la valeur souhaitée, mais comme il ne contient pas d'informations indiquant quelles sont les couches contenues, il est nécessaire de prévoir, dans les mises en oeuvre, une signalisation hors-bande indiquant quelles sont les couches disponibles.
L'algorithme sous-jacent a une structure de codage en trois couches: modulation par impulsions et codage (MIC) à compression-extension logarithmique de la bande inférieure y compris le bruit de retour, extension MIC intégrée avec attribution adaptative des bits pour améliorer la qualité de la couche de base dans la bande inférieure, et codage par quantification de vecteurs pondérés de la bande supérieure reposant sur une transformation discrète en cosinus modifiée (MDCT).
L'Annexe A définit une variante pour la mise en oeuvre de l'algorithme UIT-T G.711.1 utilisant l'arithmétique en virgule flottante pour faciliter son utilisation sur les matériels optimisés pour les opérations en virgule flottante. Le code C en virgule flottante fourni est complètement interopérable avec le code C en virgule fixe et la qualité assurée est équivalente.
L'Annexe B contient le format de capacité utile RTP, les identificateurs de capacité et les paramètres pour la signalisation des capacités UIT-T G.711.1 conformément à la Recommandation UIT-T H.245. Le format de paquet est entièrement compatible avec les définitions RTP UIT-T G.711.1 correspondantes, de manière à assurer une interopérabilité continue.
L'Annexe C décrit un algorithme appliquant l'algorithme de compression sans perte UIT-T G.711.0 pour le codage UIT-T G.711.1. Etant donné que la Recommandation UIT-T G.711.0 est plus efficace lorsqu'elle est appliquée à des trames de grande taille, pour obtenir un taux de compression efficace, on code ensemble autant de trames UIT-T G.711.1 que l'algorithme UIT-T G.711.0 permet de prendre en charge. L'utilisation de cette extension n'entraîne aucune dégradation de la qualité par rapport à la Recommandation UIT-T G.711.1, car il s'agit d'un codage sans perte de la partie UIT-T G.711 du flux binaire UIT-T G.711.1. En outre, il n'y a pas de délai algorithmique supplémentaire; le délai est égal à celui du codage UIT-T G.711.1, plus la taille choisie du paquet moins cinq millisecondes. La robustesse contre les pertes de paquets est la même que dans le cas de la Recommandation UIT-T G.711.1 et il n'y a pas de propagation d'erreur en cas d'erreurs de trame. Le schéma proposé peut facilement être transcodé pour la Recommandation UIT-T G.711.1 ou UIT-T G.711.0 avec un minimum de complexité.
L'Annexe D décrit un algorithme de codage vocal et audio modulable à bande super-élargie (50-14 000 Hz) fonctionnant de 96 à 112 kbit/s pour le mode UIT-T G.711.1 à 80 kbit/s, et fonctionnant de 112 à 128 kbit/s pour le mode UIT-T G.711.1 à 96 kbit/s. Le codec d'extension à bande super-élargie UIT-T G.711.1 est interopérable à la fois avec les algorithmes UIT-T G.711 et UIT-T G.711.1. Le signal de sortie du codeur à bande super-élargie UIT-T G.711.1 a une bande comprise entre 50 et 14 000 Hz. Le codeur s'applique à des trames de 5 ms, a un délai algorithmique de 12,8125 ms et une complexité dans le cas le plus défavorable de 21,498 MOPS. Par défaut, le signal d'entrée du codeur et le signal de sortie du décodeur sont échantillonnés à 32 kHz. Le codeur à bande super-élargie produit un flux binaire intégré structuré en deux couches correspondant à deux débits binaires disponibles de 96 à 112 kbit/s ou de 112 à 128 kbit/s avec un pas de 16 kbit/s, suivant le mode UIT-T G.711.1 choisi. Le flux binaire peut être tronqué par le décodeur ou par tout élément du système de communication afin d'ajuster instantanément le débit binaire à la valeur souhaitée sans qu'une signalisation hors bande soit nécessaire. Pour le mode UIT-T G.711.1 à 80 kbit/s ou celui à 96 kbit/s, l'algorithme à bande super-élargie UIT-T G.711.1 est entièrement interopérable avec le codage UIT-T G.711.1. L'algorithme sous-jacent comporte trois parties principales: améliorations dans la bande supérieure, extension de largeur de bande (BWE) et codage avec transformation discrète en cosinus modifiée (MDCT) reposant sur une quantification des vecteurs algébriques (AVQ).
L'Annexe E décrit un projet de variante pour la mise en oeuvre de l'Annexe D UIT-T G.711.1 utilisant l'arithmétique en virgule flottante. Tandis que l'Annexe D décrit une spécification en virgule fixe exacte au bit près, le code source C en virgule fixe étant disponible auprès de l'UIT-T, la variante de la mise en oeuvre en virgule flottante est utile pour les plateformes équipées de processeurs en virgule flottante. Il a été déterminé que cette variante était entièrement interopérable avec l'algorithme de l'Annexe D dans toutes les configurations, y compris les configurations croisées.
L'Annexe F décrit une extension stéréo du codec à bande élargie UIT-T G.711.1 et de son extension à bande super-élargie, l'Annexe D UIT-T G.711.1. Cette extension est optimisée pour la transmission de signaux stéréo avec un débit binaire supplémentaire limité, tout en restant entièrement compatible avec les deux codecs. Elle fonctionne de 96 à 160 kbit/s: cinq débits binaires de 112 à 160 kbit/s pour la stéréo à bande super-élargie et deux débits binaires de 96 et 128 kbit/s pour la stéréo à bande élargie. Les modes stéréo à bande élargie sont rétrocompatibles avec les algorithmes d'origine UIT-T G.711 et UIT-T G.711.1, tandis que les modes stéréo à bande super-élargie sont rétrocompatibles avec le mode UIT-T G.711 mono à bande étroite, le mode UIT-T G.711.1 mono à bande élargie et l'Annexe D UIT-T G.711.1 à bande super-élargie. Le codec stéréo s'applique à des trames de 5 ms, avec un délai algorithmique de 18,125 ms pour la stéréo à bande élargie et de 19,0625 ms pour la stéréo à bande super-élargie. Le signal d'entrée du codeur et le signal de sortie du décodeur sont échantillonnés à 16 kHz et 32 kHz respectivement pour les modes de fonctionnement à bande élargie et à bande super-élargie. L'algorithme sous-jacent comporte trois parties principales: analyse des paramètres stéréo et mixage-réducteur au niveau du codeur et synthèse stéréo au niveau du décodeur. La première couche d'extension stéréo est une couche à 16 kbit/s comportant les paramètres stéréo de base, la différence de temps entre canaux/la différence de phase entre canaux/la cohérence entre canaux pour toute la bande élargie, les différences de niveau entre canaux dans une sous-bande et les différences de phase entre canaux dans une sous-bande basse fréquence. La deuxième couche stéréo est une couche à 16 kbit/s. Dans cette dernière couche, on transmet les différences de phase entre canaux pour une plus grande largeur de bande, ce qui permet d'améliorer encore l'image stéréo. Le flux binaire peut être tronqué par le décodeur ou par tout élément du système de communication, afin d'ajuster instantanément le débit binaire à la valeur souhaitée – débits binaires UIT-T G.711 à bande étroite, UIT-T G.711.1 à bande élargie et de l'Annexe D UIT-T G.711.1 à bande super-élargie – sans qu'une signalisation hors bande soit nécessaire.
L'Appendice I décrit un postfiltre supplémentaire pour le décodeur. Ce postfiltre améliore la qualité du signal décodé dans le cas du codage UIT-T G.711 d'origine ou lorsqu'on dispose uniquement de la partie MIC à compression-extension logarithmique de base du flux binaire UIT-T G.711.1. Il est destiné à être utilisé dans les terminaux d'utilisateur final et il convient d'éviter de l'utiliser en cascade (par exemple dans un mélangeur de signaux ou dans des traducteurs de flux binaires).
Les Appendices II et III donnent respectivement des informations sur le choix de la taille de trame et sur le décodage de la partie de flux binaire UIT-T G.711.0 des flux binaires LLC UIT-T G.711.1.
L'Appendice IV à la Recommandation UIT-T G.711.1 définit un schéma de codage stéréo mid-side (MS) reposant sur l'Annexe D UIT-T G.711.1 (UIT-T G.711.1-bande super-élargie). En mettant en oeuvre le codage stéréo mid-side dans les terminaux stéréo, on peut obtenir l'interopérabilité avec les dispositifs monophoniques moyennant une très faible complexité. Le schéma de codage de base est le suivant: deux canaux stéréo gauche-droite (LR) sont convertis en canaux stéréo MS, puis les signaux de chaque canal sont codés de manière indépendante à l'aide de l'algorithme UIT-T G.711.1-bande super-élargie; au niveau du décodeur, chacun des canaux MS du flux binaire issu du codeur est décodé, puis les signaux décodés des canaux MS sont reconvertis en signaux des canaux LR. La conversion LR-MS et son inverse sont effectuées selon le procédé classique. Le codeur nécessite deux opérations arithmétiques supplémentaires par échantillon pour la conversion LR-MS et le décodeur a besoin d'un opérateur pour la conversion MS-LR. Pour la mise en oeuvre de l'opérateur de base de la bibliothèque STL2009 (voir la Recommandation UIT-T G.191 (2010)), la complexité de la conversion est de l'ordre de 0,2 WMOPS au total. L'algorithme de codage pour chaque canal est identique à celui utilisé dans l'Annexe D UIT-T G.711.1.
Le code source ANSI C est fourni pour les algorithmes spécifiés dans le corps principal de cette Recommandation et dans les Annexes A, C, D, E et F. Ces codes sources ANSI C font partie intégrante de cette Recommandation.
Un ensemble non exhaustif de signaux de test à utiliser avec ces codes sources ANSI C est également fourni dans une pièce jointe électronique à cette Recommandation. Il convient de noter que certains des vecteurs de test sont trop volumineux pour pouvoir être distribués avec le code source, en particulier pour l'Annexe F. Les vecteurs de test sont téléchargeables gratuitement depuis le site web de l'UIT à l'adresse: http://itu.int/net/itu-t/sigdb/speaudio/Gseries.htm#G.711.1.
Citation: https://handle.itu.int/11.1002/1000/11672
Series title: G series: Transmission systems and media, digital systems and networks
  G.700-G.799: Digital terminal equipments
  G.710-G.729: Coding of voice and audio signals
Approval date: 2012-09-13
Provisional name:G.711-WB
Approval process:AAP
Status: In force
Observation:Due to the data volume, only text and the source codes are available here. Test vectors are downloadable free of charge from ITU-T test signals database at: http://handle.itu.int/11.1002/2000/9365.
Maintenance responsibility: ITU-T Study Group 16
Further details: Patent statement(s)
Development history
Associated test signals