Committed to connecting the world

  •  
wtisd

ITU-T Recommendations

Search by number:
Others:
Skip Navigation Links
Content search
Advanced search
Provisional name
Equivalent number
Formal description
Study Groups tree viewExpand Study Groups tree view

ITU-T G.711.1 (09/2012)

عربي | 中文 | English | Español | Français | Русский
Широкополосное встроенное расширение для импульсно-кодовой модуляции по МСЭ-Т G.711
В Рекомендации МСЭ-T G.711.1 описывается встроенный алгоритм широкополосного кодирования речи и звука согласно МСЭ-Т ‎G.711 со скоростями 64, 80 и 96 кбит/с.
По умолчанию частота дискретизации сигнала на входе и выходе декодера равна 16 кГц, но также поддерживается частота дискретизации в 8 кГц. При дискретизации с частотой 16 кГц на выходе кодера МСЭ-T G.711.1 может образовываться кодированный сигнал с шириной полосы 50−7000 Гц при скорости 80 и 96 кбит/с, а при дискретизации с частотой 8 кГц на выходе могут образоваться сигналы с шириной полосы от 50 до 4000 Гц при скорости 64 и 80 кбит/с (ширина полосы узкополосного сигнала на выходе декодера определяется встроенной линейкой разделительных фильтров, которые имеют частоту среза, равную 4000 Гц). При скорости 64 кбит/с Рекомендация МСЭ-T G.711.1 совместима с Рекомендацией МСЭ-T G.711; тем самым предусматривается ее эффективное широкое использование в существующих инфраструктурах передачи голоса по протоколу IP (VoIP) на основе МСЭ-T G.711. В кодере используются кадры в 5 мс, имеющаяся максимальная алгоритмическая задержка равна 11,875 мс, а вычислительная сложность в наихудшем случае составляет 8,70 миллиона взвешенных операций в секунду (WMOPS).
Кодер создает вложенный битовый поток, состоящий из трех уровней, которые соответствуют трем возможным битовым скоростям: 64, 80 и 96 кбит/с. Битовый поток может быть усечен на стороне декодера или в любом элементе системы связи для подстройки скорости передачи к желаемому значению. Однако в связи с тем, что в нем отсутствует информация относительно содержащихся уровней, при реализации потребуется применение внеполосной сигнализации для указания на имеющиеся уровни.
Базовый алгоритм имеет трехуровневую структуру кодирования: импульсно-кодовая модуляция (ИКМ) с логарифмическим компандированием для нижней полосы, включающая обратную связь по шуму, встроенное расширение ИКМ с адаптивным распределением битов для повышения качества базового уровня в нижней полосе, а также взвешенное векторное квантование и кодирование верхней полосы на основе измененного дискретного косинусного преобразования (MDCT).
В Приложении A определяется еще один вариант реализации алгоритма МСЭ-T G.711.1, в котором используются арифметические операции с плавающей запятой, чтобы облегчить его применение в аппаратуре, оптимизированной для таких операций. Связанный с ним С-код с плавающей запятой полностью функционально совместим с С-кодом с фиксированной запятой и обеспечивает эквивалентное качество.
В Приложении В содержится формат полезной нагрузки RTP, идентификаторы функций и параметры для сигнализации о функциях МСЭ-Т G.711.1 с использованием Рекомендации МСЭ-Т H.245. В целях обеспечения полной функциональной совместимости формат пакета полностью совместим с соответствующими определениями МСЭ-Т G.711.1 для RTP.
В Приложении С описывается алгоритм, в котором к МСЭ-T G.711.1 применяется алгоритм сжатия без потерь согласно МСЭ-T G.711.0. Рекомендация МСЭ-T более эффективна при применении к кадрам большого размера. В связи с этим, для достижения эффективного коэффициента сжатия осуществляется совместное кодирование как можно большего числа кадров МСЭ-T G.711.1, которое обеспечивается МСЭ-T G.711.0. При использовании данного расширения не происходит ухудшения качества по сравнению с Рекомендацией МСЭ-T G.711.1, в связи с тем что имеет место кодирование без потерь части битового потока МСЭ-T G.711.1, соответствующей МСЭ-Т G.711. Кроме того, отсутствует дополнительная алгоритмическая задержка; задержка будет такой же, как и в МСЭ-T G.711.1, плюс выбранный размер пакета минус пять миллисекунд. В алгоритме обеспечивается такая же устойчивость к потере пакетов, как и в Рекомендации МСЭ-T G.711.1, и не происходит распространения ошибки в случае ошибок в кадре. Предложенная схема может быть легко транскодирована в МСЭ-T G.711.1 или МСЭ-T G.711.0 при минимальной сложности.
В Приложении D описывается масштабируемый алгоритм кодирования сверхширокополосных (СШП, 50–14000 Гц) речевых и звуковых сигналов, работающий со скоростью от 96 до 112 кбит/с, для базового варианта МСЭ-T G.711.1 со скоростью 80 кбит/с, а также алгоритм, работающий со скоростью от 112 до 128 кбит/с, для базового варианта МСЭ-T со скоростью 96 кбит/с. Сверхширокополосный кодек расширения МСЭ-T G.711.1 функционально совместим с кодеками МСЭ-T G.711 и МСЭ-T G.711.1.
Сигнал на выходе СШП кодера МСЭ-T G.711.1 имеет ширину полосы 50–14000 Гц. В кодере используются кадры в 5 мс, имеющаяся максимальная алгоритмическая задержка равна 12,8125 мс, а вычислительная сложность в наихудшем случае составляет 21,498 MOPS. По умолчанию, частота дискретизации сигнала на входе и выходе декодера равна 32 кГц. Сверхширокополосный кодер создает вложенный битовый поток, состоящий из двух уровней, которые соответствуют двум возможным битовым скоростям: от 96 до 112 кбит/с или от 112 до 128 кбит/с с шагом 16 кбит/с, в зависимости от базового варианта МСЭ-T G.711.1. Битовый поток может быть усечен на стороне декодера или в любом элементе системы связи для мгновенной подстройки скорости передачи к желаемому значению без необходимости применения внеполосной сигнализации. В режиме МСЭ-Т G.711.1 со скоростью 80 кбит/с или 96 кбит/с СШП алгоритм МСЭ-T G.711.1 полностью функционально совместим с алгоритмом МСЭ-T G.711.1. Базовый алгоритм включает три основные части: улучшения для верхней полосы, расширение полосы (BWE) и трансформирующее кодирование в области измененного дискретного косинусного преобразования (MDCT) на основе алгебраического векторного квантования (AVQ).
В Приложении E описывается предлагаемый проект еще одной реализации Приложения D к МСЭ-T G.711.1 на основе арифметических операций с плавающей запятой. В то время как в Приложении D приводится побитовое (с фиксированной запятой) описание с использованием С-кода с фиксированной запятой, который можно получить в МСЭ-T, данный возможный вариант реализации на базе плавающей запятой полезен для платформ, оборудованных процессорами с плавающей запятой. Данные возможные варианты арифметических операций с плавающей запятой признаны полностью совместимыми с Приложением D во всех конфигурациях, включая перекрестные конфигурации.
В Приложении F описывается стереофоническое расширение широкополосного кодека МСЭ-T G.711.1, а также его сверхширокополосное расширение, Приложение D к МСЭ-T G.711.1. Оно оптимизировано для передачи стереосигналов с использованием ограниченной дополнительной битовой скорости при одновременном сохранении полной совместимости с обоими кодеками. В Приложении F используются скорости от 96 до 160 кбит/с: пять сверхширокополосных стереосигналов со скоростями от 112 до 160 кбит/с и два широкополосных стереосигнала со скоростями 96 и 128 кбит/с. В режимах с использованием широкополосных стереосигналов обеспечивается обратная совместимость с существующими алгоритмами МСЭ-T G.711 и МСЭ-T G.711.1, в то время как в сверхширокополосных режимах обеспечивается обратная совместимость с монофоническим узкополосным режимом МСЭ-T G.711, монофоническим широкополосным режимом МСЭ-T G.711.1 и сверхширокополосным режимом Приложения D к МСЭ-T G.711.1. В стереофоническом кодеке используются кадры в 5 мс, при этом алгоритмическая задержка равна 18,125 мс для широкополосного стереосигнала и 19.0625 мс для сверхширокополосного стереосигнала. Частота дискретизации сигнала на входе и выходе декодера равна, соответственно, 16 кГц и 32 кГц для широкополосного и сверхширокополосного режимов работы. Базовый алгоритм включает три основных части: анализ параметров стереосигнала и понижающее микширование в кодере, а также синтез стереосигнала в декодере. Первый уровень расширения стереосигнала – это уровень со скоростью 16 кбит/с, содержащий базовые параметры стереосигнала, межканальную разность времени/межканальную разность фаз/межканальную когерентность для всего широкополосного сигнала, межканальные разности уровней поддиапазонов и межканальные разности фаз поддиапазона низких частот. Второй уровень стереосигнала – это уровень со скоростью 16 кбит/с. На этом последнем уровне передаются межканальные разности фаз более широкой ширины полосы, что обеспечивает дополнительное улучшение стереофонического образа. Битовый поток может быть усечен в декодере или в любом элементе системы связи для мгновенной подстройки скорости передачи к желаемому значению, в том числе к скоростям передачи узкополосного сигнала МСЭ-T G.711, широкополосного сигнала МСЭ-T G.711.1 и сверхширокополосного сигнала Приложения D к МСЭ-T G.711.1 без необходимости применения внеполосной сигнализации.
В Дополнении I описывается дополнительный постфильтр, предназначенный для использования в декодере. Данный постфильтр повышает качество декодированного сигнала при наличии битового потока существующего алгоритма МСЭ-T G.711 или только базовой части битового потока МСЭ-T G.711.1, использующей ИКМ с логарифмическим компандированием. Фильтр предназначен для терминалов конечных пользователей, и следует избегать его использования в тандемных соединениях (таких как микшеры сигнала или преобразователи битового потока).
В Дополнениях II и III приводится информация, соответственно, о выборе размера кадра и о декодировании части битовых потоков МСЭ-T G.711.1 LLC, соответствующей МСЭ-T G.711.0.
В Дополнении IV к МСЭ-T G.711.1 определяется схема кодирования для среднего/бокового (MS) стереоканалов с использованием Приложения D к МСЭ-T G.711.1 (МСЭ-T G.711.1-SWB). За счет добавления кодирования среднего/бокового стереоканалов в стереофонические терминалы можно обеспечить совместимость с монофоническими устройствами при весьма низкой сложности. Базовая схема кодирования является следующей: два стереоканала – левый и правый (LR) – преобразуются в стереоканалы MS, и далее сигналы каждого канала независимо кодируются с использованием МСЭ-T G.711.1-SWB; на стороне декодера каналы MS битового потока, поступающего от кодера, декодируются соответствующим образом, и далее декодированные сигналы каналов MS обратно преобразуются в каналы LR. Прямое преобразование LR-MS и обратное преобразование выполняются обычным способом. На стороне кодера необходимо использовать две дополнительные арифметические операции на отчет для преобразования LR-MS, и один оператор требуется для преобразования MS-LR в декодере. В STL2009, см. Рекомендацию МСЭ-T G.191 (2010 г.) относительно реализации базового оператора, сложность преобразования составляет в общей сложности порядка 0,2 WMOPS. Алгоритм кодирования для каждого канала полностью соответствует алгоритму Приложения D к МСЭ-T G.711.1.
Исходный код ANSI-C представлен в алгоритмах, описанных в основной части настоящей Рекомендации и в Приложениях A, C, D, E и F. Данные исходные коды ANSI-C являются неотъемлемой частью настоящей Рекомендации.
Кроме того, в электронном приложении к настоящей Рекомендации приведен неполный набор тестовых сигналов, предназначенных для использования с данными исходными кодами ANSI-C. Следует отметить, что некоторые из тестовых векторов занимают слишком большой объем и не распространяются с исходными кодами, в частности, в Приложении F. Эти тестовые векторы можно бесплатно загрузить с веб-сайта МСЭ по адресу: http://itu.int/net/itu-t/sigdb/speaudio/ Gseries.htm#G.711.1.
Citation: https://handle.itu.int/11.1002/1000/11672
Series title: G series: Transmission systems and media, digital systems and networks
  G.700-G.799: Digital terminal equipments
  G.710-G.729: Coding of voice and audio signals
Approval date: 2012-09-13
Provisional name:G.711-WB
Approval process:AAP
Status: In force
Observation:Due to the data volume, only text and the source codes are available here. Test vectors are downloadable free of charge from ITU-T test signals database at: http://handle.itu.int/11.1002/2000/9365.
Maintenance responsibility: ITU-T Study Group 16
Further details: Patent statement(s)
Development history
Associated test signals