This page will soon be deactivated—explore our new, faster, mobile-friendly site, now centralized in MyWorkspace!

Committed to connecting the world

  •  
ITU GSR 2024

ITU-T Recommendations

Search by number:
Others:
Skip Navigation Links
Content search
Advanced search
Provisional name
Equivalent number
Formal description
Study Groups tree viewExpand Study Groups tree view

ITU-T G.729 (06/2012)

عربي | 中文 | English | Español | Français | Русский
Кодирование речи со скоростью 8 кбит/с с использованием линейного предсказания с возбуждением алгебраическим кодом и сопряженной структурой (CS-ACELP)
В Рекомендации МСЭ-T G.729 содержится описание алгоритма кодирования речевых сигналов с использованием линейного предсказания с возбуждением алгебраическим кодом и сопряженной структурой (CS-ACELP). В базовом режиме кодер МСЭ-T G.729 состоит из односкоростного речевого кодера, работающего со скоростью 8 кбит/с с использованием арифметических операций с фиксированной запятой. Приложения A, B и D–J расширяют его функциональные возможности. В Приложении А приводится вариант уменьшенной сложности алгоритма с базовой скоростью кодирования 8 кбит/с. В Приложении B определяется режим контроля скорости источника, предназначенный для использования с МСЭ-T G.729 или Приложением A. В приложениях D, E и H приводится многоскоростной режим и описываются механизмы переключения скорости. В Приложении D приводится расширение для более низких скоростей передачи (со скоростью 6,4 кбит/с), а в Приложении E приводится расширение для более высоких скоростей передачи (со скоростью 11,8 кбит/с). В Приложении H приводятся расширения для передачи битов со скоростями 6,4 кбит/с и 11,8 кбит/с. Таким образом, в Приложениях D, E и H не реализован режим прерывистой передачи, соответствующий Приложению В. Для обеспечения данной функциональной возможности были разработаны дополнительные приложения. В Приложениях F и G используются базовые алгоритмы Приложения B для обеспечения функциональной возможности прерывистой передачи (DTX) для Приложений D и E. В Приложении I обеспечивается функциональная возможность DTX для Приложения H и описывается интеграция основной части данной Рекомендации с Приложениями B, D и E. В Приложении J содержится ссылка на расширение МСЭ-T G.729 для алгоритма масштабируемого кодирования широкополосный речевых и звуковых сигналов со скоростью 8–32 кбит/с, определенного в МСЭ-T G.729.1, который функционально совместим с данной Рекомендацией и ее Приложениями A и B. Как и в основной части данной Рекомендации, в Приложениях A, B и D–J используются арифметические операции с фиксированной запятой. Альтернативные реализации на основе арифметических операций с плавающей запятой представлены в Приложении C к МСЭ-T G.729 и в Приложении A, а также в Приложении C+ к Приложению I. В Дополнении I рассматривается возможность внешнего синхронного сброса состояний систем с помощью внешнего подавления пауз в сочетании с алгоритмами кодирования речи, содержащимися в основной части данной Рекомендации (фиксированная запятая) или ее Приложении A (уменьшенная сложность, фиксированная запятая) и Приложении C (плавающая запятая). В связи с тем что в Приложении B алгоритм обнаружения голосовой активности (VAD) был оптимизирован для передачи по каналам с установлением соединений, в Дополнениях II и III рассматривается оптимизация алгоритма VAD, приведенного в Приложении B, при его использовании в каналах с коммутацией пакетов, например, в приложениях VoIP. В Дополнении IV, включенном в настоящий пересмотр Рекомендации МСЭ-T G.729, описывается использование Приложения A к Рекомендации МСЭ-T G.720.1 в качестве алгоритма VAD для использования с алгоритмом DTX/CNG из Приложения B. В нем обеспечивается бóльшая гибкость в том что касается компромисса между экономией ширины полосы и качеством звука. Режим экономии ширины полосы обеспечивает наилучшие характеристики с точки зрения подавления пауз при поддержании субъективного качества на уровне, сопоставимом с Дополнениями II и III. Кроме того, в Дополнении IV предлагается более высокая устойчивость к самым разным фоновым шумам, включающим музыку. Дополнение IV предназначено для новых мультимедийных услуг на базе IP, а также IP-телефонии и видеоконференцсвязи (как для корпоративных сетей предприятий, так и для массового потребительского рынка), которые представляют собой лишь некоторые из наиболее важных услуг, для которых он был оптимизирован. Целевые устройства включают IP-телефоны и другие мобильные устройства VoIP, домашние шлюзы, IPBX и медиашлюзы. В данной Рекомендации также исправлены ошибки, выявленные в Руководстве пользователя Рекомендации МСЭ-T G.729 (ноябрь 2009 г.), а именно, обнаруженное расхождение между уравнением 40 (в пункте 3.7.1) и кодом на языке С. В качестве неотъемлемой части данной Рекомендации и ее приложений представлены эталонные исходный код ANSI-C и тестовые векторы. Дополнения II, III и IV также связаны с исходным кодом на языке С и тестовыми векторами. С Дополнением I не связан никакой исходный код. Эталонные исходный код на языке С и тестовые векторы для алгоритмов CS-ACELP описаны в основной части, а применимые приложения и дополнения имеются в виде электронных приложений к данной Рекомендации.
Citation: https://handle.itu.int/11.1002/1000/11675
Series title: G series: Transmission systems and media, digital systems and networks
  G.700-G.799: Digital terminal equipments
  G.710-G.729: Coding of voice and audio signals
Approval date: 2012-06-29
Approval process:AAP
Status: In force
Maintenance responsibility: ITU-T Study Group 21
Further details: Patent statement(s)
Development history
Associated test signals