基于机器学习的模型创建和性能测试框架,用于评估传输网络对移动分组交换话音业务语音质量的影响 |
ITU-T P.565建议书提供了相关框架的输出内容,该框架是一个基于机器学习的语音质量预测模型,用于预测网际协议(IP)传输和底层传输对语音质量的影响,以及终端客户端的预定义抖动缓冲;因此能够以网络为中心的视角评估关于移动分组交换网上传送的语音质量服务。此评估用平均意见得分 – 听力质量目标(MOS-LQO)来表示,其假设的前提为洁净传输:没有背景噪声、发送设备上不符合标准的编码、自动增益控制、语音增强设备、代码转换、桥接、频率响应、不符合标准的抖动缓冲(用于IP多媒体系统(IMS)移动呼叫)或解码、时钟漂移或任何并非由IP传输和基础传输引起的其他损害。根据该框架,模型可使用参考信号的时间结构信息来识别比特流的各个部分对语音质量而言的重要性。这些模型不对记录的语音信号进行任何感知分析。 该框架规定了开发这些种类指标所需的三个模块:数据库生成器模块、机器学习模块和针对受训模型的验证模块。此外,框架对机器学习算法使用的数据库内容和功能进行了描述。该框架还以差错(抖动和分组丢失)样式文件的形式提供了大量的测试向量,用于学习和验证。本建议书规定了最低要求性能以及针对基于该框架开发之模型的某独立附加验证的条件和要求。本建议书亦具体说明了实施要求。 基于该框架开发的模型,能够评估传输网络对移动分组交换语音业务语音质量的影响,因此使运营商和监管机构受益于快速简便的语音质量趋势监控/基准测试和故障排除。此外,如果根据该框架,预测因子与[ITU-T P.863]中的感知语音质量指标共同使用,则有可能根据此框架确定问题的来源是在预测因子观察到的传输网络内部还是外部。因此,可以对情况进行更详细的分析,且支持排除发生在传输网络之外的、不太明显的退化故障(例如,自动增益控制、语音增强设备、代码转换或模拟处理发生的故障)。 本建议书的电子后附资料中包含通用抖动文件的详细描述和参考语音样本(见附件D)。 |
|
Citation: |
https://handle.itu.int/11.1002/1000/14827 |
Series title: |
P series: Telephone transmission quality, telephone installations, local line networks P.500-P.599: Objective measuring apparatus |
Approval date: |
2021-11-29 |
Provisional name: | P.VSQMTF |
Approval process: | AAP |
Status: |
In force |
Maintenance responsibility: |
ITU-T Study Group 12 |
Further details: |
Patent statement(s)
Development history
|
|
|
|
ITU-T Supplement
|
Title
|
Status
|
Summary
|
Table of contents
|
Download
|
P Suppl. 10 (11/1988)
|
Considerations relating to transmission characteristics for analogue handset telephones
|
In force
|
-
|
here
|
here
|
P Suppl. 16 (11/1988)
|
Guidelines for placement of microphones and loudspeakers in telephone conference rooms and for group audio terminals (GATs)
|
In force
|
-
|
here
|
here
|
P Suppl. 20 (03/1993)
|
Examples of measurements of handset receive-frequency responses: dependence on earcap leakage losses
|
In force
|
-
|
here
|
here
|
P Suppl. 23 (02/1998)
|
ITU-T coded-speech database
|
In force
|
here
|
here
|
here
|
P Suppl. 24 (10/2005)
|
Parameters describing the interaction with spoken dialogue systems
|
In force
|
here
|
here
|
here
|
P Suppl. 25 (01/2011)
|
Parameters describing the interaction with multimodal dialogue systems
|
In force
|
here
|
here
|
here
|
P Suppl. 26 (09/2017)
|
Scenarios for the subjective evaluation of audio and audiovisual multiparty telemeeting quality
|
In force
|
here
|
here
|
here
|
P Suppl. 28 (09/2020)
|
Considerations for the development of new QoS and QoE related objective models to be embedded in Recommendations prepared by ITU-T Study Group 12
|
In force
|
here
|
here
|
here
|
P Suppl. 31 (01/2025)
|
Subjective quality evaluation of audiovisual communication in videotelephony services
|
In force
|
here
|
here
|
here
|
Title |
Approved on |
Download |
Implementer's guide for Recommendation ITU-T P.565
|
2022-06-17
|
here
|
Title |
Approved on |
Download |
Addition to Section 2.3 of the Handbook on Telephonometry
|
2000
|
here
|
Addition to Section 3 of the Handbook on Telephonometry
|
2000
|
here
|
Additions to the Handbook on Telephonometry
|
1999
|
here
|
Telephonometry
|
1992
|
here
|
|