В результате роста количества соединенных устройств и распространения веб- и мультимедийных услуг, облачных услуг, а также приложений интернета вещей (IoT) в сетях возникают различные сетевые инциденты и неконтролируемые изменения, которые возможно измерять по сетевым оповещениям и журналам регистрации, получаемым от базовых сетей. Следовательно, для функционирования сетей важно иметь информацию о транспортируемых ими услугах и приложениях, для того чтобы оптимизировать работу и обеспечивать качество обслуживания, отвечающее ожиданиям пользователей. Отсутствие сетевых оповещений и журналов регистрации в общем случае интерпретируется как показатель удовлетворительной работоспособности сети. Однако это не обязательно соответствует действительности. Проблемы качества обслуживания могут быть вызваны не отказами сетевых устройств, но скорее проблемами, которые не обнаруживаются традиционными инструментами сетевого мониторинга, например ошибками конфигурации, недостаточной пропускной способностью сети, проблемами, связанными с точками беспроводного доступа (например, недостаточное покрытие, помехи или перекрывающийся канал), или проблемами сети третьей стороны. Как правило, ручная реконфигурация сети требует значительного времени и зачастую сопряжена с ошибками. Кроме того, в методиках оценки качества обслуживания требуется дальнейшее разделение между сетевыми искажениями и другими причинами ухудшения рабочих характеристик на основании учета факторов, специфических для конкретного приложения (например, кодирование/декодирование, взаимодействие между приложением и сетью), так как традиционные инструменты оценки не могут обеспечить точной диагностики отказа, прогнозирования отказа и анализа первопричин. Кроме того, традиционные инструменты оценки, как правило, характеризуются значительным временем реагирования на прерывание обслуживания. Наряду с этим показатели рабочих характеристик сети могут влиять на оценку качества обслуживания/оценку пользователем качества услуги (QoS/QoE), но многие из существующих показателей рабочих характеристик сети могут отражать только ограниченный набор аспектов качества сети. Когда результаты, полученные на основе объективных измерений, указывают на неудовлетворительный уровень рабочих характеристик сети или наличие сетевой аномалии, желательно, чтобы система автоматически выполняла необходимые корректирующие действия для разрешения выявленных проблем качества. В Рекомендации МСЭ-T E.475 сформулированы руководящие принципы организации интеллектуального анализа и диагностики сетей для целей управления сетями и устранения сетевых отказов. Функция интеллектуального анализа и диагностики сетей (INAD) отвечает за агрегирование сетевых данных и настройку автоматических задач по обслуживанию сети, обеспечение гарантии надлежащих рабочих характеристик сети, определение области ухудшения качества обслуживания и каналов обслуживания с неудовлетворительными рабочими характеристики, выявление первопричин обнаруженных сетевых отказов, зондирование состояния сети, а также прогнозирование возможного ухудшения рабочих характеристик сети на раннем этапе. Более конкретно, в настоящей Рекомендации рассматриваются вопросы проектирования, функциональная архитектура, модели анализа сетевых аномалий для аналитики и диагностики сети. Модель анализа сетевых аномалий может использоваться для оценки степени сетевой аномалии, рабочих характеристик сети, степени риска, анализа местоположения и времени ухудшения характеристик сети и последующего определения первопричин ухудшения характеристик сети, а также для обеспечения более полной просматриваемости сети и автоматизации управления сетевыми отказам. В настоящей Рекомендации представлена также концепция показателя работоспособности сети (NHI), который обеспечивает числовую индикацию степени сетевой аномалии на основе анализа больших данных. NHI не ориентирован на оценку конкретного мультимедийного приложения (например, оценка конкретного аудиоприложения, приложения видеоконференцсвязи) и мониторинг прикладного уровня. Напротив, он служит для сетевого мониторинга и оценки конкретных сетей (например, LAN, WAN, сеть хранения данных, сеть центра обработки данных) и последующего запуска диагностики сети с использованием алгоритмов диагностики отказов на основе больших данных и определения первопричин событий сетевой аномалии. |