Исследование ИИ предлагает иммунную систему для адаптивной кибербезопасности на основе ИИ-агентов: в 3,4 раза быстрее с накладными расходами менее 10%

Команда исследователей из Google и Университета Арканзаса в Литл-Роке разработала «иммунную систему» для кибербезопасности, состоящую из лёгких автономных ИИ-агентов, расположенных рядом с рабочими нагрузками (поды Kubernetes, API-шлюзы, периферийные сервисы).

Вместо того чтобы экспортировать необработанные данные телеметрии в SIEM и ждать пакетных классификаторов, каждый агент изучает локальные поведенческие базовые показатели, оценивает аномалии с помощью федеративного интеллекта и применяет меры по снижению привилегий непосредственно в точке выполнения.

Основные этапы работы системы:

1. Профилирование (Profile). Агенты развёртываются как сайдкары/демоноустановки вместе с микросервисами и API-шлюзами. Они создают поведенческие отпечатки пальцев из следов выполнения, путей системных вызовов, последовательностей вызовов API и потоков между службами.

2. Рассуждение (Reason). Когда появляется аномалия (например, необычный всплеск загрузок с высокой энтропией от источника с низким уровнем доверия или ранее невиданный граф вызовов API), локальный агент смешивает оценки аномалий с федеративным интеллектом — общими индикаторами и дельтами моделей, изученными коллегами, — для получения оценки риска.

3. Нейтрализация (Neutralize). Если риск превышает контекстно-зависимый порог, агент выполняет немедленный локальный контроль, сопоставленный с действиями с минимальными привилегиями: ставит контейнер на карантин (приостанавливает/изолирует), изменяет учётные данные, применяет ограничение скорости, отзывает токен или ужесточает политику для каждого маршрута.

Результаты исследования

В контролируемой облачной симуляции этот краевой цикл сократил время принятия решений до ~220 мс (≈3,4× быстрее, чем централизованные конвейеры), достиг F1 ≈ 0,89 и удерживал накладные расходы хоста ниже 10% ЦП/ОЗУ.

Метрики сравнительных результатов (симуляция в Kubernetes):

| Метрика | Статический конвейер правил | Базовые ML (пакетный классификатор) | Агентская структура (автономия на краю) |
|———|——————————|————————————|——————————————|
| Точность (Precision) | 0,71 | 0,83 | 0,91 |
| Полнота (Recall) | 0,58 | 0,76 | 0,87 |
| F1-мера | 0,64 | 0,79 | 0,89 |
| Задержка принятия решений до митигации (~decision-to-mitigation latency) | ~750 мс | ~540 мс | ~220 мс |
| Накладные расходы на хосте (ЦП/ОЗУ) | Умеренные | Умеренные | <10% | Ключевые выводы

Краевой подход к кибербезопасности. Лёгкие сайдкар/демонстрационные ИИ-агенты, расположенные рядом с рабочими нагрузками, изучают поведенческие отпечатки пальцев, принимают решения локально и применяют меры по снижению привилегий без обращений к SIEM.

Измеряемая производительность. Сообщается, что время принятия решений до митигации составляет ~220 мс — примерно в 3,4 раза быстрее, чем у централизованных конвейеров (≈540–750 мс) — с F1 ≈ 0,89 (P≈0,91, R≈0,87) в симуляции Kubernetes.

Низкие эксплуатационные расходы. Накладные расходы хоста остаются <10% ЦП/ОЗУ, что делает подход практичным для микросервисов и периферийных узлов.

Профиль → Рассуждение → Нейтрализация. Агенты непрерывно определяют базовую активность (профиль), объединяют локальные сигналы с федеративным интеллектом для оценки рисков (рассуждение) и применяют немедленные, обратимые меры контроля, такие как карантин контейнеров, ротация токенов и ограничение скорости (нейтрализация).

Согласованность с нулевой доверенностью. Решения являются непрерывными и контекстно-зависимыми (идентификация, устройство, гео, рабочая нагрузка), заменяя статические ролевые шлюзы и сокращая время пребывания и риск бокового перемещения.

Управление и безопасность. Действия регистрируются с объяснимыми обоснованиями; политики/модели подписаны и версионированы; меры с высоким радиусом действия могут быть заблокированы за действиями человека и поэтапными развёртываниями.

Краткое содержание

Рассмотрите защиту как распределённую плоскость управления, состоящую из профилирующих, рассуждающих и нейтрализующих агентов, которые действуют там, где живёт угроза. Сообщаемые характеристики — действия ~220 мс, ≈ 3,4× быстрее, чем у централизованных базовых показателей, F1 ≈ 0,89, <10% накладных расходов — согласуются с тем, что вы ожидаете, когда устраняете центральные переходы и позволяете автономии обрабатывать меры по снижению привилегий локально. Это согласуется с непрерывной верификацией в рамках нулевой доверенности и даёт командам практический путь к самостабилизирующимся операциям: изучите нормальное, пометьте отклонения с учётом федеративного контекста и сдержите их на ранней стадии — до того, как боковое перемещение опередит вашу плоскость управления. 1. Какие основные этапы работы системы описаны в статье?

В статье описаны три основных этапа работы системы:
* Профилирование (Profile) — агенты создают поведенческие отпечатки пальцев из следов выполнения, путей системных вызовов, последовательностей вызовов API и потоков между службами.
* Рассуждение (Reason) — при появлении аномалии локальный агент смешивает оценки аномалий с федеративным интеллектом для получения оценки риска.
* Нейтрализация (Neutralize) — если риск превышает контекстно-зависимый порог, агент выполняет немедленный локальный контроль, сопоставленный с действиями с минимальными привилегиями.

2. Какие ключевые выводы можно сделать из исследования?

Ключевые выводы исследования:
* Краевой подход к кибербезопасности с использованием лёгких ИИ-агентов, расположенных рядом с рабочими нагрузками, является эффективным.
* Время принятия решений до митигации составляет ~220 мс, что примерно в 3,4 раза быстрее, чем у централизованных конвейеров.
* Накладные расходы хоста остаются <10% ЦП/ОЗУ, что делает подход практичным для микросервисов и периферийных узлов.
* Решения являются непрерывными и контекстно-зависимыми, заменяя статические ролевые шлюзы и сокращая время пребывания и риск бокового перемещения.

3. Какие метрики использовались для оценки эффективности системы?

Для оценки эффективности системы использовались следующие метрики:
* Точность (Precision).
* Полнота (Recall).
* F1-мера.
* Задержка принятия решений до митигации (~decision-to-mitigation latency).
* Накладные расходы на хосте (ЦП/ОЗУ).

4. Какие преимущества предлагает система по сравнению с централизованными конвейерами?

Система предлагает следующие преимущества по сравнению с централизованными конвейерами:
* Более быстрое время принятия решений — ~220 мс против ≈540–750 мс у централизованных конвейеров.
* Более высокая точность и полнота — F1 ≈ 0,89 против F1 ≈ 0,64–0,79 у централизованных конвейеров.
* Более низкие накладные расходы — <10% ЦП/ОЗУ против умеренных у централизованных конвейеров.
* Контекстно-зависимые решения, заменяющие статические ролевые шлюзы.

5. Какие практические шаги предлагаются для внедрения системы в операции?

Для внедрения системы в операции предлагаются следующие практические шаги:
* Изучить нормальное поведение системы.
* Пометить отклонения с учётом федеративного контекста.
* Сдержать отклонения на ранней стадии — до того, как боковое перемещение опередит плоскость управления.

Источник