Большие языковые модели (БЯМ) против малых языковых моделей (МЯМ) в финансовых учреждениях: практическое руководство по корпоративному искусственному интеллекту на 2025 год

Оглавление

1. Позиция регуляторов и риски.
2. Возможности и стоимость, задержки и занимаемая площадь.
3. Компромиссы между безопасностью и соответствием требованиям.
4. Шаблоны развёртывания.
5. Матрица решений (краткое руководство).
6. Конкретные примеры использования.
7. Факторы производительности и стоимости перед «расширением».

Примеры

Нет универсального решения, которое однозначно выигрывало бы между большими языковыми моделями (БЯМ, ≥30 миллиардов параметров, часто через API) и малыми языковыми моделями (МЯМ, ~1–15 миллиардов, обычно открытые или специализированные модели).

Для банков, страховщиков и управляющих активами в 2025 году ваш выбор должен определяться нормативными рисками, чувствительностью данных, требованиями к задержкам и стоимости, а также сложностью сценария использования.

Рекомендуется использовать МЯМ для извлечения структурированной информации, обслуживания клиентов, помощи в кодировании и задач по работе со знаниями внутри компании, особенно с генерацией, дополненной извлечением (RAG) и строгими ограничениями.

Переходите на БЯМ для тяжёлого синтеза, многошагового рассуждения или когда МЯМ не могут соответствовать вашим требованиям к производительности в рамках задержек/стоимости.

1. Позиция регуляторов и риски

Финансовые услуги подчиняются зрелым стандартам управления моделями. В США Федеральный резерв/OCC/FDIC SR 11-7 охватывает любую модель, используемую для принятия бизнес-решений, включая БЯМ и МЯМ. Это означает необходимую валидацию, мониторинг и документацию — независимо от размера модели.

В ЕС действует Закон об искусственном интеллекте, с поэтапными сроками соблюдения (август 2025 года для моделей общего назначения, август 2026 года для систем высокого риска, таких как кредитное скоринг в соответствии с Приложением III).

2. Возможности и стоимость, задержки и занимаемая площадь

МЯМ (3–15 миллиардов) теперь демонстрируют высокую точность при выполнении рабочих задач в предметных областях, особенно после тонкой настройки и с улучшением извлечения. Недавние МЯМ (например, Phi-3, FinBERT, COiN) отличаются целевым извлечением, классификацией и улучшением рабочих процессов, сокращают задержки (<50 мс) и позволяют самостоятельное размещение для строгого соблюдения правил резидентности данных — и подходят для развёртывания на периферии. БЯМ открывают возможности для синтеза документов, рассуждений с неоднородными данными и операций в длинном контексте (>100 тысяч токенов). Специализированные БЯМ (например, BloombergGPT, 50 миллиардов) превосходят общие модели по финансовым показателям и задачам многошагового рассуждения.

📈📉 Вычислительная экономика:

  • Трансформаторное самовнимание масштабируется квадратично с длиной последовательности.

  • Оптимизации FlashAttention/SlimAttention снижают вычислительные затраты, но не побеждают квадратичную нижнюю границу; БЯМ с длинным контекстом могут быть экспоненциально дороже при выводе, чем МЯМ с коротким контекстом.

3. Компромиссы между безопасностью и соответствием требованиям

Общие риски: оба типа моделей подвержены риску внедрения подсказок, небезопасной обработке выходных данных, утечкам данных и рискам в цепочке поставок.

МЯМ: предпочтительны для самостоятельного размещения — удовлетворение требований GLBA/PCI/суверенитета данных и минимизация юридических рисков от трансграничных переводов.

БЯМ: API вводят риски концентрации и блокировки; надзорные органы требуют документирования выхода, резервного копирования и стратегий работы с несколькими поставщиками.

Объяснимость: для использования в условиях высокого риска требуются прозрачные функции, модели-претенденты, полные журналы решений и человеческий надзор; трассировка рассуждений БЯМ не может заменить формальную валидацию, требуемую SR 11-7 / Законом ЕС об искусственном интеллекте.

4. Шаблоны развёртывания

Три проверенных режима в финансах:

  • МЯМ в первую очередь, БЯМ для подстраховки: направьте 80%+ запросов к настроенному МЯМ с RAG; в случае неуверенности или необходимости работы с длинным контекстом переходите к БЯМ.

  • БЯМ в первую очередь с использованием инструментов: БЯМ в качестве оркестратора для синтеза с детерминированными инструментами для доступа к данным, расчётов и защиты с помощью DLP.

  • Специализированные БЯМ: большие модели, адаптированные к финансовым корпоративам; более высокая нагрузка по управлению рисками, но измеримые преимущества для нишевых задач.

5. Матрица решений (краткое руководство)

| Критерий | Предпочтение МЯМ | Предпочтение БЯМ |
| — | — | — |
| Регуляторное воздействие | Внутренняя помощь, недецизионные задачи | Использование с высоким риском (кредитное скоринг) с полной валидацией |
| Чувствительность данных | На месте/VPC, ограничения PCI/GLBA | Внешние API с DLP, шифрованием, DPAs |
| Задержки и стоимость | Менее секунды, высокий QPS, чувствительность к стоимости | Секунды-задержки, пакетная обработка, низкий QPS |
| Сложность | Извлечение, маршрутизация, RAG-помощники | Синтез, неоднозначный ввод, контекст в длинном формате |
| Инженерные операции | Самостоятельное размещение, CUDA, интеграция | Управляемый API, риски для поставщиков, быстрое развёртывание |

6. Конкретные примеры использования

  • Обслуживание клиентов: МЯМ в первую очередь с RAG/инструментами для общих вопросов, эскалация к БЯМ для сложных запросов по нескольким полисам.

  • KYC/AML & Adverse Media: МЯМ достаточно для извлечения/нормализации; эскалация к БЯМ для мошенничества или синтеза на нескольких языках.

  • Кредитное андеррайтинг: использование МЯМ/классического ML для принятия решений, БЯМ для объяснительных нарративов, всегда с проверкой человеком.

7. Факторы производительности и стоимости перед «расширением»

  • Оптимизация RAG: большинство сбоев связано с извлечением, а не с «модельным IQ».

  • Контроль ввода-вывода: ограждения для схемы ввода/вывода, защита от внедрения подсказок по OWASP.

  • Обслуживание: квантование МЯМ, кэширование KV, пакетная обработка/потоковая передача, кэширование частых ответов.

  • Селективная эскалация: маршрутизация по уверенности; экономия более 70% затрат.

  • Доменная адаптация: лёгкая настройка/LoRA на МЯМ закрывает большинство пробелов; используйте большие модели только для чёткого, измеримого повышения производительности.

Примеры

Пример 1: Contract Intelligence в JPMorgan (COiN)

JPMorgan Chase внедрила специализированную малую языковую модель (МЯМ), называемую COiN, для автоматизации проверки коммерческих кредитных соглашений — процесс, традиционно выполняемый вручную юридическими сотрудниками. Обучив COiN на тысячах юридических документов и нормативных отчётов, банк сократил время проверки контрактов с нескольких недель до нескольких часов, достигнув высокой точности и отслеживаемости соответствия при значительном снижении операционных затрат.

Пример 2: FinBERT

FinBERT — это языковая модель на основе трансформера, тщательно обученная на различных источниках финансовых данных, таких как транскрипты телефонных разговоров о доходах, статьи финансовых новостей и рыночные отчёты. Это предметно-ориентированное обучение позволяет FinBERT точно определять настроения в финансовых документах — выявлять нюансы тонов, таких как положительные, отрицательные или нейтральные, которые часто определяют поведение инвесторов и рынка.

Финансовые учреждения и аналитики используют FinBERT для оценки преобладающих настроений вокруг компаний, доходов и рыночных событий, используя его результаты для поддержки рыночного прогнозирования, управления портфелем и принятия проактивных решений.

1. Какие факторы следует учитывать при выборе между большими и малыми языковыми моделями для финансовых учреждений?

При выборе между большими и малыми языковыми моделями для финансовых учреждений следует учитывать нормативные риски, чувствительность данных, требования к задержкам и стоимости, а также сложность сценария использования.

2. В каких случаях рекомендуется использовать малые языковые модели (МЯМ)?

Рекомендуется использовать МЯМ для извлечения структурированной информации, обслуживания клиентов, помощи в кодировании и задач по работе со знаниями внутри компании, особенно с генерацией, дополненной извлечением (RAG) и строгими ограничениями.

3. Какие возможности предоставляют большие языковые модели (БЯМ) в финансовых учреждениях?

Большие языковые модели открывают возможности для синтеза документов, рассуждений с неоднородными данными и операций в длинном контексте. Специализированные БЯМ превосходят общие модели по финансовым показателям и задачам многошагового рассуждения.

4. Какие риски связаны с использованием больших языковых моделей в финансовых учреждениях?

Использование больших языковых моделей в финансовых учреждениях связано с рисками внедрения подсказок, небезопасной обработкой выходных данных, утечками данных и рисками в цепочке поставок. Кроме того, API вводят риски концентрации и блокировки, а надзорные органы требуют документирования выхода, резервного копирования и стратегий работы с несколькими поставщиками.

5. Какие шаблоны развёртывания рекомендуются для использования больших и малых языковых моделей в финансовых учреждениях?

Три проверенных режима в финансах:
* МЯМ в первую очередь, БЯМ для подстраховки: направьте 80%+ запросов к настроенному МЯМ с RAG; в случае неуверенности или необходимости работы с длинным контекстом переходите к БЯМ.
* БЯМ в первую очередь с использованием инструментов: БЯМ в качестве оркестратора для синтеза с детерминированными инструментами для доступа к данным, расчётов и защиты с помощью DLP.
* Специализированные БЯМ: большие модели, адаптированные к финансовым корпоративам; более высокая нагрузка по управлению рисками, но измеримые преимущества для нишевых задач.

Источник