Обучение агентов Mistral говорить «нет»: модерация контента от запроса до ответа

В этом руководстве мы реализуем защитные механизмы модерации контента для агентов Mistral, чтобы обеспечить безопасное взаимодействие в соответствии с политикой. Используя API модерации Mistral, мы проверим как входные данные пользователя, так и ответ агента на соответствие таким категориям, как финансовые советы, самоповреждение, раскрытие личных данных и другим. Это поможет предотвратить генерацию или обработку вредного или … Читать далее

Модели ИИ ведут себя как угроза изнутри? Моделирование в Anthropic говорит: да

Последнее исследование Anthropic исследует критически важный аспект безопасности в искусственном интеллекте: появление поведения, подобного угрозам изнутри, у агентов больших языковых моделей (LLM). В исследовании под названием «Агентское рассогласование: как LLM могут стать угрозой изнутри» рассматривается, как современные агенты LLM реагируют, когда их помещают в смоделированные корпоративные среды, которые ставят под сомнение их автономию или ценности. … Читать далее

VERINA: оценка больших языковых моделей на основе генерации проверяемого кода с формальными доказательствами

Проблема верификации при генерации кода на основе LLM Большие языковые модели (LLM) демонстрируют высокие результаты в программировании и широко используются в таких инструментах, как Cursor и GitHub Copilot, для повышения производительности разработчиков. Однако из-за их вероятностной природы LLM не могут предоставить формальные гарантии для генерируемого кода. Сгенерированный код часто содержит ошибки, и при использовании генерации … Читать далее

Решение проблемы галлюцинаций LLM в диалоговых системах, ориентированных на взаимодействие с клиентами

Недавно я оказался на встрече с техническими руководителями крупного предприятия. Мы обсуждали Parlant как решение для создания беглых, но строго контролируемых диалоговых агентов. Обсуждение шло хорошо — пока кто-то не задал вопрос, который меня совершенно озадачил: «Можно ли использовать Parlant, отключив при этом генерацию?» Сначала я подумал, что это недоразумение. Генеративный ИИ-агент… без генерации? Звучало … Читать далее

Создание готовых к использованию пользовательских ИИ-агентов для корпоративных рабочих процессов с мониторингом, оркестровкой и масштабируемостью

В этом руководстве мы покажем вам, как спроектировать и реализовать систему пользовательских агентов, построенную на PyTorch и ключевых инструментах Python, начиная с модулей веб-аналитики и обработки данных и заканчивая продвинутыми генераторами кода. Установка и импорт библиотек Мы начнём с установки и импорта всех основных библиотек, включая PyTorch и Transformers, а также библиотеки для работы с … Читать далее

EmbodiedGen: генератор масштабируемых 3D-миров для реалистичных симуляций воплощённого ИИ

Проблема масштабирования 3D-сред в области воплощённого ИИ Создание реалистичных и точно масштабированных 3D-сред необходимо для обучения и оценки воплощённого ИИ. Однако современные методы всё ещё основаны на ручной разработке 3D-графики, которая дорогостоящая и недостаточно реалистичная, что ограничивает масштабируемость и обобщающую способность. В отличие от данных интернет-масштаба, используемых в таких моделях, как GPT и CLIP, данные … Читать далее

Исследователи Google выпустили Magenta RealTime: модель для генерации музыки в реальном времени с открытым весом

Команда Google Magenta представила Magenta RealTime (Magenta RT) — модель для генерации музыки в реальном времени с открытым весом. Она обеспечивает беспрецедентную интерактивность при создании аудио. Модель Magenta RT лицензирована под Apache 2.0 и доступна на GitHub и Hugging Face. Это первая крупномасштабная модель для генерации музыки, которая поддерживает вывод в реальном времени с динамическими, … Читать далее

Исследователи DeepSeek открыли исходный код личного проекта под названием «nano-vLLM»: облегчённая реализация движка vLLM, созданная с нуля

Исследователи из DeepSeek выпустили интересный личный проект под названием «nano-vLLM» — минималистичную и эффективную реализацию движка vLLM (виртуальная большая языковая модель), разработанную специально для пользователей, которые ценят простоту, скорость и прозрачность. Nano-vLLM написан полностью на Python с нуля и содержит около 1200 строк кода. Несмотря на небольшой размер, он соответствует скорости вывода (inference speed) оригинального … Читать далее

IBM’s MCP Gateway: унифицированный шлюз для протокола Model Context Protocol на основе FastAPI для инструментальных цепочек искусственного интеллекта нового поколения

Введение Разработка и внедрение передовых систем искусственного интеллекта (ИИ) всё больше зависят от гибких и надёжных слоёв оркестрации, которые объединяют различные модели, инструменты и ресурсы. IBM’s MCP Gateway решает эту задачу, предоставляя шлюз на основе FastAPI для протокола Model Context Protocol (MCP), предлагая унифицированный интерфейс для масштабирования и управления современными инструментальными цепочками ИИ. В этой … Читать далее

Почему критика Apple в отношении рассуждений ИИ преждевременна

Дебаты о способности больших моделей рассуждений (LRMs) к логическим выводам недавно активизировались благодаря двум противоречивым статьям: «Иллюзия мышления» от Apple и ответная статья Anthropic под названием «Иллюзия иллюзии мышления». В статье Apple утверждается, что у LRMs есть фундаментальные ограничения в способности к логическим рассуждениям. В то же время Anthropic утверждает, что эти выводы обусловлены скорее … Читать далее

Исследователи из Texas A&M представили двухфазный метод машинного обучения под названием ShockCast для моделирования высокоскоростных потоков с помощью нейронного временного ре-меширования

Проблемы моделирования высокоскоростных потоков с помощью нейронных решателей Моделирование высокоскоростных потоков жидкости, например, в сверхзвуковом или гиперзвуковом режимах, представляет уникальные сложности из-за быстрых изменений, связанных с ударными волнами и волнами расширения. В отличие от низкоскоростных потоков, где хорошо работают фиксированные временные шаги, для этих быстродвижущихся потоков требуется адаптивный временной шаг, чтобы точно фиксировать мелкомасштабную динамику … Читать далее

В статье представлен новый подход WINGS: архитектура с двумя обучающимися для предотвращения забывания только текста в мультимодальных больших языковых моделях

Расширение возможностей больших языковых моделей (LLM) Большие языковые модели (LLM) научились работать с несколькими модальностями, особенно с изображениями и текстом. Это позволило создать более интерактивные и интуитивно понятные системы искусственного интеллекта. Мультимодальные LLM (MLLM) могут интерпретировать визуальные образы, отвечать на вопросы об изображениях и вести диалоги, включающие как текст, так и картинки. Их способность рассуждать … Читать далее

Mistral AI выпустила обновлённую модель Mistral Small 3.2

Основные улучшения:* более точное выполнение инструкций;* снижение количества повторяющихся ошибок;* повышение стабильности при вызове функций. Новые возможности модели Mistral Small 3.2 С частым выпуском новых больших языковых моделей (LLM) разработчики постоянно совершенствуют их возможности, чтобы обеспечить плавную интеграцию в различных реальных сценариях. Mistral AI выпустила обновлённую версию своей предыдущей модели — Mistral Small 3.2 (Mistral-Small-3.2-24B-Instruct-2506). … Читать далее

Создание событийно-ориентированных AI-агентов с помощью UAgents и Google Gemini: руководство по модульной реализации на Python

В этом руководстве мы покажем, как использовать фреймворк UAgents для создания лёгкой архитектуры AI-агентов, управляемых событиями, на базе API Google Gemini. Шаг 1: настройка вложенных циклов событий Сначала мы применяем `nest_asyncio`, чтобы включить вложенные циклы событий, затем настраиваем ключ API Gemini и создаём экземпляр клиента GenAI. Шаг 2: определение коммуникационных контрактов Мы определяем наши коммуникационные … Читать далее

Почему обобщение в моделях согласования потоков возникает из-за аппроксимации, а не стохастичности

Введение: понимание обобщения в глубоких генеративных моделях Глубокие генеративные модели, включая диффузионные и согласовывающие потоки, демонстрируют выдающуюся производительность в синтезе реалистичного мультимодального контента: изображений, аудио, видео и текста. Однако возможности обобщения и механизмы, лежащие в их основе, представляют сложность в глубоком генеративном моделировании. Основная задача включает понимание того, действительно ли генеративные модели обобщают, или просто … Читать далее

Создание агента, совместимого с протоколом A2A: пошаговое руководство по реализации шаблона низкоуровневого исполнителя с помощью Python

Протокол Agent-to-Agent (A2A) — это новый стандарт от Google, который позволяет агентам искусственного интеллекта (ИИ), независимо от их базовой платформы или разработчика, беспрепятственно взаимодействовать и сотрудничать. Он работает с использованием стандартизированных сообщений, карточек агентов (которые описывают возможности агента) и выполнения задач на основе задач, позволяя агентам взаимодействовать через HTTP без необходимости специальной логики интеграции. A2A … Читать далее

Исследователи Meta представили масштабируемую байтово-уровневую авторегрессионную модель U-Net, превосходящую трансформаторы на основе токенов в задачах языкового моделирования

Языковое моделирование играет основополагающую роль в обработке естественного языка, позволяя машинам предсказывать и генерировать текст, напоминающий человеческий. Эти модели значительно эволюционировали, начиная со статистических методов и проходя через нейронные архитектуры к современным крупномасштабным системам на основе трансформаторов. В центре многих приложений, таких как чат-боты, инструменты перевода и механизмы завершения текста, находятся языковые модели, интерпретирующие и … Читать далее

Исследователи представляют смелые идеи в области ИИ на мероприятии MIT Generative AI Impact Consortium

В феврале этого года был запущен MIT Generative AI Impact Consortium (MGAIC) — президентская инициатива под руководством Управления по инновациям и стратегии Массачусетского технологического института (MIT) и под управлением Колледжа вычислительной техники имени Стивена А. Шварцмана. Консорциум объявил конкурс предложений, приглашая исследователей со всего MIT представить идеи для инновационных проектов, изучающих наиболее эффективные способы использования … Читать далее

PoE-World превосходит методы обучения с подкреплением RL в игре Montezuma’s Revenge при минимальном объёме демонстрационных данных

Важность символического мышления в моделировании мира Понимание того, как устроен мир, является ключом к созданию агентов искусственного интеллекта (ИИ), способных адаптироваться к сложным ситуациям. Модели, основанные на нейронных сетях, такие как Dreamer, предлагают гибкость, но требуют огромных объёмов данных для эффективного обучения, что значительно превышает объёмы, необходимые человеку. С другой стороны, новые методы используют программный … Читать далее

Создание интеллектуального интерфейса мультиинструментального ИИ-агента с помощью Streamlit для бесперебойного взаимодействия в реальном времени

В этом руководстве мы создадим мощное и интерактивное приложение Streamlit, объединяющее возможности LangChain, Google Gemini API и набора передовых инструментов для создания умного ИИ-ассистента. Используя интуитивно понятный интерфейс Streamlit, мы создадим систему на основе чата, которая может искать в интернете, получать содержимое Википедии, выполнять вычисления, запоминать ключевые детали и обрабатывать историю разговоров — всё это … Читать далее

Университет Калифорнии в Беркли представляет CyberGym

CyberGym: комплексная система оценки для проверки агентов искусственного интеллекта на наличие уязвимостей в крупных кодовых базах Кибербезопасность стала важной областью интереса в сфере искусственного интеллекта (ИИ), что обусловлено растущей зависимостью от крупных программных систем и расширением возможностей инструментов ИИ. По мере усложнения угроз обеспечение безопасности программных систем стало больше, чем просто вопрос традиционных средств защиты; … Читать далее

Исследование Google представляет причинную структуру для более надёжной интерпретации справедливости подгрупп в оценках машинного обучения

Понимание справедливости подгрупп в машинном обучении (ML) Оценка справедливости в машинном обучении часто включает анализ того, как модели работают с разными подгруппами, определёнными по таким атрибутам, как раса, пол или социально-экономический статус. Такая оценка важна в таких областях, как здравоохранение, где неравная производительность модели может привести к различиям в рекомендациях по лечению или диагностике. Анализ … Читать далее

От автоматизации бэкенда к совместной работе фронтенда: что нового в последнем обновлении AG-UI для взаимодействия AI-агентов с пользователями

Введение AI-агенты всё чаще переходят от чистой автоматизации бэкенда к видимым, совместным элементам в современных приложениях. Однако сделать агентов по-настоящему интерактивными — способными как реагировать на пользователей, так и активно управлять рабочими процессами — долгое время было инженерной головной болью. Каждая команда в итоге создаёт собственные каналы связи, обработку событий и управление состоянием — и … Читать далее

От автоматизации бэкенда к совместной работе фронтенда: что нового в последнем обновлении AG-UI для взаимодействия агентов ИИ с пользователями

Введение Агенты ИИ всё чаще переходят от чистой автоматизации бэкенда к видимым, совместным элементам в современных приложениях. Однако сделать агентов по-настоящему интерактивными — способными как реагировать на пользователей, так и активно направлять рабочие процессы — долгое время было инженерной задачей. Каждая команда в итоге создаёт собственные каналы связи, обработку событий и управление состоянием — и … Читать далее

MiniMax AI выпускает MiniMax-M1: гибридная модель с 456 миллиардами параметров для задач обучения с подкреплением и работы с длинным контекстом

Проблема рассуждений в длинном контексте в моделях ИИ Модели для рассуждений не только понимают язык, но и структурированы так, чтобы обдумывать многошаговые процессы, требующие длительной концентрации внимания и понимания контекста. Поскольку ожидания от ИИ растут, особенно в условиях реального мира и при разработке программного обеспечения, исследователи ищут архитектуры, которые могут обрабатывать более длинные входные данные … Читать далее

OpenAI выпустила демо-версию агента обслуживания клиентов с открытым исходным кодом через Agents SDK

Компания OpenAI предоставила на GitHub демо-версию многоагентной системы обслуживания клиентов с открытым исходным кодом. Этот проект под названием openai-cs-agents-demo демонстрирует, как создавать специализированных ИИ-агентов с помощью Agents SDK. Описание проекта Проект моделирует чат-бота службы поддержки авиакомпании, который может обрабатывать различные запросы, связанные с поездками, путём динамической маршрутизации запросов к специализированным агентам. Система построена на базе … Читать далее

ReVisual-R1: мультимодальная большая языковая модель с открытым исходным кодом на 7 миллиардов параметров, которая обеспечивает длинные, точные и продуманные рассуждения

Задача мультимодального рассуждения Недавние прорывы в языковых моделях, основанных на тексте, таких как DeepSeek-R1, показали, что RL может помочь в развитии сильных навыков рассуждения. Исследователи попытались применить те же методы RL к MLLM, чтобы улучшить их способность рассуждать как по визуальным, так и по текстовым данным. Однако эти попытки не были полностью успешными; MLLM всё … Читать далее

HtFLlib: единая библиотека для оценки методов гетерогенного федеративного обучения в разных модальностях

Учреждения, занимающиеся разработкой искусственного интеллекта, создают гетерогенные модели для решения конкретных задач, но сталкиваются с проблемой нехватки данных при обучении. Традиционное федеративное обучение (FL) поддерживает только сотрудничество однородных моделей, которые требуют идентичной архитектуры у всех клиентов. Однако клиенты разрабатывают архитектуры моделей в соответствии со своими уникальными требованиями. Кроме того, обмен моделями, обучение которых потребовало значительных … Читать далее

Создание продвинутого веб-скрапера BrightData с помощью Google Gemini для извлечения данных с помощью ИИ

В этом руководстве мы покажем вам, как создать усовершенствованный инструмент для веб-скрапинга, который использует мощную прокси-сеть BrightData в сочетании с API Google Gemini для интеллектуального извлечения данных. Вы увидите, как структурировать проект на Python, установить и импортировать необходимые библиотеки, а также инкапсулировать логику скрапинга в чистом и повторно используемом классе BrightDataScraper. Установка необходимых библиотек Мы … Читать далее

Почему малые языковые модели (МЯМ) могут изменить представление об агентском ИИ: эффективность, стоимость и практическое внедрение

Изменение потребностей в системах агентского ИИ Большие языковые модели (БЯМ) широко известны своими способностями, напоминающими человеческие, и навыками ведения диалогов. Однако с быстрым ростом агентских систем ИИ БЯМ всё чаще используются для выполнения повторяющихся специализированных задач. Этот сдвиг набирает обороты: более половины крупных IT-компаний уже используют ИИ-агентов, вкладывая значительные средства в эту сферу и прогнозируя … Читать далее