Microsoft представляет MAI-Image-1: собственную модель для преобразования текста в изображение, вошедшую в топ-10 LMArena

Корпорация Microsoft представила MAI-Image-1 — свою первую модель для генерации изображений, разработанную исключительно собственными силами. Модель дебютировала в топ-10 рейтинга LMArena (по состоянию на 13 октября 2025 года). Модель MAI-Image-1 проходит публичное тестирование на платформе LMArena для сбора отзывов сообщества. По словам команды Microsoft AI, модель «очень скоро» будет доступна в Copilot и Bing Image … Читать далее

Как оценить ваш пайплайн RAG с помощью синтетических данных?

Оценка приложений LLM, особенно тех, которые используют RAG (Retrieval-Augmented Generation), имеет решающее значение, но часто упускается из виду. Без надлежащей оценки практически невозможно подтвердить, что ваш поисковый механизм эффективен, ответы LLM основаны на источниках (а не являются продуктом галлюцинаций) и что размер контекста оптимален. Синтетические наборы данных для оценки Поскольку начальное тестирование не имеет необходимых … Читать далее

OpenAI и Broadcom объявили о стратегическом сотрудничестве.

Компании заключили многолетнее партнёрство с целью развёртывания 10 гигаватт ускорителей искусственного интеллекта, разработанных OpenAI. Они будут совместно разрабатывать системы следующего поколения и решения для Ethernet, чтобы к 2029 году обеспечить масштабируемую и энергоэффективную инфраструктуру искусственного интеллекта. #OpenAI #Broadcom #стратегическое_сотрудничество 1. Каковы цели стратегического сотрудничества между OpenAI и Broadcom? * Цель сотрудничества — развёртывание 10 гигаватт … Читать далее

Управление рассуждениями в LLM с помощью энтропии: чередование скрытого и явного цепочек рассуждений

SwiReasoning — это механизм, который позволяет LLM (large language model) решать, когда рассуждать в скрытом пространстве, а когда формировать явную цепочку рассуждений (explicit chain-of-thought), используя блочную уверенность, оценённую по тенденциям энтропии в распределениях следующих токенов. Метод не требует обучения, не зависит от модели и нацелен на достижение Парето-оптимального компромисса между точностью и эффективностью в задачах … Читать далее

Google внедряет подход Speech-to-Retrieval (S2R)

Компания Google представила новый подход к голосовому поиску — Speech-to-Retrieval (S2R). Этот метод позволяет напрямую сопоставлять устный запрос с вложением и извлекать информацию без предварительной конвертации речи в текст. Основные принципы S2R Команда Google позиционирует S2R как архитектурное и философское изменение, направленное на устранение распространения ошибок в классическом каскадном подходе моделирования и сосредоточение системы на … Читать далее

Реализация безопасного ИИ-агента с самоаудитом, защитой персональных данных и безопасным доступом к инструментам на Python

В этом руководстве мы рассмотрим, как обеспечить безопасность ИИ-агентов на практике, используя Python. Мы сосредоточимся на создании интеллектуального, но ответственного агента, который соблюдает правила безопасности при взаимодействии с данными и инструментами. Основные этапы 1. Настройка защитного фреймворка: мы начнём с настройки нашего защитного фреймворка и инициализации дополнительной модели Hugging Face для аудита.2. Определение ключевых констант, … Читать далее

5 наиболее популярных паттернов проектирования агентских ИИ, которые должен знать каждый инженер по искусственному интеллекту

По мере развития ИИ-агентов за пределы простых чат-ботов появились новые паттерны проектирования, которые делают их более способными, адаптируемыми и интеллектуальными. Эти паттерны определяют, как агенты думают, действуют и взаимодействуют для решения сложных задач в реальных условиях. ReAct-агент ReAct-агент — это ИИ-агент, построенный на основе фреймворка «reasoning and acting» (ReAct), который сочетает пошаговое мышление со способностью … Читать далее

Sentient AI выпускает ROMA: платформа для создания мета-агентов с иерархическим выполнением задач

Sentient AI выпустила ROMA (Recursive Open Meta-Agent) — платформу с открытым исходным кодом для создания высокопроизводительных мультиагентных систем. Что такое ROMA? ROMA структурирует рабочие процессы агентов в виде иерархического рекурсивного дерева задач:* Родительские узлы разбивают сложную цель на подзадачи.* Передают их дочерним узлам в качестве контекста.* Позже агрегируют их решения в виде результатов, которые поступают … Читать далее

Руководство по кодированию для освоения самообучаемого обучения с помощью Lightly AI для эффективного управления данными и активного обучения

В этом руководстве мы рассмотрим возможности самообучаемого обучения с использованием фреймворка Lightly AI. Мы начнём с создания модели SimCLR для изучения значимых представлений изображений без меток, затем сгенерируем и визуализируем вложения с помощью UMAP и t-SNE. Затем мы углубимся в методы отбора основного набора данных (coreset) для интеллектуального управления данными, симулируем рабочий процесс активного обучения … Читать далее

Встречайте OpenTSLM: семейство языковых моделей временных рядов (TSLM), революционизирующих анализ медицинских временных рядов

Исследователи из Стэнфордского университета в сотрудничестве с ETH Zurich, а также технологическими лидерами, включая Google Research и Amazon, представили OpenTSLM — новое семейство языковых моделей временных рядов (TSLM). Преодоление критического ограничения Существенный прорыв призван преобразовать искусственный интеллект в здравоохранении. Текущие модели больших языковых моделей (LLM) сталкиваются с трудностями при интерпретации и анализе сложных непрерывных медицинских … Читать далее

Liquid AI выпустила LFM2-8B-A1B: модель Mixture-of-Experts для работы на устройстве с 8,3 миллиарда параметров и 1,5 миллиарда активных параметров на токен

Компания Liquid AI представила LFM2-8B-A1B — компактную модель Mixture-of-Experts (MoE), созданную для выполнения задач на устройстве при ограниченных ресурсах памяти, задержках и энергопотреблении. Потенциал модели Сколько возможностей может предоставить модель с разреженной структурой и 8,3 миллиарда параметров, активируя при этом около 1,5 миллиарда параметров на токен, не увеличивая задержку или нагрузку на память? Liquid AI … Читать далее

Meta Superintelligence Labs представляет MetaEmbed: новый подход к мультимодальным вложениям

Meta Superintelligence Labs предлагает MetaEmbed — метод для мультимодального поиска, который позволяет настраивать параметры поиска в режиме реального времени, выбирая количество используемых Meta Tokens. Как работает MetaEmbed? Система обучается с помощью Matryoshka Multi-Vector Retrieval (MMR): Meta Tokens организованы в вложенные группы с префиксами, так что каждый префикс является независимо различимым. При выводе бюджет поиска задаётся … Читать далее

HYGH использует ChatGPT Business для создания цифровых рекламных объявлений нового поколения.

Благодаря ChatGPT Business компания HYGH ускоряет разработку программного обеспечения и запуск кампаний, сокращая время на выполнение задач, увеличивая объём производства и стимулируя рост доходов. 1. Какие преимущества даёт использование ChatGPT Business для создания цифровых рекламных объявлений? Использование ChatGPT Business позволяет компании HYGH ускорить разработку программного обеспечения и запуск рекламных кампаний. Это сокращает время на выполнение … Читать далее

Агентский инжиниринг контекста (ACE): самосовершенствующиеся большие языковые модели через развитие контекстов, а не тонкую настройку

Команда исследователей из Стэнфордского университета, SambaNova Systems и Калифорнийского университета в Беркли представляет фреймворк ACE, который улучшает производительность больших языковых моделей (LLM) путём редактирования и расширения входного контекста, а не обновления весовых коэффициентов модели. Что такое ACE? ACE позиционирует «конструирование контекста» как альтернативу обновлениям параметров. Вместо сжатия инструкций в короткие запросы ACE накапливает и организует … Читать далее

Google открывает исходный код сервера MCP для Google Ads API, предоставляя LLM-доступ к данным о рекламе

Компания Google открыла исходный код сервера Model Context Protocol (MCP), который обеспечивает доступ только для чтения к Google Ads API для агентских приложений и приложений с LLM. Репозиторий googleads/google-ads-mcp В репозитории googleads/google-ads-mcp сервер MCP реализован на языке Python. Сегодня он предоставляет два инструмента:* поиск (запросы GAQL к аккаунтам Ads);* listaccessiblecustomers (перечисление ресурсов клиентов). В репозитории … Читать далее

Что такое агенты для использования компьютера? От веб до ОС — техническое объяснение

Агенты для использования компьютера (также известные как агенты GUI) — это модели на основе визуального языка, которые наблюдают за экраном, определяют элементы пользовательского интерфейса (UI) и выполняют ограниченные действия UI (нажатие, ввод текста, прокрутка, комбинации клавиш) для выполнения задач в неизменных приложениях и браузерах. Примеры публичных реализаций:* использование компьютера от Anthropic;* использование компьютера Gemini 2.5 … Читать далее

Рэй Курцвейл ’70 подкрепляет свой оптимизм в отношении технического прогресса

Инноватор, футурист и автор Рэй Курцвейл ’70 выразил оптимизм относительно искусственного интеллекта и технического прогресса в целом. В лекции в среду он принял премию Роберта А. Му от Школы гуманитарных, искусств и социальных наук (SHASS) Массачусетского технологического института (MIT). Курцвейл представил свои знаменитые прогнозы о том, как искусственный интеллект и вычислительные технологии полностью сольются с … Читать далее

Microsoft Research выпускает Skala: функционал обмена–корреляции на основе глубокого обучения, нацеленный на гибридный уровень точности при полулокальных затратах

Skala — это функционал обмена–корреляции на основе глубокого обучения для теории функционала плотности Кона–Шама (DFT), который обеспечивает гибридный уровень точности при полулокальных затратах. Основные характеристики Skala * Skala заменяет вручную созданную форму XC на нейронный функционал, оцениваемый на стандартных функциях сетки meta-GGA.* В первом выпуске явно не предпринимается попытка изучить дисперсию; в оценочных тестах используется … Читать далее

Определение и оценка политической предвзятости в больших языковых моделях

Узнайте, как OpenAI оценивает политическую предвзятость в ChatGPT с помощью новых методов тестирования в реальных условиях, которые повышают объективность и снижают предвзятость. #️⃣🔍 1. Какие методы тестирования используются OpenAI для оценки политической предвзятости в ChatGPT? Ответ: OpenAI применяет новые методы тестирования в реальных условиях для оценки политической предвзятости в ChatGPT. Эти методы направлены на повышение … Читать далее

Tiny Recursive Model (TRM): модель на 7 миллионов параметров, превосходящая DeepSeek-R1, Gemini 2.5 Pro и o3-mini в логических задачах на ARG-AGI 1 и ARC-AGI 2

Samsung SAIT (Монреаль) выпустила Tiny Recursive Model (TRM) — двухуровневую рекурсивную модель с примерно 7 миллионами параметров, которая демонстрирует высокую точность тестирования на ARC-AGI-1 (44,6–45%) и ARC-AGI-2 (7,8–8%), превосходя результаты значительно более крупных языковых моделей, таких как DeepSeek-R1, o3-mini-high и Gemini 2.5 Pro. Что нового? TRM устраняет двухмодульную иерархию HRM и приближение градиента с фиксированной … Читать далее

RA3: промежуточное обучение с временными абстракциями действий для ускорения посттренировочного обучения с подкреплением в языковых моделях, работающих с кодом

Краткое содержание (TL;DR) Новое исследование от Apple формализует, что должно делать промежуточное обучение перед посттренировочным обучением с подкреплением (RL), и представляет RA3 (Reasoning as Action Abstractions) — процедуру в стиле EM, которая изучает временно согласованные скрытые действия по следам экспертов, а затем точно настраивается на этих начатых следах. RA3 улучшает HumanEval/MBPP примерно на 8/4 балла … Читать далее

Исследователи из Стэнфорда выпустили AgentFlow: обучение с подкреплением в потоке для модульных ИИ-агентов, использующих инструменты

AgentFlow — это обучаемая агентная система с четырьмя модулями: планировщик, исполнитель, верификатор, генератор. Они координируются с помощью явной памяти и набора инструментов. 🔍 Что такое AgentFlow? AgentFlow формализует многошаговое рассуждение с использованием инструментов как процесс принятия решений в условиях неопределённости (MDP — Markov Decision Process). На каждом шаге планировщик предлагает подзадачу и выбирает инструмент плюс … Читать далее

Колледж вычислений имени Шварцмана MIT и Mohamed bin Zayed University of Artificial Intelligence запускают международное сотрудничество, чтобы определить будущее искусственного интеллекта

Колледж вычислений имени Шварцмана MIT и Университет искусственного интеллекта Mohamed bin Zayed (MBZUAI) недавно объявили о запуске совместной исследовательской программы MIT–MBZUAI. Это новая инициатива, направленная на укрепление основ искусственного интеллекта (ИИ) и ускорение его использования для решения актуальных научных и социальных задач. В рамках пятилетнего соглашения преподаватели, студенты и научные сотрудники обоих учреждений будут совместно … Читать далее

Использование генеративного искусственного интеллекта для разнообразия виртуальных тренировочных площадок для роботов

Чат-боты вроде ChatGPT и Claude за последние три года стали невероятно популярными, поскольку могут помочь вам в решении широкого спектра задач. От написания шекспировских сонетов до отладки кода или поиска ответа на каверзный вопрос — системы искусственного интеллекта, похоже, готовы прийти на помощь. Источник такой универсальности — миллиарды или даже триллионы текстовых данных из интернета. … Читать далее

Anthropic выпустила Petri: фреймворк с открытым исходным кодом для автоматизированного аудита

Как проверить пограничные языковые модели на несогласованное поведение в реалистичных условиях с использованием инструментов в многошаговых сценариях — в масштабе и за пределами общих агрегированных показателей? Anthropic выпустила Petri (Parallel Exploration Tool for Risky Interactions) — фреймворк с открытым исходным кодом, который автоматизирует аудит согласованности, используя агента-аудитора для проверки целевой модели в различных сценариях, и … Читать далее

Расширение влияния и масштабов с помощью ChatGPT.

Узнайте, как HiBob использует ChatGPT Enterprise и пользовательские GPT для расширения внедрения искусственного интеллекта, увеличения доходов, оптимизации HR-процессов и предоставления функций на базе ИИ на платформе Bob. 1. Какие конкретные HR-процессы оптимизирует компания HiBob с помощью ChatGPT Enterprise и пользовательских GPT? Ответ: в статье указано, что компания HiBob использует ChatGPT Enterprise и пользовательские GPT для … Читать далее

Model Context Protocol (MCP) vs Function Calling vs OpenAPI Tools — Когда использовать каждый из них?

Оглавление Таблица сравнения Преимущества и ограничения Безопасность и управление Сигналы экосистемы (переносимость/принятие) Правила принятия решений Ссылки Model Context Protocol (MCP) — это открытый, независимый от транспорта протокол, который стандартизирует обнаружение и вызов инструментов/ресурсов на разных хостах и серверах. Он лучше всего подходит для переносимых систем, использующих несколько инструментов и сред выполнения. Function Calling — это … Читать далее

Google AI представляет Gemini 2.5 «Computer Use» (предварительный просмотр): модель управления браузером для взаимодействия ИИ-агентов с пользовательскими интерфейсами

Что такое Gemini 2.5 «Computer Use»? Это специализированная версия Gemini 2.5, которая планирует и выполняет реальные действия с пользовательским интерфейсом в работающем браузере через ограниченный API действий. Модель доступна в виде предварительной версии через Google AI Studio и Vertex AI. Она нацелена на автоматизацию веб-процессов и тестирование пользовательских интерфейсов. Какие возможности предоставляет модель? Разработчики вызывают … Читать далее

Meta AI выпускает OpenZL: фреймворк для сжатия с учётом формата и универсальным декодером с открытым исходным кодом

Meta AI представила OpenZL — это фреймворк с открытым исходным кодом, который создаёт специализированные компрессоры с учётом формата на основе высокоуровневых описаний данных и выдаёт самоописываемый формат передачи данных, который может считывать универсальный декодер. Это позволяет отделить эволюцию компрессоров от внедрения новых версий декодеров. Насколько высокой будет степень сжатия и пропускная способность, если обучить графовый … Читать далее

Интеллектуальный диалоговый конвейер машинного обучения, объединяющий агентов LangChain и XGBoost для автоматизированных рабочих процессов в области науки о данных

В этом руководстве мы объединяем аналитические возможности XGBoost с диалоговым интеллектом LangChain. Мы создаём комплексный конвейер, который может генерировать синтетические наборы данных, обучать модель XGBoost, оценивать её производительность и визуализировать ключевые выводы — всё это с помощью модульных инструментов LangChain. Этапы работы 1. Генерация данных. Используем LangChain для генерации синтетического классификационного набора данных с помощью … Читать далее