Meta AI представляет DreamGym: синтезатор текстового опыта для агентов обучения с подкреплением

DreamGym — это новый фреймворк от Meta, который переосмысливает узкие места в обучении с подкреплением (RL) как задачу моделирования. Вместо прямого запуска RL в таких средах, как WebShop, ALFWorld и WebArena Lite, он изучает модель опыта, основанную на рассуждениях, которая имитирует их полностью в тексте. Почему RL для агентов в реальных средах не масштабируется? Текущие … Читать далее

OpenAI названа лидером в области генеративного искусственного интеллекта.

Компания OpenAI получила звание Emerging Leader («Выдающийся лидер») в руководстве по инновациям Gartner за 2025 год среди поставщиков моделей генеративного искусственного интеллекта. Это признание отражает динамику развития нашей компании: более 1 миллиона компаний используют ChatGPT. 1. Какие достижения OpenAI способствовали получению звания Emerging Leader в руководстве по инновациям Gartner за 2025 год? Ответ: OpenAI получила … Читать далее

Google DeepMind представляет SIMA 2 — универсального агента на базе Gemini для сложных 3D виртуальных миров

Google DeepMind выпустил SIMA 2, чтобы проверить, как далеко могут зайти универсальные воплощённые агенты внутри сложных 3D игровых миров. Новая версия SIMA (Scalable Instructable Multiworld Agent) Первая SIMA, выпущенная в 2024 году, научилась более чем 600 навыкам следования инструкциям, таким как «повернуть налево», «подняться по лестнице» и «открыть карту». Она управляла коммерческими играми только с … Читать далее

Google DeepMind представляет SIMA 2 — универсального агента на базе Gemini для сложных 3D виртуальных миров

Google DeepMind выпустила SIMA 2, чтобы проверить, как далеко могут зайти универсальные агенты в сложных 3D игровых мирах. Новая версия SIMA (Scalable Instructable Multiworld Agent) Первая SIMA, выпущенная в 2024 году, научилась более чем 600 навыкам следования инструкциям, таким как «повернуть налево», «подняться по лестнице» и «открыть карту». Она управляла коммерческими играми только с помощью … Читать далее

Cerebras выпустила MiniMax-M2-REAP-162B-A10B: эффективную по памяти версию MiniMax-M2 для агентов кодирования с длинным контекстом

Компания Cerebras выпустила MiniMax-M2-REAP-162B-A10B — сжатую причинно-следственную языковую модель Sparse Mixture-of-Experts (SMoE), полученную из MiniMax-M2, с использованием нового метода Router weighted Expert Activation Pruning (REAP). Модель сохраняет поведение оригинальной MiniMax-M2 с 230 миллиардами параметров в общем и 10 миллиардами активных параметров, одновременно сокращая объём памяти для рабочих нагрузок, ориентированных на развёртывание, таких как агенты кодирования … Читать далее

Исследователи из MBZUAI представили PAN: общую модель мира для интерактивного моделирования на длительном горизонте

Большинство моделей преобразования текста в видео генерируют один клип по запросу и останавливаются. Они не сохраняют внутреннее состояние мира, которое сохранялось бы при поступлении действий с течением времени. PAN, новая модель из Института фундаментальных моделей MBZUAI, призвана восполнить этот пробел, действуя как общая модель мира, которая предсказывает будущие состояния мира в виде видео, обусловленные историей … Читать далее

Как создать полностью интерактивную, реактивную и динамичную панель мониторинга на основе терминала с помощью Textual?

В этом руководстве мы создадим продвинутую интерактивную панель с помощью Textual и рассмотрим, как интерфейсы, ориентированные на терминал, могут быть такими же выразительными и динамичными, как современные веб-панели. По мере написания и выполнения каждого фрагмента мы будем активно конструировать интерфейс по частям: виджеты, макеты, реактивное состояние и потоки событий, чтобы увидеть, как Textual ведёт себя … Читать далее

Исследователи OpenAI обучают трансформеры с разреженными весами для выявления интерпретируемых схем

Когда нейронные сети принимают решения в самых разных областях — от редакторов кода до систем безопасности, — как мы можем увидеть конкретные схемы, которые управляют каждым действием? Исследователи из OpenAI представили новое исследование в области механистической интерпретируемости, в котором обучают языковые модели использовать разреженные внутренние связи, чтобы поведение модели можно было объяснить с помощью небольших … Читать далее

Разработка продвинутой системы многоагентского рассуждения с использованием spaCy

В этом руководстве мы создадим продвинутую систему многоагентского искусственного интеллекта (ИИ) с использованием spaCy, которая позволит нескольким интеллектуальным агентам рассуждать, сотрудничать, рефлексировать и учиться на опыте. Мы пошагово проработаем весь процесс, наблюдая, как каждый агент обрабатывает задачи, используя планирование, память, коммуникацию и семантическое рассуждение. Основные структуры Мы установим все основные структуры, необходимые для нашей системы … Читать далее

OpenAI запускает проект OpenAI для Ирландии

Компания OpenAI в партнёрстве с правительством Ирландии, Dogpatch Labs и Patch запускает проект OpenAI для Ирландии. Его цель — помочь представителям малого и среднего бизнеса, основателям компаний и молодым разработчикам использовать искусственный интеллект для внедрения инноваций, повышения производительности и создания нового поколения ирландских технологических стартапов. 1. Какие цели ставит перед собой проект OpenAI для Ирландии? … Читать далее

Встречайте SDialog: открытый инструментарий Python для создания, моделирования и оценки диалоговых агентов на основе LLM

Разработчики могут надёжно генерировать, контролировать и проверять большие объёмы реалистичных диалоговых данных без необходимости каждый раз создавать собственный стек моделирования. Встречайте SDialog — открытый инструментарий Python для генерации синтетических диалогов, их оценки и интерпретируемости, охватывающий полный диалоговый конвейер — от определения агентов до анализа. Он стандартизирует представление диалога и предоставляет инженерам единый рабочий процесс для … Читать далее

Создание полностью самоуправляемого агента для работы с данными с помощью локальных моделей Hugging Face для автоматизированного планирования, выполнения и тестирования

В этом руководстве мы создаём самоуправляемого агента DataOps, который может планировать, выполнять и тестировать операции с данными автоматически, используя локальные модели Hugging Face. Мы разрабатываем агента с тремя интеллектуальными ролями: планировщик, который создаёт стратегию выполнения; исполнитель, который пишет и запускает код с использованием pandas; и тестировщик, который проверяет результаты на точность и согласованность. Используя модель … Читать далее

Понимание нейронных сетей через разреженные схемы

Компания OpenAI изучает механистическую интерпретируемость, чтобы понять, как нейронные сети осуществляют логические выводы. Наш новый подход, основанный на использовании разреженных моделей, может сделать системы искусственного интеллекта более прозрачными и обеспечить более безопасное и надёжное поведение. Представление GPT-5.1 для разработчиков GPT-5.1 теперь доступен в API. Он обеспечивает: более быстрые адаптивные рассуждения; расширенное кэширование запросов; улучшенную производительность … Читать далее

Как создать полностью функциональный локальный чат-бот в стиле GPT с помощью Hugging Face Transformers

В этом руководстве мы создадим собственную систему чата в стиле GPT с нуля, используя локальную модель Hugging Face. Мы начнём с загрузки лёгкой модели, настроенной на инструкции, которая понимает разговорные запросы, а затем поместим её в структурированную систему чата, включающую системную роль, пользовательскую память и ответы помощника. Установка необходимых библиотек Сначала мы установим основные библиотеки … Читать далее

Нейро добивается успеха на национальном розничном рынке с помощью ChatGPT Business.

Компания Neuro использует ChatGPT Business для выхода на национальный уровень, имея менее семидесяти сотрудников. С его помощью команда экономит время, сокращает расходы и воплощает идеи в рост, начиная с составления контрактов и заканчивая анализом данных о клиентах. 1. Какие задачи помогает решать ChatGPT Business в компании Neuro? В компании Neuro ChatGPT Business помогает экономить время, … Читать далее

Компания OpenAI противодействует требованию газеты New York Times о предоставлении 20 миллионов частных бесед в ChatGPT и ускоряет разработку новых мер по обеспечению безопасности и защите конфиденциальности для защиты ваших данных.

1. Какие меры предпринимает компания OpenAI для защиты конфиденциальности данных пользователей в ChatGPT? В тексте указано, что компания OpenAI ускоряет разработку новых мер по обеспечению безопасности и защите конфиденциальности для защиты данных пользователей. Однако конкретные детали не приводятся. 2. Почему требование газеты New York Times о предоставлении 20 миллионов частных бесед в ChatGPT может быть … Читать далее

Как создать интерактивную аналитическую панель с помощью функций PyGWalker для глубокого изучения данных

В этом руководстве мы рассмотрим расширенные возможности PyGWalker — мощного инструмента для визуального анализа данных, который легко интегрируется с pandas. Шаг 1: Генерация реалистичного набора данных для электронной коммерции Мы начинаем с создания реалистичного набора данных для электронной коммерции, обогащённого временными, демографическими и маркетинговыми характеристиками, чтобы имитировать реальные бизнес-данные. «`pythonimport pandas as pdimport numpy as … Читать далее

Meta AI выпускает Omnilingual ASR: набор моделей автоматического распознавания речи с открытым исходным кодом для более чем 1600 языков

Компания Meta AI выпустила Omnilingual ASR — набор инструментов для автоматического распознавания речи с открытым исходным кодом, который охватывает более 1600 языков и может быть адаптирован для работы с новыми языками с помощью всего нескольких примеров речи и текста без необходимости переобучения модели. Данные и охват языков Для обучения с учителем используются данные из объединённого … Читать далее

Реализация кодирования для создания и обучения продвинутых архитектур с остаточными соединениями, механизмом самовнимания и адаптивной оптимизацией с использованием JAX, Flax и Optax

В этом руководстве мы рассмотрим, как эффективно и модульно создать и обучить продвинутую нейронную сеть с использованием JAX, Flax и Optax. Шаг 1: проектирование архитектуры Мы начнём с проектирования глубокой архитектуры, которая объединяет остаточные соединения и механизмы самовнимания для выразительного изучения признаков. Шаг 2: реализация оптимизации Далее мы реализуем сложные стратегии оптимизации с планированием скорости … Читать далее

Понимание нюансов человеческого интеллекта

Что мы можем узнать об интеллекте человека, изучая, как «думают» машины? Может ли более глубокое понимание систем искусственного интеллекта, которые становятся всё более значимой частью нашей повседневной жизни, помочь нам лучше понять самих себя? Эти вопросы могут показаться глубоко философскими, но для Филиппа Изола поиск ответов связан не только с размышлениями, но и с вычислениями. … Читать далее

Moonshot AI выпускает Kosong: уровень абстракции LLM для работы с Kimi CLI

Современные агентские приложения редко взаимодействуют с одной моделью или инструментом. Как поддерживать работоспособность такого стека, когда провайдеры, модели и инструменты меняются каждые несколько недель? Moonshot AI предлагает решение этой проблемы в виде уровня абстракции LLM для агентских приложений — Kosong. Что такое Kosong? Kosong — это библиотека Python, которая находится между логикой вашего агента и … Читать далее

Gelato-30B-A3B: современная модель для работы с графическими интерфейсами

Как научить агентов искусственного интеллекта точно находить и нажимать нужные элементы на экране? Команда исследователей из ML Foundations представила Gelato-30B-A3B — передовую модель для работы с графическими пользовательскими интерфейсами (GUI). Она предназначена для интеграции в агенты использования компьютеров и преобразования инструкций на естественном языке в надёжные координаты кликов. Что делает Gelato-30B-A3B в стеке агентов? Gelato-30B-A3B … Читать далее

Сравнение систем памяти для агентов LLM: векторные, графовые и журналы событий

Оглавление Высокоуровневое сравнение 1. Векторные системы памяти 1.1 Простой векторный RAG 1.2 Иерархическая векторная память (MemGPT-стиль виртуального контекста)2. Графовые системы памяти 2.1 Временные графовые системы памяти (Zep / Graphiti) 2.2 Графовый RAG (GraphRAG)3. Системы журналов событий и выполнения 3.1 Журналы выполнения и контрольные точки (ALAS, LangGraph) 3.2 Эпизодическая долговременная память Ключевые выводы Надёжные мультиагентные системы … Читать далее

Знакомьтесь: Kosmos — учёный-ИИ, который автоматизирует открытия на основе данных

Kosmos, разработанный компанией Edison Scientific, — это автономная система открытий, которая проводит длительные исследовательские кампании с единой целью. Получив набор данных и задачу в открытом формате на естественном языке, он выполняет повторные циклы анализа данных, поиска в литературе и генерации гипотез, а затем объединяет результаты в полноценный научный отчёт со всеми ссылками. Архитектура, модель мира … Читать далее

Реализация кодирования для создания агентов с нейронной памятью, дифференцируемой памятью, метаобучением и воспроизведением опыта для непрерывной адаптации в динамических средах

В этом руководстве мы рассмотрим, как агенты с нейронной памятью могут непрерывно обучаться, не забывая прошлый опыт. Мы разрабатываем нейронную сеть с дополненной памятью, которая объединяет дифференцируемый нейронный компьютер (DNC) с воспроизведением опыта и метаобучением для быстрой адаптации к новым задачам при сохранении предыдущих знаний. Импорт библиотек и настройка конфигурации Мы начинаем с импорта всех … Читать далее

Серия интервью с AI #1: объяснение стратегий генерации текста в больших языковых моделях (LLMs)

Каждый раз, когда вы делаете запрос к LLM, модель не генерирует полный ответ сразу — она создаёт ответ по одному слову (или токену) за раз. На каждом шаге модель прогнозирует вероятность того, каким может быть следующий токен, основываясь на всём написанном до этого момента. Но одних только вероятностей недостаточно — модели нужна стратегия, чтобы решить, … Читать далее

StepFun AI выпускает Step-Audio-EditX: новую модель для редактирования аудио на уровне открытых исходников, превосходящую в выразительном и итеративном редактировании

Компания StepFun AI представила Step-Audio-EditX — модель для редактирования аудио, основанную на языковой модели с 3 миллиардами параметров. Она превращает редактирование выразительной речи в операцию, подобную работе с текстом на уровне токенов, вместо обработки сигналов на уровне волновых форм. Почему разработчикам важно контролируемое преобразование текста в речь (TTS)? Большинство систем TTS без дополнительных данных (zero … Читать далее

Как создать голосового помощника с агентским ИИ, который понимает, рассуждает, планирует и отвечает с помощью автономного многошагового интеллекта

В этом руководстве мы рассмотрим, как создать голосового помощника с агентским ИИ, способного понимать, рассуждать и отвечать с помощью естественной речи в режиме реального времени. Мы начнём с настройки автономного голосового интеллектуального конвейера, который объединяет распознавание речи, обнаружение намерений, многошаговое рассуждение и синтез текста в речь. Этапы создания 1. Настройка среды и библиотек: * Устанавливаем … Читать далее