Google выпускает Gemini 3 Pro: новый шаг в развитии мультимодальных систем

Google представила семейство моделей Gemini 3, в центре которого находится Gemini 3 Pro. Эта модель позиционируется как значительный шаг к созданию более универсальных систем искусственного интеллекта. Как мы переходим от языковых моделей, которые только отвечают на запросы, к системам, способным рассуждать над контекстом в миллион токенов, понимать сигналы реального мира и действовать как агенты от … Читать далее

Конференция MIT Energy Initiative освещает приоритеты исследований в меняющемся энергетическом ландшафте

«Мы здесь, чтобы поговорить о действительно существенных изменениях, и мы хотим, чтобы вы стали участниками этого процесса», — сказала Дезире Плата, выдающийся профессор Школы инженерии MIT в области климата и энергетики на факультете гражданского строительства и экологической инженерии, на ежегодной исследовательской конференции MIT Energy Initiative (MITEI), которая прошла 9–10 сентября. Слова Платы нашли отклик у … Читать далее

Uni-MoE-2.0-Omni: открытая омнимодальная модель на основе Qwen2.5-7B для понимания текста, изображений, аудио и видео

Команда исследователей из Харбинского технологического института, Шэньчжэнь, представила Uni-MoE-2.0-Omni — полностью открытую омнимодальную большую модель, которая продвигает линейку Uni-MoE в сторону языково-ориентированных мультимодальных рассуждений. Система обучена с нуля на плотной основе Qwen2.5-7B и расширена до архитектуры Mixture of Experts с динамической маршрутизацией мощностей, прогрессивным обучением с учителем и подкреплением, а также примерно на 75 миллиардах … Читать далее

Uni-MoE-2.0-Omni: открытая универсальная модель для понимания текста, изображений, аудио и видео

Введение Команда исследователей из Харбинского технологического университета в Шэньчжэне представила Uni-MoE-2.0-Omni — полностью открытую омнимодальную большую модель, которая продвигает линейку Uni-MoE в сторону языково-центричного мультимодального анализа. Система обучена с нуля на плотном бэкбоне Qwen2.5-7B и расширена до архитектуры Mixture of Experts с динамической маршрутизацией мощностей, прогрессивным обучением с учителем и подкреплением, а также примерно на … Читать далее

Интуи́т и OpenAI объединяют усилия для создания новых возможностей на базе искусственного интеллекта

Компании Intuit и OpenAI начали многолетнее партнёрство на сумму более 100 миллионов долларов. В рамках сотрудничества планируется запуск приложений Intuit в ChatGPT и расширение использования передовых моделей OpenAI для создания персонализированных финансовых инструментов. 1. Какие возможности для пользователей могут появиться благодаря партнёрству Intuit и OpenAI? Благодаря партнёрству Intuit и OpenAI пользователи могут получить доступ к … Читать далее

Uni-MoE-2.0-Omni: открытая омнимодальная модель на основе Qwen2.5-7B для понимания текста, изображений, аудио и видео

Введение Команда исследователей из Харбинского технологического института, Шэньчжэнь, представила Uni-MoE-2.0-Omni — полностью открытую омнимодальную большую модель, которая продвигает линейку Uni-MoE в сторону языково-центричного мультимодального рассуждения. Система обучена с нуля на плотной основе Qwen2.5-7B и расширена до архитектуры Mixture of Experts с динамической маршрутизацией мощностей, прогрессивным обучением под наблюдением и подкреплением, а также примерно на 75 … Читать далее

Meta AI представляет DreamGym: синтезатор текстового опыта для агентов обучения с подкреплением

DreamGym — это новый фреймворк от Meta, который переосмысливает узкие места в обучении с подкреплением (RL) как задачу моделирования. Вместо прямого запуска RL в таких средах, как WebShop, ALFWorld и WebArena Lite, он изучает модель опыта, основанную на рассуждениях, которая имитирует их полностью в тексте. Почему RL для агентов в реальных средах не масштабируется? Текущие … Читать далее

OpenAI названа лидером в области генеративного искусственного интеллекта.

Компания OpenAI получила звание Emerging Leader («Выдающийся лидер») в руководстве по инновациям Gartner за 2025 год среди поставщиков моделей генеративного искусственного интеллекта. Это признание отражает динамику развития нашей компании: более 1 миллиона компаний используют ChatGPT. 1. Какие достижения OpenAI способствовали получению звания Emerging Leader в руководстве по инновациям Gartner за 2025 год? Ответ: OpenAI получила … Читать далее

Google DeepMind представляет SIMA 2 — универсального агента на базе Gemini для сложных 3D виртуальных миров

Google DeepMind выпустил SIMA 2, чтобы проверить, как далеко могут зайти универсальные воплощённые агенты внутри сложных 3D игровых миров. Новая версия SIMA (Scalable Instructable Multiworld Agent) Первая SIMA, выпущенная в 2024 году, научилась более чем 600 навыкам следования инструкциям, таким как «повернуть налево», «подняться по лестнице» и «открыть карту». Она управляла коммерческими играми только с … Читать далее

Google DeepMind представляет SIMA 2 — универсального агента на базе Gemini для сложных 3D виртуальных миров

Google DeepMind выпустила SIMA 2, чтобы проверить, как далеко могут зайти универсальные агенты в сложных 3D игровых мирах. Новая версия SIMA (Scalable Instructable Multiworld Agent) Первая SIMA, выпущенная в 2024 году, научилась более чем 600 навыкам следования инструкциям, таким как «повернуть налево», «подняться по лестнице» и «открыть карту». Она управляла коммерческими играми только с помощью … Читать далее

Cerebras выпустила MiniMax-M2-REAP-162B-A10B: эффективную по памяти версию MiniMax-M2 для агентов кодирования с длинным контекстом

Компания Cerebras выпустила MiniMax-M2-REAP-162B-A10B — сжатую причинно-следственную языковую модель Sparse Mixture-of-Experts (SMoE), полученную из MiniMax-M2, с использованием нового метода Router weighted Expert Activation Pruning (REAP). Модель сохраняет поведение оригинальной MiniMax-M2 с 230 миллиардами параметров в общем и 10 миллиардами активных параметров, одновременно сокращая объём памяти для рабочих нагрузок, ориентированных на развёртывание, таких как агенты кодирования … Читать далее

Исследователи из MBZUAI представили PAN: общую модель мира для интерактивного моделирования на длительном горизонте

Большинство моделей преобразования текста в видео генерируют один клип по запросу и останавливаются. Они не сохраняют внутреннее состояние мира, которое сохранялось бы при поступлении действий с течением времени. PAN, новая модель из Института фундаментальных моделей MBZUAI, призвана восполнить этот пробел, действуя как общая модель мира, которая предсказывает будущие состояния мира в виде видео, обусловленные историей … Читать далее

Как создать полностью интерактивную, реактивную и динамичную панель мониторинга на основе терминала с помощью Textual?

В этом руководстве мы создадим продвинутую интерактивную панель с помощью Textual и рассмотрим, как интерфейсы, ориентированные на терминал, могут быть такими же выразительными и динамичными, как современные веб-панели. По мере написания и выполнения каждого фрагмента мы будем активно конструировать интерфейс по частям: виджеты, макеты, реактивное состояние и потоки событий, чтобы увидеть, как Textual ведёт себя … Читать далее

Исследователи OpenAI обучают трансформеры с разреженными весами для выявления интерпретируемых схем

Когда нейронные сети принимают решения в самых разных областях — от редакторов кода до систем безопасности, — как мы можем увидеть конкретные схемы, которые управляют каждым действием? Исследователи из OpenAI представили новое исследование в области механистической интерпретируемости, в котором обучают языковые модели использовать разреженные внутренние связи, чтобы поведение модели можно было объяснить с помощью небольших … Читать далее

Разработка продвинутой системы многоагентского рассуждения с использованием spaCy

В этом руководстве мы создадим продвинутую систему многоагентского искусственного интеллекта (ИИ) с использованием spaCy, которая позволит нескольким интеллектуальным агентам рассуждать, сотрудничать, рефлексировать и учиться на опыте. Мы пошагово проработаем весь процесс, наблюдая, как каждый агент обрабатывает задачи, используя планирование, память, коммуникацию и семантическое рассуждение. Основные структуры Мы установим все основные структуры, необходимые для нашей системы … Читать далее

OpenAI запускает проект OpenAI для Ирландии

Компания OpenAI в партнёрстве с правительством Ирландии, Dogpatch Labs и Patch запускает проект OpenAI для Ирландии. Его цель — помочь представителям малого и среднего бизнеса, основателям компаний и молодым разработчикам использовать искусственный интеллект для внедрения инноваций, повышения производительности и создания нового поколения ирландских технологических стартапов. 1. Какие цели ставит перед собой проект OpenAI для Ирландии? … Читать далее

Встречайте SDialog: открытый инструментарий Python для создания, моделирования и оценки диалоговых агентов на основе LLM

Разработчики могут надёжно генерировать, контролировать и проверять большие объёмы реалистичных диалоговых данных без необходимости каждый раз создавать собственный стек моделирования. Встречайте SDialog — открытый инструментарий Python для генерации синтетических диалогов, их оценки и интерпретируемости, охватывающий полный диалоговый конвейер — от определения агентов до анализа. Он стандартизирует представление диалога и предоставляет инженерам единый рабочий процесс для … Читать далее

Создание полностью самоуправляемого агента для работы с данными с помощью локальных моделей Hugging Face для автоматизированного планирования, выполнения и тестирования

В этом руководстве мы создаём самоуправляемого агента DataOps, который может планировать, выполнять и тестировать операции с данными автоматически, используя локальные модели Hugging Face. Мы разрабатываем агента с тремя интеллектуальными ролями: планировщик, который создаёт стратегию выполнения; исполнитель, который пишет и запускает код с использованием pandas; и тестировщик, который проверяет результаты на точность и согласованность. Используя модель … Читать далее

Понимание нейронных сетей через разреженные схемы

Компания OpenAI изучает механистическую интерпретируемость, чтобы понять, как нейронные сети осуществляют логические выводы. Наш новый подход, основанный на использовании разреженных моделей, может сделать системы искусственного интеллекта более прозрачными и обеспечить более безопасное и надёжное поведение. Представление GPT-5.1 для разработчиков GPT-5.1 теперь доступен в API. Он обеспечивает: более быстрые адаптивные рассуждения; расширенное кэширование запросов; улучшенную производительность … Читать далее

Как создать полностью функциональный локальный чат-бот в стиле GPT с помощью Hugging Face Transformers

В этом руководстве мы создадим собственную систему чата в стиле GPT с нуля, используя локальную модель Hugging Face. Мы начнём с загрузки лёгкой модели, настроенной на инструкции, которая понимает разговорные запросы, а затем поместим её в структурированную систему чата, включающую системную роль, пользовательскую память и ответы помощника. Установка необходимых библиотек Сначала мы установим основные библиотеки … Читать далее

Нейро добивается успеха на национальном розничном рынке с помощью ChatGPT Business.

Компания Neuro использует ChatGPT Business для выхода на национальный уровень, имея менее семидесяти сотрудников. С его помощью команда экономит время, сокращает расходы и воплощает идеи в рост, начиная с составления контрактов и заканчивая анализом данных о клиентах. 1. Какие задачи помогает решать ChatGPT Business в компании Neuro? В компании Neuro ChatGPT Business помогает экономить время, … Читать далее

Компания OpenAI противодействует требованию газеты New York Times о предоставлении 20 миллионов частных бесед в ChatGPT и ускоряет разработку новых мер по обеспечению безопасности и защите конфиденциальности для защиты ваших данных.

1. Какие меры предпринимает компания OpenAI для защиты конфиденциальности данных пользователей в ChatGPT? В тексте указано, что компания OpenAI ускоряет разработку новых мер по обеспечению безопасности и защите конфиденциальности для защиты данных пользователей. Однако конкретные детали не приводятся. 2. Почему требование газеты New York Times о предоставлении 20 миллионов частных бесед в ChatGPT может быть … Читать далее

Как создать интерактивную аналитическую панель с помощью функций PyGWalker для глубокого изучения данных

В этом руководстве мы рассмотрим расширенные возможности PyGWalker — мощного инструмента для визуального анализа данных, который легко интегрируется с pandas. Шаг 1: Генерация реалистичного набора данных для электронной коммерции Мы начинаем с создания реалистичного набора данных для электронной коммерции, обогащённого временными, демографическими и маркетинговыми характеристиками, чтобы имитировать реальные бизнес-данные. «`pythonimport pandas as pdimport numpy as … Читать далее

Meta AI выпускает Omnilingual ASR: набор моделей автоматического распознавания речи с открытым исходным кодом для более чем 1600 языков

Компания Meta AI выпустила Omnilingual ASR — набор инструментов для автоматического распознавания речи с открытым исходным кодом, который охватывает более 1600 языков и может быть адаптирован для работы с новыми языками с помощью всего нескольких примеров речи и текста без необходимости переобучения модели. Данные и охват языков Для обучения с учителем используются данные из объединённого … Читать далее

Реализация кодирования для создания и обучения продвинутых архитектур с остаточными соединениями, механизмом самовнимания и адаптивной оптимизацией с использованием JAX, Flax и Optax

В этом руководстве мы рассмотрим, как эффективно и модульно создать и обучить продвинутую нейронную сеть с использованием JAX, Flax и Optax. Шаг 1: проектирование архитектуры Мы начнём с проектирования глубокой архитектуры, которая объединяет остаточные соединения и механизмы самовнимания для выразительного изучения признаков. Шаг 2: реализация оптимизации Далее мы реализуем сложные стратегии оптимизации с планированием скорости … Читать далее

Понимание нюансов человеческого интеллекта

Что мы можем узнать об интеллекте человека, изучая, как «думают» машины? Может ли более глубокое понимание систем искусственного интеллекта, которые становятся всё более значимой частью нашей повседневной жизни, помочь нам лучше понять самих себя? Эти вопросы могут показаться глубоко философскими, но для Филиппа Изола поиск ответов связан не только с размышлениями, но и с вычислениями. … Читать далее

Moonshot AI выпускает Kosong: уровень абстракции LLM для работы с Kimi CLI

Современные агентские приложения редко взаимодействуют с одной моделью или инструментом. Как поддерживать работоспособность такого стека, когда провайдеры, модели и инструменты меняются каждые несколько недель? Moonshot AI предлагает решение этой проблемы в виде уровня абстракции LLM для агентских приложений — Kosong. Что такое Kosong? Kosong — это библиотека Python, которая находится между логикой вашего агента и … Читать далее

Gelato-30B-A3B: современная модель для работы с графическими интерфейсами

Как научить агентов искусственного интеллекта точно находить и нажимать нужные элементы на экране? Команда исследователей из ML Foundations представила Gelato-30B-A3B — передовую модель для работы с графическими пользовательскими интерфейсами (GUI). Она предназначена для интеграции в агенты использования компьютеров и преобразования инструкций на естественном языке в надёжные координаты кликов. Что делает Gelato-30B-A3B в стеке агентов? Gelato-30B-A3B … Читать далее