Microsoft выпускает Fara-7B: эффективную агентскую модель для использования на компьютере

Компания Microsoft Research выпустила Fara-7B — небольшую языковую модель с 7 миллиардами параметров, разработанную специально для использования на компьютере. Это открытый агент по использованию компьютера, который работает со скриншотами, предсказывает действия мыши и клавиатуры и может выполняться на одном устройстве пользователя, что снижает задержки и сохраняет данные локально. От чат-ботов к агентам использования компьютера Традиционные … Читать далее

Как искусственный интеллект может помочь в переходе к чистой энергии

Искусственный интеллект (ИИ) всё чаще становится объектом внимания в контексте растущего спроса на энергию. Однако центры обработки данных, которые строятся для поддержки ИИ, могут создавать нагрузку на электросети, повышать цены для потребителей и вызывать перебои в обслуживании. Тем не менее использование ИИ может способствовать переходу к чистой энергии. Снижение энергопотребления и выбросов Использование ИИ помогает … Читать далее

NVIDIA выпускает модель ИИ Nemotron-Elastic-12B: одна модель ИИ, которая предоставляет варианты 6B/9B/12B без дополнительных затрат на обучение

NVIDIA AI выпускает Nemotron-Elastic-12B — модель искусственного интеллекта с 12 миллиардами параметров, которая включает в себя вложенные варианты с 9 миллиардами и 6 миллиардами параметров в том же пространстве параметров. Это означает, что все три размера получаются из одной эластичной контрольной точки без дополнительных этапов дистилляции для каждого размера. Почему команды разработчиков ИИ всё ещё … Читать далее

Представляем исследование покупок в ChatGPT.

Исследование покупок в ChatGPT помогает вам изучать, сравнивать и находить товары с помощью персонализированных руководств для покупателей, которые упрощают процесс принятия решений. 1. Какие задачи помогает решать исследование покупок в ChatGPT? Исследование покупок в ChatGPT помогает изучать, сравнивать и находить товары, а также упрощает процесс принятия решений за счёт персонализированных руководств для покупателей. 2. Какие … Читать далее

NVIDIA выпускает модель ИИ Nemotron-Elastic-12B: одна модель ИИ, которая предоставляет варианты на 6B, 9B и 12B параметров без дополнительных затрат на обучение

NVIDIA AI выпускает Nemotron-Elastic-12B — модель искусственного интеллекта с 12 миллиардами параметров, которая включает в себя вложенные варианты с 9 миллиардами и 6 миллиардами параметров в одном и том же пространстве параметров. Это означает, что все три размера получаются из одной эластичной контрольной точки без дополнительных прогонов дистилляции для каждого размера. Почему команды разработчиков ИИ … Читать далее

NVIDIA выпускает модель искусственного интеллекта Nemotron-Elastic-12B

Компания NVIDIA представила модель Nemotron-Elastic-12B — единую модель искусственного интеллекта, которая генерирует варианты с 6, 9 и 12 миллиардами параметров без дополнительных затрат на обучение. Почему команды разработчиков ИИ всё ещё обучают и хранят несколько больших языковых моделей для разных целей развёртывания, когда одна эластичная модель может генерировать несколько размеров с теми же затратами? Команда … Читать далее

NVIDIA представляет Nemotron-Elastic-12B: одна модель ИИ, которая даёт варианты 6B/9B/12B без дополнительных затрат на обучение

NVIDIA AI выпускает Nemotron-Elastic-12B — модель искусственного интеллекта с 12 миллиардами параметров, которая включает в себя вложенные варианты с 9 миллиардами и 6 миллиардами параметров в том же пространстве параметров. Это означает, что все три размера получаются из одной эластичной контрольной точки без дополнительных прогонов дистилляции для каждого размера. Почему команды разработчиков ИИ всё ещё … Читать далее

Исследователи из Moonshot AI представили Seer: систему онлайн-обучения контексту для быстрого синхронного подкрепления обучения RL

Команда исследователей из Moonshot AI и Университета Цинхуа разработала новую систему онлайн-обучения контексту под названием Seer. Она направлена на решение проблемы узких мест в синхронном подкреплении обучения RL для больших языковых моделей. Почему синхронный вывод замедляется для моделей рассуждений? Современные рабочие нагрузки RL используют длинные цепочки рассуждений. В экспериментах с Seer исследователи применили GRPO к … Читать далее

Как спроектировать мини-среду для обучения с подкреплением с интеллектуальной локальной обратной связью, адаптивным принятием решений и координацией нескольких агентов

В этом руководстве мы создадим мини-среду для обучения с подкреплением, в которой многоагентная система учится перемещаться по сетке через взаимодействие, обратную связь и многоуровневое принятие решений. Мы создадим всё с нуля и объединим три роли агентов: агент действия, агент инструмента и супервизор, чтобы наблюдать, как простые эвристики, анализ и надзор способствуют более интеллектуальному поведению. Создание … Читать далее

Google DeepMind представляет Nano Banana Pro: модель генерации изображений Gemini 3 Pro для точного текста и студийного качества визуалов

Nano Banana Pro, также известная как Gemini 3 Pro Image, — это новая модель Google DeepMind для генерации и редактирования изображений, созданная на основе Gemini 3 Pro. Она позиционируется как современная система для создания и редактирования изображений, учитывающая структуру, мировые знания и расположение текста, а не только стиль. Nano Banana Pro и её предшественница Nano … Читать далее

Perplexity AI выпускает TransferEngine и pplx garden для запуска языковых моделей с триллионом параметров на существующих кластерах GPU

Как команды могут запускать языковые модели с триллионом параметров на существующих смешанных кластерах GPU без дорогостоящего нового оборудования или глубокой привязки к поставщику? Исследовательская группа Perplexity выпустила TransferEngine и сопутствующий инструментарий pplx garden в виде инфраструктуры с открытым исходным кодом для систем больших языковых моделей. Это позволяет запускать модели с до 1 триллиона параметров на … Читать далее

Реализация полностью отслеживаемого и оценённого локального конвейера LLM с использованием Opik для прозрачных, измеримых и воспроизводимых рабочих процессов искусственного интеллекта

В этом руководстве мы реализуем полный рабочий процесс для создания, отслеживания и оценки конвейера LLM с использованием Opik. Мы пошагово структурируем систему, начиная с лёгкой модели, добавляя планирование на основе подсказок, создавая набор данных и, наконец, выполняя автоматическую оценку. Установка среды Мы устанавливаем необходимые библиотеки и инициализируем Opik. Мы загружаем основные модули, определяем устройство и … Читать далее

Институт Аллена для искусственного интеллекта (AI2) представляет Olmo 3: семейство больших языковых моделей с 7 и 32 миллиардами параметров

Институт Аллена для искусственного интеллекта (AI2) выпускает Olmo 3 в качестве полностью открытой модели, которая раскрывает весь «поток модели» — от необработанных данных и кода до промежуточных контрольных точек и вариантов, готовых к развёртыванию. Olmo 3 — это набор плотных трансформеров с моделями на 7 миллиардов и 32 миллиарда параметров. В семейство входят Olmo 3-Base, … Читать далее

OpenAI и Foxconn сотрудничают для укрепления производственной сферы США в цепочке поставок искусственного интеллекта.

Компании OpenAI и Foxconn объединили усилия с целью разработки и производства оборудования для инфраструктуры искусственного интеллекта нового поколения в США. В рамках партнёрства планируется разработка нескольких поколений систем для дата-центров, укрепление цепочек поставок в США и создание ключевых компонентов внутри страны для ускорения развития передовой инфраструктуры искусственного интеллекта. #️⃣ 🔬🏭 1. Какие цели стоят перед … Читать далее

Сравнение технологий для промышленного вывода LLM: vLLM, TensorRT-LLM, Hugging Face TGI и LMDeploy

Введение Выбор стека для вывода (inference) больших языковых моделей (LLM) в промышленном масштабе — это важная задача, которая влияет на производительность и стоимость системы. В этой статье мы рассмотрим четыре широко используемых стека: vLLM, TensorRT-LLM, Hugging Face Text Generation Inference (TGI v3) и LMDeploy. 1. vLLM: PagedAttention как открытая базовая линия * Основная идея: vLLM … Читать далее

OpenAI сотрудничает с DoorDash, SCORE и местными организациями, чтобы помочь 1000 малым предприятиям использовать искусственный интеллект. Программа Small Business AI Jam предоставляет владельцам малого бизнеса практические инструменты и обучение, чтобы они могли конкурировать и развиваться.

1. Какие организации сотрудничают с OpenAI в рамках программы помощи малым предприятиям? Ответ: OpenAI сотрудничает с DoorDash, SCORE и местными организациями. 2. Какова цель программы Small Business AI Jam? Ответ: цель программы Small Business AI Jam — предоставить владельцам малого бизнеса практические инструменты и обучение, чтобы они могли конкурировать и развиваться с помощью искусственного интеллекта. … Читать далее

Google Antigravity превращает среду разработки в панель управления для агентского программирования

Google представила Antigravity — агентскую платформу разработки, которая работает на основе Gemini 3. Это не просто слой автозаполнения, а полноценная среда разработки (IDE), где агенты планируют, выполняют и объясняют сложные программные задачи в редакторе, терминале и браузере. Antigravity была запущена 18 ноября 2025 года вместе с Gemini 3 в рамках стремления Google к созданию инструментов … Читать далее

Комплексная эмпирическая система для оценки стратегий рассуждений в современных системах искусственного интеллекта

В этом руководстве мы подробно рассмотрим, как систематически оцениваются компоненты системы, путём анализа различных стратегий рассуждения в разнообразных задачах. Мы изучим, как разные архитектуры, такие как Direct, Chain-of-Thought, ReAct и Reflexion, ведут себя при решении задач возрастающей сложности, и количественно оценим их точность, эффективность, задержку и модели использования инструментов. Основные компоненты системы Мы определяем основные … Читать далее

Стоимость мышления

Большие языковые модели (БЯМ), такие как ChatGPT, могут почти мгновенно написать эссе или спланировать меню. Но до недавнего времени их можно было легко поставить в тупик. Модели, которые отвечают на запросы пользователей, опираясь на языковые шаблоны, часто не справлялись с математическими задачами и не были хороши в сложных рассуждениях. Однако внезапно они стали намного лучше … Читать далее

Укрепление нашей системы безопасности с помощью внешнего тестирования.

OpenAI сотрудничает с независимыми экспертами для оценки передовых систем искусственного интеллекта. Тестирование третьими сторонами повышает безопасность, подтверждает эффективность защитных мер и увеличивает прозрачность в оценке возможностей моделей и рисков. 1. Какова роль независимых экспертов в оценке систем искусственного интеллекта? Ответ: независимые эксперты проводят оценку передовых систем искусственного интеллекта, сотрудничая с OpenAI. Это помогает повысить безопасность, … Читать далее

Как оценки влияют на новую главу искусственного интеллекта в бизнесе.

Узнайте, как оценки помогают компаниям определять, измерять и улучшать производительность ИИ — снижая риски, повышая производительность и обеспечивая стратегическое преимущество. 1. Какие риски помогает снизить использование оценок в новой главе искусственного интеллекта в бизнесе? Ответ: использование оценок помогает компаниям снижать риски, связанные с внедрением ИИ, путём более точного определения и измерения производительности систем ИИ. Это … Читать далее

OpenAI и Target объединились для создания новых возможностей на базе искусственного интеллекта.

Компании OpenAI и Target начали сотрудничество, чтобы внедрить новое приложение Target в ChatGPT. Это позволит предлагать персонализированные покупки и ускорить процесс оформления заказов. Кроме того, Target расширит использование ChatGPT Enterprise для повышения производительности и улучшения качества обслуживания клиентов. #OpenAI #Target #ChatGPT #партнёрство 1. Какие возможности предоставит новое приложение Target в ChatGPT? Ответ:Новое приложение Target в … Читать далее

Новый ИИ-агент учится использовать САПР для создания 3D-объектов по эскизам

Компьютерное проектирование (САПР) — основной метод проектирования большинства современных физических продуктов. Инженеры используют САПР, чтобы превратить 2D-эскизы в 3D-модели, которые затем можно протестировать и доработать, прежде чем отправить окончательную версию на производственную линию. Однако программное обеспечение САПР славится своей сложностью: в нём тысячи команд на выбор. Чтобы в совершенстве овладеть программным обеспечением, требуется много времени … Читать далее

Как создать систему глубокого обучения с подкреплением, управляемую агентом, с поэтапным обучением, адаптивным исследованием и планированием на метауровне

Создание системы глубокого обучения с подкреплением, управляемой агентом В этом руководстве мы создадим продвинутую систему глубокого обучения с подкреплением, которая научит агента не только действовать в среде, но и выбирать собственные стратегии обучения. Мы разработаем Dueling Double DQN learner, представим учебный план с возрастающей сложностью и интегрируем несколько режимов исследования, которые адаптируются по мере обучения. … Читать далее

Google выпускает Gemini 3 Pro: новый шаг в развитии мультимодальных систем

Google представила семейство моделей Gemini 3, в центре которого находится Gemini 3 Pro. Эта модель позиционируется как значительный шаг к созданию более универсальных систем искусственного интеллекта. Как мы переходим от языковых моделей, которые только отвечают на запросы, к системам, способным рассуждать над контекстом в миллион токенов, понимать сигналы реального мира и действовать как агенты от … Читать далее

Конференция MIT Energy Initiative освещает приоритеты исследований в меняющемся энергетическом ландшафте

«Мы здесь, чтобы поговорить о действительно существенных изменениях, и мы хотим, чтобы вы стали участниками этого процесса», — сказала Дезире Плата, выдающийся профессор Школы инженерии MIT в области климата и энергетики на факультете гражданского строительства и экологической инженерии, на ежегодной исследовательской конференции MIT Energy Initiative (MITEI), которая прошла 9–10 сентября. Слова Платы нашли отклик у … Читать далее

Uni-MoE-2.0-Omni: открытая омнимодальная модель на основе Qwen2.5-7B для понимания текста, изображений, аудио и видео

Команда исследователей из Харбинского технологического института, Шэньчжэнь, представила Uni-MoE-2.0-Omni — полностью открытую омнимодальную большую модель, которая продвигает линейку Uni-MoE в сторону языково-ориентированных мультимодальных рассуждений. Система обучена с нуля на плотной основе Qwen2.5-7B и расширена до архитектуры Mixture of Experts с динамической маршрутизацией мощностей, прогрессивным обучением с учителем и подкреплением, а также примерно на 75 миллиардах … Читать далее

Uni-MoE-2.0-Omni: открытая универсальная модель для понимания текста, изображений, аудио и видео

Введение Команда исследователей из Харбинского технологического университета в Шэньчжэне представила Uni-MoE-2.0-Omni — полностью открытую омнимодальную большую модель, которая продвигает линейку Uni-MoE в сторону языково-центричного мультимодального анализа. Система обучена с нуля на плотном бэкбоне Qwen2.5-7B и расширена до архитектуры Mixture of Experts с динамической маршрутизацией мощностей, прогрессивным обучением с учителем и подкреплением, а также примерно на … Читать далее

Интуи́т и OpenAI объединяют усилия для создания новых возможностей на базе искусственного интеллекта

Компании Intuit и OpenAI начали многолетнее партнёрство на сумму более 100 миллионов долларов. В рамках сотрудничества планируется запуск приложений Intuit в ChatGPT и расширение использования передовых моделей OpenAI для создания персонализированных финансовых инструментов. 1. Какие возможности для пользователей могут появиться благодаря партнёрству Intuit и OpenAI? Благодаря партнёрству Intuit и OpenAI пользователи могут получить доступ к … Читать далее

Uni-MoE-2.0-Omni: открытая омнимодальная модель на основе Qwen2.5-7B для понимания текста, изображений, аудио и видео

Введение Команда исследователей из Харбинского технологического института, Шэньчжэнь, представила Uni-MoE-2.0-Omni — полностью открытую омнимодальную большую модель, которая продвигает линейку Uni-MoE в сторону языково-центричного мультимодального рассуждения. Система обучена с нуля на плотной основе Qwen2.5-7B и расширена до архитектуры Mixture of Experts с динамической маршрутизацией мощностей, прогрессивным обучением под наблюдением и подкреплением, а также примерно на 75 … Читать далее