Создание безопасной и наблюдаемой инфраструктуры искусственного интеллекта для 1 миллиона классов.

Узнайте, как SchoolAI, основанная на технологиях OpenAI GPT-4.1, генерации изображений и TTS, обеспечивает работу безопасных инструментов искусственного интеллекта под руководством учителей в 1 миллионе классов по всему миру, повышая вовлечённость, контроль и персонализацию обучения. 1. Какие технологии лежат в основе SchoolAI и как они способствуют созданию безопасной инфраструктуры искусственного интеллекта в образовании? Ответ: SchoolAI основана … Читать далее

OpenAI и NVIDIA объявили о стратегическом партнёрстве по развёртыванию дата-центров с искусственным интеллектом, оснащённых системами NVIDIA, мощностью в 10 гигаватт. Первый этап стартует в 2026 году.

NVIDIA systems — системы на базе технологий NVIDIA. 10 gigawatts — 10 гигаватт. 1. Какие компании объявили о стратегическом партнёрстве в сфере дата-центров с искусственным интеллектом?Ответ: OpenAI и NVIDIA. 2. Какова мощность дата-центров, которые планируется развернуть в рамках партнёрства?Ответ: 10 гигаватт. 3. Когда планируется начать первый этап проекта?Ответ: в 2026 году. 4. На базе технологий … Читать далее

Команда Alibaba Qwen выпустила сборки FP8 для Qwen3-Next-80B-A3B (Instruct & Thinking)

Команда Alibaba Qwen выпустила сборки FP8 для своих новых моделей Qwen3-Next-80B-A3B в двух вариантах после обучения — Instruct и Thinking. Они предназначены для высокопроизводительного логического вывода с ультрадлинным контекстом и эффективностью MoE. Что в стеке A3B? Qwen3-Next-80B-A3B — это гибридная архитектура, сочетающая Gated DeltaNet (заменитель внимания в стиле linear/conv) с Gated Attention, перемежающаяся ультраразреженной смесью … Читать далее

Новый инструмент повышает вероятность создания прорывных материалов с помощью генеративных моделей ИИ

Модели искусственного интеллекта, преобразующие текст в изображения, также полезны для генерации новых материалов. За последние несколько лет генеративные модели материалов от таких компаний, как Google, Microsoft и Meta, использовали свои обучающие данные, чтобы помочь исследователям разработать десятки миллионов новых материалов. Однако когда дело доходит до создания материалов с экзотическими квантовыми свойствами, такими как сверхпроводимость или … Читать далее

Топ-15 серверов Model Context Protocol (MCP) для фронтенд-разработчиков (2025)

Model Context Protocol (MCP) стал «USB-C» для интеграций агентов и инструментов, предоставляя фронтенд-командам стандартный способ подключения спецификаций дизайна, репозиториев/запросов на включение (PR), целей развёртывания, мониторинга и управления работой в их редакторах и CI без необходимости создания специальных адаптеров. В этом списке представлены готовые к использованию удалённые серверы MCP (с поддержкой OAuth), которые легко встраиваются в … Читать далее

Исследователи из MIT улучшили планирование в искусственном интеллекте в 64 раза, достигнув точности в 94%

Можно ли заставить языковую модель с 8 миллиардами параметров создавать доказательно верные многошаговые планы, а не просто правдоподобные предположения? Исследователи из MIT CSAIL представили PDDL-INSTRUCT — систему настройки инструкций, которая сочетает логическую цепочку рассуждений с внешней проверкой планов (VAL) для повышения эффективности символьного планирования в языковых моделях. На PlanBench настроенная модель Llama-3-8B достигает 94% валидных … Читать далее

Как предприниматели MIT используют искусственный интеллект?

Центр предпринимательства Martin Trust при Массачусетском технологическом институте (MIT) стремится научить студентов предпринимательскому мастерству. За последние несколько лет ни одна технология не изменила это ремесло так сильно, как искусственный интеллект (ИИ). Многие предсказывают быструю и полную трансформацию процесса создания стартапов, однако руководители Центра придерживаются более взвешенного взгляда. «Основы предпринимательства не изменились с появлением ИИ, — … Читать далее

Понимание универсального протокола вызова инструментов (UTCP)

Универсальный протокол вызова инструментов (UTCP) — это лёгкий, безопасный и масштабируемый способ для агентов искусственного интеллекта (ИИ) и приложений находить инструменты и вызывать их напрямую, без необходимости в дополнительных оболочках-серверах. Ключевые особенности * Лёгкость и безопасность — позволяет получать доступ к инструментам напрямую, избегая ненужных промежуточных слоёв.* Масштабируемость — может поддерживать большое количество инструментов и … Читать далее

Meta предлагает «метакогнитивное повторное использование»: превращение цепочек мыслей LLM в процедурный справочник, который сокращает токены на 46%

Исследователи Meta представили метод, который сжимает повторяющиеся шаблоны рассуждений в короткие именованные процедуры — «поведения» — и затем обучает модели использовать их при выводе или дистиллирует их посредством тонкой настройки. Результат:* сокращение количества токенов для рассуждений на MATH до 46% при сохранении или повышении точности;* повышение точности на 10% в условиях самосовершенствования на AIME без … Читать далее

Исследователи IBM и ETH Zürich представили аналоговые базовые модели для борьбы с шумом в аппаратных средствах искусственного интеллекта, размещаемых в памяти

Исследователи IBM совместно с учёными из ETH Zürich представили новый класс аналоговых базовых моделей (AFMs), призванных преодолеть разрыв между большими языковыми моделями (LLMs) и аппаратными средствами аналоговых вычислений в памяти (AIMC). Что такое аналоговые вычисления для LLMs? Технология AIMC обещает радикальный скачок в эффективности: запуск моделей с миллиардом параметров на устройствах, достаточно компактных для встраивания … Читать далее

Создание гибридной системы на основе правил и машинного обучения для обнаружения и защиты от попыток взлома в системах больших языковых моделей

В этом руководстве мы пошагово создаём систему защиты от взлома, которая позволяет обнаруживать и безопасно обрабатывать запросы, направленные на обход политик. Мы генерируем реалистичные примеры атак и доброкачественные примеры, создаём сигналы на основе правил и объединяем их с функциями TF-IDF в компактный интерпретируемый классификатор, чтобы ловить обходные запросы, не блокируя при этом легитимные запросы. Этапы … Читать далее

Где заканчиваются сигналы LLM-как-судьи, когда они удерживаются, и что должно означать «оценка»?

Что именно измеряется, когда LLM-как-судья присваивает оценку от 1 до 5 (или парные оценки)? Большинство рубрик «корректности/достоверности/полноты» зависят от конкретного проекта. Без определения, основанного на задаче, скалярная оценка может отклоняться от бизнес-результатов (например, «полезный маркетинговый пост» против «высокая полнота»). Опросы LLM-как-судьи (LAJ) отмечают, что неоднозначность рубрик и выбор шаблонов подсказок существенно влияют на оценки и … Читать далее

Интернет агентов искусственного интеллекта? Coral Protocol представляет Coral v1: нативная среда выполнения и реестр для агентов ИИ на базе MCP

Coral Protocol выпустил версию Coral v1 своего стека агентов, стремясь стандартизировать способы обнаружения, компоновки и управления агентами ИИ в разных средах. Основные компоненты релиза:* Coral Server (среда выполнения) на базе Model Context Protocol (MCP), которая позволяет агентам регистрироваться, создавать потоки, отправлять сообщения и упоминать других агентов. Это обеспечивает структурированную координацию между агентами вместо хрупкого сращивания … Читать далее

Руководство по программированию для сквозного обучения робототехнике с помощью LeRobot: обучение, оценка и визуализация политик клонирования поведения на PushT

В этом руководстве мы шаг за шагом рассмотрим использование библиотеки LeRobot от Hugging Face для обучения и оценки политики клонирования поведения на наборе данных PushT. Настройка среды 1. Установка необходимых зависимостей: «` !pip -q install —upgrade lerobot torch torchvision timm imageio[ffmpeg] «` 2. Импорт модулей: «` import os, math, random, io, sys, json, pathlib, time … Читать далее

xAI запускает Grok-4-Fast: унифицированная модель для логических и нелогических задач с контекстом в 2 миллиона токенов

Компания xAI представила Grok-4-Fast — оптимизированный по стоимости преемник Grok-4, который объединяет «логическое» и «нелогическое» поведение в едином наборе весовых коэффициентов, управляемом через системные подсказки. Модель предназначена для высокопроизводительного поиска, кодирования и ответов на вопросы. Особенности модели Контекст: модель имеет окно контекста в 2 миллиона токенов. Обучение: Grok-4-Fast обучен сквозным методом с использованием инструментального обучения … Читать далее

Xiaomi выпустила модель языка речи MiMo-Audio на 7 миллиардов параметров

Команда Xiaomi MiMo выпустила MiMo-Audio — модель языка речи на 7 миллиардов параметров, которая использует единую цель следующего токена для перемежающегося текста и дискретизированной речи, масштабируя предварительное обучение более чем на 100 миллионов часов аудио. Что нового? MiMo-Audio использует специальный токенизатор RVQ (остаточное векторное квантование), который нацелен на семантическую точность и высокое качество реконструкции. Вместо … Читать далее

Запуск кода в стиле MATLAB внутри Python с помощью подключения Octave через библиотеку oct2py

В этом руководстве мы рассмотрим, как можно без проблем запускать код в стиле MATLAB внутри Python, подключив Octave через библиотеку oct2py. Мы настроим среду в Google Colab, обменяемся данными между NumPy и Octave, напишем и вызовем файлы с расширением .m, визуализируем графики, созданные в Octave, внутри Python и даже поработаем с инструментальными панелями, структурами и … Читать далее

Google разрабатывает новый подход к помощи в дополненной реальности (AR)

Sensible Agent — это исследовательская платформа и прототип искусственного интеллекта от Google, который выбирает как действие, которое должен выполнить агент в дополненной реальности (AR), так и способ взаимодействия для его выполнения, основываясь на мультимодальном контексте в реальном времени (например, заняты ли руки, есть ли фоновый шум, социальная обстановка). Вместо того чтобы рассматривать «что предложить» и … Читать далее

Лучшие блоги и новостные сайты по компьютерному зрению (2025)

В 2025 году компьютерное зрение развивалось стремительно: появились новые мультимодальные архитектуры, крупные открытые датасеты и более тесная интеграция моделей с системами. Практикам нужны источники, которые публикуют серьёзные исследования, связывают код и бенчмарки, отслеживают модели внедрения — а не просто маркетинговые посты. В этом списке отдаётся приоритет основным исследовательским хабам, лабораторным блогам и инженерным изданиям, ориентированным … Читать далее

Qwen3-ASR-Toolkit: продвинутый Python-инструмент с открытым исходным кодом для работы с API Qwen-ASR за пределами ограничений в 3 минуты и 10 МБ

Qwen выпустила Qwen3-ASR-Toolkit — это Python CLI с лицензией MIT, который программно обходит ограничение Qwen3-ASR-Flash API в 3 минуты и 10 МБ на запрос. Для этого используются сегментация с учётом голосовой активности (VAD), параллельные вызовы API и автоматическая передискретизация/нормализация формата с помощью FFmpeg. Что добавляет инструментарий поверх API * Обработка длинных аудио. Инструментарий разделяет входные … Читать далее

Что ждёт генеративный ИИ в будущем?

Когда в 2022 году компания OpenAI представила миру ChatGPT, генеративный искусственный интеллект стал широко обсуждаемой темой и запустил цепную реакцию, которая привела к его быстрой интеграции в промышленность, научные исследования, здравоохранение и повседневную жизнь людей, использующих эту технологию. Что ждёт этот мощный, но несовершенный инструмент дальше? С этим вопросом в голове сотни исследователей, бизнес-лидеров, преподавателей … Читать далее

Физический искусственный интеллект: объединение робототехники, материаловедения и искусственного интеллекта для создания воплощённых систем нового поколения

Что мы подразумеваем под «Физическим ИИ»? Искусственный интеллект в робототехнике — это не только умные алгоритмы. Роботы работают в физическом мире, и их интеллект возникает из совместного проектирования тела и мозга. Физический ИИ описывает эту интеграцию, где материалы, приведение в движение, восприятие и вычисления определяют, как функционируют политики обучения. Термин был представлен в журнале Nature … Читать далее

Компилятор для ИИ-чипов, который автоматически генерирует быстрые и эффективные пространственные ускорители

Исследователи из лаборатории Han в MIT представили LEGO — фреймворк, похожий на компилятор, который обрабатывает тензорные рабочие нагрузки (например, GEMM, Conv2D, внимание, MTTKRP) и автоматически генерирует синтезируемый RTL для пространственных ускорителей — без использования шаблонов. Как работает «Компилятор для ИИ-чипов» — шаг за шагом 1. Deconstruct (Affine IR). Операцию с тензором записывают в виде вложенных … Читать далее

Внедрение агентов искусственного интеллекта в любой пользовательский интерфейс: протокол AG-UI для структурированных потоков данных в режиме реального времени

Агенты искусственного интеллекта уже не просто чат-боты, которые выдают ответы. Они развиваются в сложные системы, способные рассуждать шаг за шагом, вызывать API, обновлять информационные панели и взаимодействовать с людьми в режиме реального времени. Но возникает ключевой вопрос: как агенты должны взаимодействовать с пользовательскими интерфейсами? Что такое протокол AG-UI? AG-UI (Agent–User Interaction) — это протокол потоковой … Читать далее

H Company выпускает Holo1.5: семейство открытых моделей для работы с интерфейсами

H Company (французский стартап в сфере искусственного интеллекта) выпустила Holo1.5 — семейство открытых базовых моделей для работы с компьютерами. Они предназначены для агентов, которые взаимодействуют с реальными пользовательскими интерфейсами через скриншоты и действия с помощью указателя или клавиатуры. Основные характеристики: В релизе представлены контрольные точки на 3B, 7B и 72B с заявленным приростом точности примерно … Читать далее

Alibaba выпускает Tongyi DeepResearch: агентскую языковую модель с 30 миллиардами параметров для долгосрочных исследований

Alibaba представила Tongyi DeepResearch-30B-A3B — агентскую языковую модель с открытым исходным кодом, созданную для глубокого поиска информации с помощью веб-инструментов. Основные характеристики Tongyi DeepResearch-30B-A3B * Архитектура и профиль вывода: модель использует архитектуру mixture-of-experts (MoE) с общим количеством параметров около 30,5 миллиарда и примерно 3–3,3 миллиарда активных параметров на токен. Это обеспечивает высокую производительность при сохранении … Читать далее

IBM выпустила модель искусственного интеллекта для работы с документами Granite-Docling-258M

IBM представила модель Granite-Docling-258M — это модель искусственного интеллекта для работы с документами с открытым исходным кодом (Apache-2.0), предназначенная для комплексного преобразования документов. Модель ориентирована на точное извлечение структуры — таблиц, кода, уравнений, списков, подписей и порядка чтения — и выдаёт структурированное, машиночитаемое представление, а не Markdown с потерями. Она доступна на Hugging Face с … Читать далее

Исследователи Meta AI выпустили MapAnything: архитектура трансформера для прямой регрессии метрической геометрии 3D-сцен

Группа исследователей из Meta Reality Labs и Университета Карнеги-Меллона представила MapAnything — архитектуру трансформера, которая напрямую выполняет регрессию факторизованной метрической геометрии 3D-сцен по изображениям и дополнительным входным данным с датчиков. Почему универсальная модель для 3D-реконструкции? Реконструкция 3D по изображениям исторически основывалась на фрагментированных конвейерах: обнаружение объектов, оценка позы по двум видам, корректировка связок, мультивидовая стереоскопия … Читать далее

Обнаружение и снижение схемного поведения в моделях ИИ

Исследователи из Apollo Research и OpenAI разработали методы оценки скрытого несоответствия («схемного поведения») и обнаружили признаки такого поведения в контролируемых тестах передовых моделей. Команда поделилась конкретными примерами и стресс-тестами раннего метода снижения схемного поведения. #Detecting and reducing scheming in AI models. 1. Какие методы использовали исследователи для оценки схемного поведения моделей ИИ? Исследователи из Apollo … Читать далее

Создание продвинутого голосового ИИ-агента с помощью Hugging Face Pipelines

В этом руководстве мы создадим продвинутого голосового ИИ-агента, используя свободно доступные модели Hugging Face. Мы сделаем так, чтобы весь процесс был достаточно простым для бесперебойной работы в Google Colab. Мы объединим:* Whisper для распознавания речи;* FLAN-T5 для рассуждений на естественном языке;* Bark для синтеза речи. Всё это будет соединено через пайплайны трансформеров. Это позволит избежать … Читать далее