Старшекурсница MIT получила стипендию Churchill Scholarship

Студентка последнего курса MIT Кэти Спиваковская была выбрана стипендиатом Churchill Scholar на 2026–2027 годы. Она будет учиться в магистратуре по биологической науке в Институте Велкома Сангера при Кембриджском университете в Великобритании этой осенью. О Кэти Спиваковской Кэти Спиваковская изучает биоинженерию и искусственный интеллект, а также математику и биологию. Она стремится интегрировать вычисления и биоинженерию в … Читать далее

Команда Qwen выпускает Qwen3-Coder-Next: языковую модель открытого веса, разработанную специально для программных агентов и локальной разработки

Команда Qwen выпустила Qwen3-Coder-Next — языковую модель открытого веса, разработанную специально для программных агентов и локальной разработки. Она основана на Qwen3-Next-80B-A3B. Модель использует разреженную архитектуру Mixture-of-Experts (MoE) с гибридным вниманием. Она имеет 80 миллиардов параметров в общей сложности, но только 3 миллиарда параметров активируются на токен. Цель — соответствовать производительности гораздо более крупных активных моделей, … Читать далее

Философия ленты Sora.

Ознакомьтесь с философией ленты Sora — она создана, чтобы вдохновлять на творчество, способствовать установлению связей и обеспечивать безопасность впечатлений с помощью персонализированных рекомендаций, родительского контроля и надёжных ограничений. 1. Какие основные цели стоят за созданием ленты Sora? Ответ: Лента Sora создана с целью вдохновлять на творчество, способствовать установлению связей между людьми и обеспечивать безопасность впечатлений. … Читать далее

SMART запускает новую исследовательскую группу «Wearable Imaging for Transforming Elderly Care»

Что, если ультразвуковая визуализация больше не будет ограничена больницами? Пациенты с хроническими заболеваниями, такими как гипертония и сердечная недостаточность, смогут постоянно находиться под наблюдением в режиме реального времени дома или в движении. Это даст медицинским работникам возможность получать непрерывную клиническую информацию вместо эпизодических проверок — сканирования здесь и осмотра там. Переход от реактивной, стационарной помощи … Читать далее

Как создать многоуровневые фильтры безопасности для защиты больших языковых моделей от адаптивных, перефразированных и злонамеренных запросов

В этом руководстве мы создаём надёжный многоуровневый фильтр безопасности, предназначенный для защиты больших языковых моделей (LLM) от адаптивных и перефразированных атак. Мы объединяем семантический анализ сходства, обнаружение закономерностей на основе правил, классификацию намерений с помощью LLM и обнаружение аномалий, чтобы создать систему защиты, не зависящую от единой точки отказа. Также мы демонстрируем, как можно разработать … Читать далее

Google выпускает Conductor: расширение для Gemini CLI, управляемое контекстом

Google представил Conductor — предварительный просмотр расширения с открытым исходным кодом для Gemini CLI, которое превращает генерацию кода с помощью ИИ в структурированный рабочий процесс, управляемый контекстом. Основные возможности Conductor:* Хранит знания о продукте, технические решения и планы работы в виде Markdown внутри репозитория.* Управляет агентами Gemini на основе этих файлов, а не специальных чатов. … Читать далее

Статистическая стоимость дополнения нулями в свёрточных нейронных сетях (CNN)

Что такое дополнение нулями? Дополнение нулями — это метод, используемый в свёрточных нейронных сетях, при котором вокруг границ изображения добавляются дополнительные пиксели со значением ноль. Это позволяет свёрточным ядрам проходить по краевым пикселям и контролировать степень сжатия пространственных размеров карты признаков после свёртки. Дополнение обычно используется для сохранения размера карты признаков и обеспечения возможности создания … Читать далее

Snowflake и OpenAI стали партнёрами, чтобы внедрить передовые интеллектуальные технологии в корпоративные данные.

Компании заключили соглашение на сумму 200 миллионов долларов, чтобы интегрировать возможности искусственного интеллекта и получить доступ к аналитике непосредственно в Snowflake. 1. Какие преимущества может получить компания, использующая Snowflake и OpenAI для работы с корпоративными данными? Ответ: интеграция возможностей искусственного интеллекта и доступ к аналитике непосредственно в Snowflake позволяют компаниям использовать передовые интеллектуальные технологии для … Читать далее

Как генеративный искусственный интеллект помогает учёным синтезировать сложные материалы

Модели генеративного искусственного интеллекта используются для создания обширных библиотек теоретических материалов, которые могут помочь решить самые разные задачи. Теперь учёным нужно только понять, как их использовать. Синтез материалов: не всё так просто Во многих случаях синтез материалов — это не просто следование рецепту на кухне. Такие факторы, как температура и продолжительность обработки, могут сильно влиять … Читать далее

NVIDIA представляет Nemotron-Nano-3-30B-A3B-NVFP4

Компания NVIDIA выпустила модель Nemotron-Nano-3-30B-A3B-NVFP4 — производственную контрольную точку, которая запускает модель рассуждений с 30 миллиардами параметров в формате 4-битного NVFP4, сохраняя при этом точность, близкую к базовому уровню BF16. Что такое Nemotron-Nano-3-30B-A3B-NVFP4? Это квантованная версия модели Nemotron-3-Nano-30B-A3B-BF16, обученная с нуля командой NVIDIA как единая модель для рассуждений и чата. Она построена как гибридная сеть … Читать далее

Как создать ИИ-агентов с памятью: краткосрочная, долгосрочная и эпизодическая память

В этом руководстве мы создаём слой управления памятью для ИИ-агента, который отделяет краткосрочный рабочий контекст от долгосрочной векторной памяти и эпизодических следов. Основные этапы 1. Реализация семантического хранения с помощью встраиваний и FAISS для быстрого поиска по сходству.2. Добавление эпизодической памяти, которая фиксирует, что работало, что не удалось и почему, чтобы агент мог повторно использовать … Читать далее

Кодирование и экспериментальный анализ децентрализованного федеративного обучения с помощью протоколов обмена информацией и дифференциальной приватности

В этом руководстве мы исследуем поведение федеративного обучения, когда традиционный централизованный сервер агрегации удалён и заменён полностью децентрализованным механизмом обмена информацией между равными участниками (peer-to-peer gossip mechanism). Мы реализуем как централизованный FedAvg, так и децентрализованный Gossip Federated Learning с нуля и внедряем дифференциальную приватность на стороне клиента, добавляя калиброванный шум в локальные обновления моделей. Этапы … Читать далее

LingBot World: модель реального мира для интерактивного моделирования и воплощённого ИИ от Robbyant Open Sources

Описание Robbyant, подразделение Ant Group, занимающееся разработкой воплощённого ИИ, выпустило в открытый доступ LingBot World — крупномасштабную модель мира, которая превращает генерацию видео в интерактивный симулятор для воплощённых агентов, автономного вождения и игр. Система предназначена для визуализации управляемой среды с высокой визуальной точностью, сильной динамикой и долгосрочными временными горизонтами, при этом оставаясь достаточно быстрой для … Читать далее

ИИ-институт Allen выпустил SERA — агентов для кодирования с мягкой верификацией

Исследователи из Allen Institute for AI (AI2) представили SERA — семейство агентов для кодирования, которые соответствуют более крупным закрытым системам, используя только обучение с учителем и синтетические траектории. Что такое SERA? SERA — это первый выпуск в серии Open Coding Agents от AI2. Флагманская модель SERA-32B построена на архитектуре Qwen 3 32B и обучена как … Читать далее

Философская головоломка рационального искусственного интеллекта

Насколько система искусственного интеллекта может быть рациональной? Новый курс Массачусетского технологического института (MIT) под названием «6.S044/24.S00: Искусственный интеллект и рациональность» не ставит перед собой цель ответить на этот вопрос. Вместо этого он предлагает студентам исследовать эту и другие философские проблемы через призму исследований в области искусственного интеллекта. Для следующего поколения учёных понятия рациональности и агентности … Читать далее

Реализация кодирования для обучения, оптимизации, оценки и интерпретации вложений в граф знаний с помощью PyKEEN

В этом руководстве мы подробно рассмотрим продвинутый рабочий процесс для вложений в граф знаний с использованием PyKEEN. Мы изучим, как на практике обучаются, оцениваются, оптимизируются и интерпретируются современные модели вложений. Шаг 1: знакомство с набором данных Сначала мы разберёмся в структуре реального набора данных графа знаний, а затем систематически обучим и сравним несколько моделей вложений, … Читать далее

Microsoft представляет Maia 200 — оптимизированный ускоритель логического вывода для центров обработки данных Azure

Maia 200 — это новый внутренний ускоритель искусственного интеллекта от Microsoft, разработанный для логического вывода в центрах обработки данных Azure. Он направлен на снижение стоимости генерации токенов для больших языковых моделей и других рабочих нагрузок, связанных с логическими операциями, путём объединения вычислений с узкой точностью, плотной иерархии памяти на чипе и масштабируемой сети на базе … Читать далее

DeepSeek AI выпускает DeepSeek-OCR 2 с использованием Causal Visual Flow Encoder для понимания структуры документов

Компания DeepSeek AI выпустила систему оптического распознавания символов (OCR) и понимания документов с открытым исходным кодом — DeepSeek-OCR 2. Эта система реструктурирует свой визуальный энкодер так, чтобы считывать страницы в причинно-следственном порядке, более близком к тому, как люди просматривают сложные документы. Ключевой компонент — DeepEncoder V2 DeepEncoder V2 — это языковая модель в стиле трансформатора, … Читать далее

Углублённый анализ кодирования: дифференцируемое компьютерное зрение с Kornia, используя оптимизацию геометрии, LoFTR-совмещение и дополнения на GPU

Мы реализуем продвинутый, комплексный урок по Kornia и демонстрируем, как можно построить современное, дифференцируемое компьютерное зрение полностью в PyTorch. Шаг 1: синхронизированные дополнения Сначала мы создаём синхронизированные конвейеры дополнений для изображений, масок и ключевых точек на GPU, затем переходим к дифференцируемой геометрии, оптимизируя гомографию напрямую через градиентный спуск. Мы также показываем, как изученное сопоставление признаков … Читать далее

Ant Group выпускает модель LingBot-VLA — базовую модель для обработки языковых и визуальных данных для манипулирования роботами в реальном мире

Как создать единую модель обработки языковых и визуальных данных, которая сможет управлять множеством различных роботов с двумя манипуляторами в реальном мире? LingBot-VLA — это новая базовая модель Ant Group Robbyant для обработки языковых и визуальных данных, ориентированная на практическое манипулирование роботами в реальном мире. LingBot-VLA обучен на примерно 20 000 часах данных телеуправления двуручными системами, … Читать далее

Внутреннее устройство агента данных OpenAI.

Как OpenAI создала внутреннего агента данных, который использует GPT-5, Codex и память для работы с огромными массивами данных и получения надёжных инсайтов за считанные минуты. 1. Какие технологии лежат в основе внутреннего агента данных OpenAI? Ответ: в основе внутреннего агента данных OpenAI лежат технологии GPT-5, Codex и возможность работы с памятью для обработки больших объёмов … Читать далее

За пределами чата: генеративный пользовательский интерфейс, AG-UI и стек, стоящий за интерфейсами, управляемыми агентами

Большинство приложений с искусственным интеллектом (ИИ) по-прежнему представляют модель в виде чата. Такой интерфейс прост, но скрывает, что на самом деле делают агенты, например, планируют шаги, вызывают инструменты и обновляют состояние. Генеративный пользовательский интерфейс (Generative UI) — это возможность позволить агенту управлять реальными элементами интерфейса, такими как таблицы, диаграммы, формы и индикаторы прогресса, чтобы взаимодействие … Читать далее

Google DeepMind представляет AlphaGenome: унифицированная модель последовательности-функции с использованием гибридных трансформеров и U-Nets для расшифровки генома человека

Google DeepMind расширяет свой биологический инструментарий за пределы мира фолдинга белков. После успеха AlphaFold исследовательская группа Google представила AlphaGenome. Это унифицированная модель глубокого обучения, разработанная для геномных исследований последовательности-функции. Это представляет собой серьёзный сдвиг в том, как мы моделируем геном человека. AlphaGenome не рассматривает ДНК как простой текст. Вместо этого она обрабатывает окна необработанной ДНК … Читать далее

Alibaba представляет модель Qwen3-Max-Thinking для рассуждений с масштабированием времени тестирования и использованием встроенных инструментов

Qwen3-Max-Thinking — это новая флагманская модель рассуждений от Alibaba. Она не только масштабирует параметры, но и изменяет подход к проведению логических выводов, обеспечивая явный контроль над глубиной мышления и встроенные инструменты для поиска, памяти и выполнения кода. Основные характеристики модели Qwen3-Max-Thinking — это модель с триллионом параметров, предварительно обученная на 36 триллионах токенов и входящая … Читать далее

Как спроектировать самонастраивающиеся системы управления с участием двух агентов на основе Конституционного ИИ для безопасных и соответствующих требованиям финансовых операций

В этом руководстве мы реализуем систему управления с участием двух агентов, которая применяет принципы Конституционного ИИ в финансовых операциях. Мы демонстрируем, как разделяем выполнение задач и надзор, объединяя агента-исполнителя (Worker Agent), который выполняет финансовые действия, с агентом-аудитором (Auditor Agent), который обеспечивает соблюдение политик, безопасность и соответствие требованиям. Основные компоненты системы 1. Worker Agent — выполняет … Читать далее

Университет Mohamed bin Zayed в области искусственного интеллекта выпускает K2 Think V2: полностью автономную модель рассуждений на 70 миллиардов параметров для математики, кода и науки

Исследователи из Университета Mohamed bin Zayed в области искусственного интеллекта (MBZUAI) выпустили K2 Think V2 — полностью автономную модель рассуждений, разработанную для проверки возможностей открытых и полностью документированных систем в области долгосрочных рассуждений по математике, коду и науке. Особенности модели K2 Think V2 K2 Think V2 берёт за основу модель K2 V2 Instruct с 70 … Читать далее

Грант EMEA Youth & Wellbeing

Новая глава искусственного интеллекта в ЕС Подайте заявку на грант EMEA Youth & Wellbeing — программу с финансированием в размере €500 000, которая поддерживает НПО и исследователей, работающих над повышением безопасности молодёжи и улучшением её благополучия в эпоху искусственного интеллекта. OpenAI представляет Экономический план для ЕС 2.0 с новыми данными, партнёрствами и инициативами для ускорения … Читать далее

Tencent Hunyuan выпускает HPC-Ops: библиотеку операторов для высокопроизводительного логического вывода больших языковых моделей

Компания Tencent Hunyuan открыла исходный код HPC-Ops — библиотеки операторов производственного уровня для устройств с архитектурой больших языковых моделей (LLM). Особенности HPC-Ops HPC-Ops фокусируется на низкоуровневых ядрах CUDA для основных операторов, таких как Attention, Grouped GEMM и Fused MoE, и предоставляет к ним доступ через компактный C и Python API для интеграции в существующие стеки … Читать далее

Moonshot AI выпускает Kimi K2.5: модель визуального агентского интеллекта с открытым исходным кодом и встроенной реализацией роевого выполнения

Компания Moonshot AI выпустила модель визуального агентского интеллекта с открытым исходным кодом — Kimi K2.5. Она объединяет в себе:* языковую основу Large Mixture of Experts;* собственный энкодер для обработки изображений;* параллельную мультиагентную систему под названием Agent Swarm. Модель ориентирована на кодирование, мультимодальные рассуждения и исследования в глубоком интернете, демонстрируя высокие результаты по соответствующим наборам тестов. … Читать далее

DSGym предлагает субстрат на основе контейнеров для создания и тестирования агентов в области обработки данных

DSGym — это фреймворк, разработанный исследователями из Стэнфордского университета, Together AI, Дьюкского университета и Гарвардского университета. Он предназначен для оценки и обучения агентов в области обработки данных более чем на 1 тыс. задачах. Почему существующие тесты не соответствуют требованиям? Исследовательская группа провела анализ существующих тестов, которые утверждают, что проверяют агентов, работающих с данными. Когда файлы … Читать далее