Серия интервью с AI #4: объясните, что такое KV-кэширование

Вопрос:Вы внедряете большую языковую модель в производственную среду. Генерация первых нескольких токенов происходит быстро, но по мере увеличения последовательности генерация каждого дополнительного токена занимает всё больше времени, даже если архитектура модели и аппаратные средства остаются прежними. Если вычисления не являются основным узким местом, то какая неэффективность вызывает такое замедление, и как можно перепроектировать процесс логического … Читать далее

NVIDIA выпускает Nemotron 3: гибридный стек MoE на основе Mamba Transformer для агентского ИИ с длинным контекстом

Компания NVIDIA выпустила семейство открытых моделей Nemotron 3 в рамках полноценного стека для агентского ИИ. В комплект входят веса моделей, наборы данных и инструменты для обучения с подкреплением. Семейство моделей и целевые рабочие нагрузки Семейство Nemotron 3 предназначено для эффективных агентских приложений. Линейка состоит из моделей Nano, Super и Ultra, каждая из которых настроена под … Читать далее

Руководство по программированию для создания полного агентского рабочего процесса в Gemini для автоматизированного сбора медицинских доказательств и подачи заявки на предварительное разрешение

В этом руководстве мы рассмотрим, как создать полностью функциональный агентский рабочий процесс для сбора медицинских доказательств и подачи заявки на предварительное разрешение с использованием модели Gemini. Мы подробно разберём каждый компонент, от настройки модели до создания внешних инструментов и построения цикла работы интеллектуального агента. Настройка окружения 1. Импорт библиотек: «`python import google.generativeai as genai from … Читать далее

Mistral AI выпустила модель оптического распознавания символов Mistral OCR 3

Компания Mistral AI представила свою новейшую модель оптического распознавания символов (OCR) — Mistral OCR 3. Эта модель является частью стека Document AI компании и предназначена для извлечения текста и изображений из PDF-файлов и других документов с сохранением структуры. Основные характеристики Mistral OCR 3: * Оптимизация: модель настроена для работы с формами, отсканированными документами, сложными таблицами … Читать далее

Как создать высокопроизводительную систему маршрутизации распределённых задач с помощью Kombu с Topic Exchanges и Concurrent Workers

В этом руководстве мы создадим полнофункциональную систему событийно-ориентированного рабочего процесса с помощью Kombu, рассматривая обмен сообщениями как ключевую архитектурную возможность. Мы пошагово настроим обмены, ключи маршрутизации, фоновых рабочих и одновременных производителей, что позволит нам наблюдать за реальной распределённой системой. Установка и настройка 1. Установка Kombu: «` !pip install kombu «` 2. Импорт зависимостей и настройка … Читать далее

Google представляет T5Gemma 2: модели кодировщика-декодера с мультимодальными входами через SigLIP и контекстом до 128K

Компания Google выпустила T5Gemma 2 — семейство открытых моделей Transformer с архитектурой кодировщик-декодер, созданных путём адаптации предварительно обученных весов Gemma 3 к структуре кодировщик-декодер и последующего продолжения предварительного обучения с целью UL2. Что представляет собой T5Gemma 2? T5Gemma 2 позиционируется как аналог Gemma 3 для кодировщика-декодера, сохраняющий те же базовые блоки низкого уровня, но с … Читать далее

Полный рабочий процесс для оптимизации автоматизированных запросов с помощью Gemini Flash, Few-Shot Selection и Evolutionary Instruction Search

В этом руководстве мы переходим от традиционного создания запросов к более систематизированному, программируемому подходу, рассматривая запросы как настраиваемые параметры, а не как статический текст. Вместо того чтобы угадывать, какая инструкция или пример работают лучше всего, мы создаём цикл оптимизации вокруг Gemini 2.0 Flash, который экспериментирует, оценивает и автоматически выбирает наиболее эффективную конфигурацию запроса. Настройка Gemini … Читать далее

Unsloth AI и NVIDIA революционизируют локальную настройку небольших языковых моделей: от настольных компьютеров RTX до DGX Spark

Настраивайте популярные модели искусственного интеллекта быстрее с помощью Unsloth на ПК NVIDIA RTX AI, таких как настольные компьютеры и ноутбуки GeForce RTX, рабочие станции RTX PRO и новый DGX Spark, чтобы создавать персонализированных помощников для кодирования, творческой работы и сложных агентских рабочих процессов. Новый ландшафт современного ИИ Мы отходим от полной зависимости от массивных обобщённых … Читать далее

Оценка отслеживаемости цепочки рассуждений

Компания OpenAI представила новую систему и набор инструментов для оценки отслеживаемости цепочки рассуждений. Она охватывает 13 параметров в 24 средах. Наши исследования показывают, что отслеживание внутренних рассуждений модели гораздо эффективнее, чем мониторинг только её выходных данных. Это открывает многообещающие перспективы для масштабируемого контроля по мере развития возможностей систем искусственного интеллекта. 1. Какие преимущества даёт отслеживание … Читать далее

Обучение с помощью направляющих помогает «необучаемым» нейронным сетям раскрыть свой потенциал

Даже те нейронные сети, которые долгое время считались «необучаемыми», могут эффективно обучаться с небольшой помощью. Исследователи из Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института (CSAIL) показали, что краткий период согласования между нейронными сетями — метод, который они называют направляющим, — может значительно улучшить производительность архитектур, ранее считавшихся непригодными для современных задач. Их выводы … Читать далее

Ресурсы для повышения AI-грамотности подростков и их родителей

Компания OpenAI поделилась новыми ресурсами для повышения AI-грамотности, которые помогут подросткам и родителям осознанно, безопасно и уверенно использовать ChatGPT. В руководствах представлены проверенные экспертами советы по ответственному использованию, критическому мышлению, установлению здоровых границ и поддержке подростков в обсуждении эмоциональных или чувствительных тем. Углубление сотрудничества с Министерством энергетики США Компания OpenAI и Министерство энергетики США подписали … Читать далее

Универсальные требования к переводу

1. Принципы научной коммуникации * Точность терминологии: * Использовать принятые в русскоязычной науке термины. * При первом упоминании сложного термина давать пояснение: «квантовая запутанность (quantum entanglement)». * Сохранять оригинальные названия организаций и проектов с переводом в скобках: «NASA (Национальное управление по аэронавтике)». * Работа с данными: * Числовые значения: «5.3 million light-years» → «5,3 миллиона … Читать далее

OpenAI запускает Академию OpenAI для новостных организаций

OpenAI создаёт Академию OpenAI для новостных организаций — новый обучающий центр, разработанный совместно с American Journalism Project и The Lenfest Institute. Цель Академии — помочь редакциям эффективно использовать искусственный интеллект. Академия предлагает обучение, практические примеры использования и рекомендации по ответственному применению для поддержки журналистов, редакторов и издателей при внедрении ИИ в их работу. Разработчики могут … Читать далее

Meta выпустила модель SAM Audio для разделения аудио

Meta выпустила SAM Audio — модель для разделения аудио, которая использует интуитивно понятные и мультимодальные подсказки для выделения одного звука из реального звукового микширования без необходимости создания отдельной модели для каждого класса звуков. Основные характеристики модели SAM Audio: Архитектура: SAM Audio использует отдельные энкодеры для каждого сигнала управления, аудиоэнкодер для смеси, текстовый энкодер для описания … Читать далее

OpenAI запускает Академию OpenAI для новостных организаций

OpenAI создаёт Академию OpenAI для новостных организаций — новый обучающий хаб, разработанный совместно с American Journalism Project и The Lenfest Institute. Академия предлагает обучение, практические примеры использования и рекомендации по ответственному применению ИИ для поддержки журналистов, редакторов и издателей при внедрении ИИ в их репортажи и операции. Разработчики могут отправлять приложения на рассмотрение и публикацию … Читать далее

Meta выпустила SAM Audio: передовую унифицированную модель для разделения аудио

Компания Meta выпустила SAM Audio — модель для разделения аудио, которая использует интуитивно понятные и мультимодальные подсказки для выделения одного звука из сложной смеси. Модель позволяет изолировать определённый звук без необходимости создания отдельной модели для каждого класса звуков. Основные характеристики Meta выпустила три основных варианта модели: sam-audio-small, sam-audio-base и sam-audio-large. Модель доступна для скачивания и … Читать далее

Новый способ повысить возможности больших языковых моделей

Большинство языков используют расположение слов и структуру предложений для извлечения смысла. Например, «The cat sat on the box» («Кот сел на коробку») не то же самое, что «The box was on the cat» («Коробка была на коте»). В длинном тексте, таком как финансовый документ или роман, синтаксис этих слов, вероятно, меняется. Аналогично человек может отслеживать … Читать далее

Представляем Академию OpenAI для новостных организаций

Компания OpenAI запускает Академию OpenAI для новостных организаций. Этот новый обучающий центр создан совместно с American Journalism Project и The Lenfest Institute, чтобы помочь редакциям эффективно использовать искусственный интеллект. Академия предлагает обучение, практические примеры использования и рекомендации по ответственному применению ИИ для поддержки журналистов, редакторов и издателей в их работе. 1. Какие цели стоят перед … Читать далее

Как организовать полностью автономный мультиагентный процесс исследования и написания с помощью CrewAI и Gemini для интеллектуального взаимодействия в реальном времени

В этом руководстве мы покажем, как создать небольшую, но мощную систему из двух агентов CrewAI, которые взаимодействуют с помощью модели Gemini Flash. Мы настроим нашу среду, выполним безопасную аутентификацию, определим специализированных агентов и организуем задачи, которые переходят от исследования к структурированному написанию. Установка и настройка среды 1. Установка CrewAI и инструментов: «`python import os import … Читать далее

Лаборатория Thinking Machines сделала Tinker общедоступным: добавлена поддержка Kimi K2 Thinking и визуального ввода Qwen3-VL

Лаборатория Thinking Machines предоставила API-интерфейс Tinker для общего использования и добавила три основные функции:* поддержку модели рассуждений Kimi K2 Thinking;* совместимость с выборкой OpenAI;* ввод изображений через языковые модели визуального восприятия Qwen3-VL. Для инженеров по искусственному интеллекту Tinker становится практичным способом точной настройки передовых моделей без создания инфраструктуры распределённого обучения. Что такое Tinker? Tinker — … Читать далее

Оценка способности ИИ выполнять задачи научных исследований

Компания OpenAI представила FrontierScience — систему эталонного тестирования, которая позволяет оценить логические рассуждения ИИ в области физики, химии и биологии. Это необходимо для измерения прогресса в направлении проведения реальных научных исследований. 1. Какие задачи решает система FrontierScience от компании OpenAI? Ответ: система FrontierScience от компании OpenAI позволяет оценить логические рассуждения ИИ в области физики, химии … Читать далее

Оценка способности ИИ ускорять биологические исследования

Компания OpenAI представляет систему оценки для измерения эффективности ИИ в ускорении биологических исследований в лабораторных условиях. В работе используется модель GPT-5 для оптимизации протокола молекулярного клонирования. Исследование рассматривает как потенциал, так и риски экспериментов с использованием ИИ. #OpenAI #ИИ #биологические_исследования 1. Какие технологии используются для ускорения биологических исследований в лабораторных условиях? В статье упоминается, что … Читать далее

Компьютерное проектирование становится доступнее

Системы автоматизированного проектирования (САПР) — проверенные инструменты, которые используются для проектирования многих физических объектов, которыми мы пользуемся каждый день. Однако для освоения САПР требуется обширный опыт, а многие инструменты включают такой высокий уровень детализации, что не подходят для мозгового штурма или быстрого создания прототипов. Роботы-сборщики по словесному описанию Чтобы ускорить и упростить проектирование для неспециалистов, … Читать далее

Использование вычислений для изучения лучших одноклеточных химиков мира

Сегодня из примерно 1 триллиона видов на Земле 99,999% считаются микробами — бактериями, археями, вирусами и одноклеточными эукариотами. Большую часть истории нашей планеты микробы господствовали на Земле, способные жить и процветать в самых экстремальных условиях. Исследователи только в последние десятилетия начали бороться с разнообразием микробов — считается, что менее 1% известных генов имеют подтверждённые в … Читать далее

Как спроектировать самокорректирующуюся мультиагентную систему искусственного интеллекта на базе Gemini с семантической маршрутизацией, символическими ограничениями и рефлексивной организацией

В этом руководстве мы рассмотрим, как спроектировать и запустить полный конвейер оркестровки агентского ИИ на базе семантической маршрутизации, символических ограничений и циклов самокоррекции с использованием Gemini. Мы разберём, как структурировать агентов, распределять задачи, обеспечивать соблюдение ограничений и совершенствовать выходные данные с помощью чистой модульной архитектуры. Настройка окружения Мы настраиваем нашу основную среду, импортируя необходимые библиотеки, … Читать далее

Работа над устранением барьеров для внедрения ядерной энергии

Что, если бы был способ решить одно из наиболее значительных препятствий для использования ядерной энергии — утилизацию высокоактивных ядерных отходов (ВЯО)? Даурен Сарсенбаев, аспирант третьего курса факультета ядерных наук и инженерии (NSE) Массачусетского технологического института (MIT), занимается решением этой задачи в рамках своих исследований. Сарсенбаев фокусируется на одной из основных проблем, связанных с ВЯО: выделении … Читать далее

Модель глубокого обучения предсказывает формирование плодовых мушек, клетка за клеткой

На ранних этапах развития ткани и органы начинают формироваться за счёт перемещения, деления и роста тысяч клеток. Команда инженеров MIT разработала способ предсказывать, как отдельные клетки складываются, делятся и перестраиваются на самой ранней стадии роста плодовой мушки. Новый метод может однажды быть применён для прогнозирования развития более сложных тканей, органов и организмов. Он также может … Читать далее

Команда OpenAI выпустила «circuit-sparsity»: набор открытых инструментов для соединения разреженных по весам моделей и плотных базовых моделей с помощью активационных мостов

Команда OpenAI выпустила модель openai/circuit-sparsity на Hugging Face и инструментарий openai/circuit_sparsity на GitHub. В релизе собраны модели и схемы из статьи «Weight-sparse transformers have interpretable circuits». Что такое разреженный по весам трансформер? Модели представляют собой декодеры в стиле GPT-2, обученные на коде Python. Разреженность не добавляется после обучения, она обеспечивается во время оптимизации. После каждого … Читать далее

5 архитектур моделей искусственного интеллекта, которые должен знать каждый инженер в сфере ИИ

Сегодня экосистема искусственного интеллекта (ИИ) гораздо шире, чем просто языковые модели. За кулисами целое семейство специализированных архитектур незаметно меняет то, как машины видят, планируют, действуют, сегментируют, представляют концепции и даже эффективно работают на небольших устройствах. Каждая из этих моделей решает свою часть головоломки интеллекта, и вместе они формируют следующее поколение систем ИИ. В этой статье … Читать далее

Как спроектировать полностью локальную систему создания историй с помощью рабочих процессов Griptape, моделей Hugging Face и модульной организации творческих задач

В этом руководстве мы создадим полностью локальную систему создания историй без использования API, применяя Griptape и лёгкую модель Hugging Face. Мы рассмотрим создание агента с возможностью использования инструментов, генерацию вымышленного мира, разработку персонажей и организацию многоэтапного рабочего процесса, который создаёт связный короткий рассказ. Разделив реализацию на модульные фрагменты, мы сможем чётко понять каждый компонент, когда … Читать далее