Реализация кодирования для создания агента-наставника с сохранением состояния, долгосрочной памятью, семантическим поиском и адаптивной генерацией практических занятий

В этом руководстве мы создаём полностью функционального агента-наставника, который выходит за рамки кратковременных чатов и постоянно обучается. Мы разрабатываем систему, которая сохраняет предпочтения пользователя, отслеживает слабые места в обучении и выборочно вспоминает только релевантный прошлый контекст при ответе. Этапы разработки 1. Настройка среды выполнения и импорт библиотек: — Устанавливаем необходимые библиотеки для создания агента с … Читать далее

Moonshot AI запускает Kimi Claw: OpenClaw теперь доступен на Kimi.com

Moonshot AI официально предоставила возможности фреймворка OpenClaw прямо в браузере. Переименованный Kimi Claw теперь встроен в kimi.com, предоставляя разработчикам и учёным в области данных постоянную среду для работы с ИИ, работающую круглосуточно и без выходных. Обновление проекта Это обновление переводит проект из локальной настройки в облачный центр обработки данных. Это означает, что инфраструктура для сложных … Читать далее

Знакомьтесь: Kani-TTS-2 — модель синтеза речи с открытым исходным кодом на 400 млн параметров, которая работает в 3 ГБ видеопамяти и поддерживает клонирование голоса

Команда nineninesix.ai выпустила новую модель синтеза речи с открытым исходным кодом — Kani-TTS-2. Эта модель отличается от традиционных систем синтеза речи, требующих больших вычислительных мощностей. Она обрабатывает аудио как язык, обеспечивая высококачественный синтез речи при удивительно низком объёме занимаемой памяти. Архитектура: LFM2 и NanoCodec Kani-TTS-2 следует философии «Аудио как язык». Модель не использует традиционные конвейеры … Читать далее

Начало работы с OpenClaw и его подключение к WhatsApp

OpenClaw — это персональный помощник с открытым исходным кодом, который работает на ваших устройствах и взаимодействует через уже используемые вами приложения, такие как WhatsApp, Telegram, Slack, Discord и другие. Он может отвечать на вопросы, автоматизировать задачи, взаимодействовать с файлами и сервисами и даже говорить или слушать на поддерживаемых устройствах, сохраняя при этом контроль над вашими … Читать далее

Google AI представляет WebMCP для обеспечения прямого и структурированного взаимодействия с веб-сайтами для новых AI-агентов

Google официально превращает Chrome в площадку для AI-агентов. В течение многих лет AI-«браузеры» полагались на запутанный процесс: делали скриншоты веб-сайтов, прогоняли их через модели обработки изображений и угадывали, куда нажать. Этот метод медленный, легко ломается и требует огромных вычислительных ресурсов. Google представил более совершенный способ: протокол контекста веб-модели (WebMCP). Объявленный вместе с программой раннего предварительного … Читать далее

Как создать самоорганизующуюся систему памяти для агента, способного к долгосрочному мышлению в AI

В этом руководстве мы создаём самоорганизующуюся систему памяти для агента, которая выходит за рамки простого хранения истории общения и структурирует взаимодействия в устойчивые, значимые единицы знаний. Мы проектируем систему так, чтобы рассуждения и управление памятью были чётко разделены, что позволяет выделенному компоненту извлекать, сжимать и организовывать информацию. В то же время основной агент фокусируется на … Читать далее

Exa AI представляет Exa Instant: нейронный поисковик с задержкой менее 200 мс для устранения узких мест в рабочих процессах в реальном времени 🤖

В мире больших языковых моделей (LLMs) скорость — единственная важная характеристика после того, как решена проблема точности. Для человека ожидание 1 секунды для получения результата поиска — это нормально. Но для ИИ-агента, выполняющего 10 последовательных поисков для решения сложной задачи, задержка в 1 секунду на каждый поиск создаёт 10-секундное отставание. Эта задержка убивает пользовательский опыт. … Читать далее

Полное руководство: конвейер CTGAN + SDV для создания высококачественных синтетических данных

В этом руководстве мы создадим полный конвейер для генерации синтетических данных с использованием CTGAN и экосистемы SDV. Мы начнём с необработанных табличных данных смешанного типа и постепенно перейдём к ограниченной генерации, условной выборке, статистической проверке и тестированию полезности в последующих процессах. Мы сосредоточимся не только на генерации образцов, но и на понимании того, насколько хорошо … Читать далее

Kyutai выпустила модель Hibiki-Zero для одновременного перевода речи

Компания Kyutai представила Hibiki-Zero — новую модель для одновременного перевода речи (S2ST) и перевода речи в текст (S2TT). Система переводит исходную речь на целевой язык в режиме реального времени и обрабатывает немонотонные зависимости между словами в процессе. В отличие от предыдущих моделей, Hibiki-Zero не требует для обучения данных с выравниванием на уровне слов. Это устраняет … Читать далее

Введение режимов Lockdown Mode и маркировки Elevated Risk в ChatGPT

В ChatGPT введены режимы Lockdown Mode и маркировки Elevated Risk, чтобы помочь организациям защититься от внедрения промптов (prompt injection) и утечки данных с помощью ИИ. Как OpenAI создала систему доступа в реальном времени, сочетающую лимиты по скорости, отслеживание использования и кредиты для обеспечения непрерывного доступа к Sora и Codex Перевод названий технологий и проектов оставлен … Читать далее

Google DeepMind представляет Aletheia: ИИ-агент, переходящий от математических соревнований к полностью автономным профессиональным научным открытиям

Команда Google DeepMind представила Aletheia — специализированного ИИ-агента, предназначенного для преодоления разрыва между математическими соревнованиями и профессиональными исследованиями. В то время как модели достигли стандартов, соответствующих золотым медалям на Международной математической олимпиаде (IMO) 2025 года, исследования требуют работы с обширной литературой и построения долгосрочных доказательств. Aletheia решает эту задачу, итеративно генерируя, проверяя и корректируя решения … Читать далее

Как настроить большие языковые модели в соответствии с предпочтениями человека с помощью прямой оптимизации предпочтений, QLoRA и Ultra-Feedback

В этом руководстве мы реализуем сквозной рабочий процесс прямой оптимизации предпочтений (Direct Preference Optimization, DPO), чтобы настроить большую языковую модель в соответствии с человеческими предпочтениями без использования модели вознаграждения. Этапы работы 1. Настройка среды выполнения и установка всех необходимых библиотек для DPO, PEFT и квантованного обучения.2. Определение всех глобальных гиперпараметров, ограничений набора данных и настроек … Читать далее

Новая исследовательская и политическая инициатива J-PAL по тестированию и масштабированию инноваций в области искусственного интеллекта для борьбы с бедностью

Лаборатория действий по борьбе с бедностью Абдул Латиф Джамиль (J-PAL) при Массачусетском технологическом институте (MIT) выделила финансирование восьми новым исследованиям в рамках своей инициативы Project AI Evidence (PAIE). Цель проекта — изучить, как инновации в области искусственного интеллекта могут быть использованы для борьбы с бедностью. Возраст искусственного интеллекта принёс широкий оптимизм и скептицизм относительно его … Читать далее

OpenAI представляет исследовательский предварительный просмотр GPT-5.3-Codex-Spark: модель искусственного интеллекта для кодирования, которая в 15 раз быстрее

Компания OpenAI только что выпустила новый исследовательский предварительный просмотр под названием GPT-5.3 Codex-Spark. Эта модель создана для одной цели: экстремальной скорости. В то время как стандартный GPT-5.3 Codex фокусируется на глубоком анализе, Spark разработан для практически мгновенного отклика. Это результат глубокой интеграции аппаратного и программного обеспечения между OpenAI и Cerebras. Результаты меняют правила игры. Spark … Читать далее

Это настоящий сильный искусственный интеллект? Обновление Google Gemini 3 Deep Think превосходит последний экзамен человечества и достигает 84,6% в тесте ARC-AGI-2

Google объявила о крупном обновлении Gemini 3 Deep Think. Это обновление специально разработано для ускорения современной науки, исследований и разработок. Похоже, это больше, чем просто выпуск новой модели. Это поворот к «режиму рассуждений», который использует внутреннюю проверку для решения задач, ранее требовавших вмешательства человека-эксперта. Обновлённая модель достигает контрольных показателей, которые переопределяют границы интеллекта. Сосредоточившись на … Читать далее

Представляем GPT-5.3-Codex-Spark.

Представляем GPT-5.3-Codex-Spark — нашу первую модель для кодирования в реальном времени. Ускорение генерации в 15 раз, контекст 128 КБ, сейчас доступна в виде исследовательского превью для пользователей ChatGPT Pro. 1. Какие основные характеристики модели GPT-5.3-Codex-Spark? Ответ: модель GPT-5.3-Codex-Spark обладает ускорением генерации в 15 раз и имеет контекст размером 128 КБ. Она предназначена для кодирования в … Читать далее

Ускорение научного прогресса с помощью искусственного интеллекта и моделирования

Более десяти лет доцент Массачусетского технологического института (MIT) Рафаэль Гомез-Бомбарелли использует искусственный интеллект для создания новых материалов. По мере развития технологий расширялись и его амбиции. Теперь профессор, недавно получивший постоянное место в Массачусетском технологическом институте, считает, что искусственный интеллект способен преобразовать науку так, как это раньше было невозможно. Его работа в MIT и за его … Читать далее

Как создать оптимизированную для «матрёшки» модель встраивания предложений для сверхбыстрого поиска с усечением до 64 измерений

В этом руководстве мы уточняем модель встраивания Sentence-Transformers, используя Matryoshka Representation Learning, чтобы первые измерения вектора несли наиболее полезный семантический сигнал. Мы обучаем модель с помощью MatryoshkaLoss на тройных данных, а затем проверяем ключевое обещание MRL, сравнивая качество поиска после усечения вложений до 64, 128 и 256 измерений. Установка необходимых библиотек Сначала установим необходимые библиотеки … Читать далее

Как создать конвейер RAG для Atomic-Agents с использованием типизированных схем, динамической инъекции контекста и связывания агентов

В этом руководстве мы создадим продвинутый, комплексный обучающий конвейер вокруг Atomic-Agents, объединив типизированные интерфейсы агентов, структурированные запросы и компактный уровень извлечения, который связывает выходные данные с реальной проектной документацией. Также мы покажем, как планировать извлечение, извлекать релевантный контекст, динамически внедрять его в отвечающего агента и запускать интерактивный цикл, который превращает настройку в многократно используемого помощника … Читать далее

Использование инженерных решений: применение Codex в мире, ориентированном на агентов

Райан Лополо, член технического персонала Перевод выполнен с учётом принципов научной коммуникации и стилистической адаптации. Отраслевые особенности не учитывались, так как текст относится к широкой сфере технологий. Визуальное оформление соответствует заданным критериям. 1. Какие возможности открывает применение Codex в сфере технологий? В статье не даётся прямого ответа на этот вопрос, однако можно предположить, что применение … Читать далее

Использование синтетической биологии и искусственного интеллекта для борьбы с глобальной угрозой устойчивости к противомикробным препаратам

Профессор Джеймс Дж. Коллинз, профессор медицинской инженерии и науки в Массачусетском технологическом институте (MIT) и соруководитель клиники Абдул Латифа Джамиля по машинному обучению в здравоохранении, приступает к междисциплинарному исследовательскому проекту. В рамках проекта синтетическая биология и генеративный искусственный интеллект применяются для борьбы с растущей глобальной угрозой устойчивости к противомикробным препаратам (УПП). Исследовательский проект финансируется Jameel … Читать далее

Исследователи NVIDIA представили конвейер кодирования KVTC для сжатия кэшей «ключ-значение» в 20 раз для эффективного обслуживания больших языковых моделей

Проблема обслуживания больших языковых моделей (LLM) Масштабное обслуживание больших языковых моделей — это сложная инженерная задача из-за управления кэшами «ключ-значение» (KV). По мере увеличения размера моделей и их способности к рассуждениям объём кэша KV растёт и становится основным узким местом для пропускной способности и задержки. Для современных трансформеров этот кэш может занимать несколько гигабайт. Исследователи … Читать далее

Google AI представляет нативно адаптивные интерфейсы (NAI): агентская мультимодальная платформа доступности, созданная на основе Gemini для адаптивного дизайна пользовательского интерфейса

Google Research предлагает новый подход к созданию доступного программного обеспечения с помощью нативно адаптивных интерфейсов (NAI). Это агентская платформа, где мультимодальный ИИ-агент становится основным пользовательским интерфейсом и адаптирует приложение в реальном времени под возможности и контекст каждого пользователя. Вместо того чтобы поставлять фиксированный пользовательский интерфейс и добавлять специальные возможности в качестве отдельного слоя, NAI встраивает … Читать далее

Алгоритм искусственного интеллекта позволяет отслеживать жизненно важные пути белого вещества

Сигналы, которые управляют многими важнейшими функциями мозга и организма — сознанием, сном, дыханием, частотой сердечных сокращений и движением, — проходят через пучки волокон «белого вещества» в стволе головного мозга. Однако системы визуализации пока не способны детально рассмотреть эти важные нейронные кабели. Это ограничивало возможности исследователей и врачей в оценке их повреждений при травмах или нейродегенеративных … Читать далее

Проектирование сложных тензорных конвейеров глубокого обучения с помощью Einops: примеры с использованием зрения, внимания и мультимодальных данных

В этом руководстве мы рассмотрим расширенное использование Einops для выражения сложных преобразований тензоров понятным, читаемым и математически точным способом. Мы покажем, как функции rearrange, reduce, repeat, einsum, pack и unpack позволяют изменять форму, агрегировать и комбинировать тензоры без необходимости вручную управлять измерениями. Основное внимание уделено реальным паттернам глубокого обучения, таким как разбиение изображений на патчи, … Читать далее

Alibaba открывает исходные коды Zvec: встроенная векторная база данных, объединяющая простоту SQLite и высокую производительность для RAG на периферийных устройствах

Команда Alibaba Tongyi Lab выпустила Zvec — векторную базу данных с открытым исходным кодом, ориентированную на работу с периферийными устройствами и устройствами. Проект позиционируется как «SQLite для векторных баз данных», поскольку работает как библиотека внутри вашего приложения и не требует внешних служб или демонов. Почему встроенный векторный поиск важен для RAG? Для систем RAG и … Читать далее

Использование искусственного интеллекта для помощи олимпийским фигуристам в выполнении пятикратного акселя

Олимпийское фигурное катание выглядит лёгким и непринуждённым. Спортсмены скользят по льду, затем взлетают в воздух, кружась как волчок, прежде чем приземлиться на единственный конек шириной всего 4–5 миллиметров. Чтобы помочь фигуристам выполнять четверные аксели, сальховы, лутцы и, возможно, даже неуловимый пятикратный прыжок без малейшего напряжения, Джерри Лу (Jerry Lu MFin ’24) разработал оптическую систему слежения … Читать далее

Как создать защищённый федеративный конвейер для точной настройки больших языковых моделей с помощью LoRA, Flower и PEFT

В этом руководстве мы покажем, как настроить точную настройку большой языковой модели с помощью LoRA, не собирая при этом конфиденциальные текстовые данные в одном месте. Мы смоделируем несколько организаций в качестве виртуальных клиентов и покажем, как каждый клиент адаптирует общую базовую модель локально, обмениваясь только лёгкими параметрами адаптера LoRA. Используя механизм федеративного обучения Flower вместе … Читать далее

Microsoft предлагает OrbitalBrain: распределённое машинное обучение в космосе

Наблюдательные спутники Земли (Earth observation, EO) ежедневно собирают огромные объёмы снимков высокого разрешения, но большая их часть не доходит до Земли вовремя для обучения моделей. Ограниченность пропускной способности канала связи — основное препятствие. Изображения могут находиться на орбите несколько дней, пока наземные модели обучаются на неполных и задержанных данных. Исследователи Microsoft представили систему OrbitalBrain как … Читать далее

OpenAI начинает тестирование рекламы в ChatGPT, чтобы обеспечить бесплатный доступ пользователям. Реклама будет иметь чёткие метки, ответы будут независимыми, предусмотрены надёжные меры защиты конфиденциальности и контроль со стороны пользователей.

1. Как OpenAI планирует обеспечить независимость ответов ChatGPT при наличии рекламы? OpenAI утверждает, что ответы ChatGPT будут независимыми. Это означает, что реклама не будет влиять на содержание ответов модели. Однако конкретные механизмы, которые OpenAI использует для обеспечения независимости, в статье не раскрываются. 2. Какие меры защиты конфиденциальности предусмотрены при показе рекламы в ChatGPT? В статье … Читать далее