Вложенное обучение: новый подход в машинном обучении для непрерывного обучения, рассматривающий модели как вложенные оптимизационные задачи для улучшения обработки длинных контекстов

Как создать системы искусственного интеллекта, которые будут постоянно обучаться новой информации, не забывая при этом ранее изученное и не требуя полной переподготовки? Исследователи из Google предложили вложенный подход к обучению (Nested Learning), который рассматривает модель как совокупность более мелких вложенных оптимизационных задач, а не как единую сеть, обучаемую одним внешним циклом. Цель — решить проблему … Читать далее

Prior Labs выпускает TabPFN-2.5: новейшую версию модели TabPFN, которая обеспечивает масштабируемость и скорость для табличных фундаментных моделей

Tabular data до сих пор является основой для многих важных моделей в производстве. Команды в области финансов, здравоохранения, энергетики и промышленности работают с таблицами из строк и столбцов, а не с изображениями или длинными текстами. Теперь Prior Labs расширяет это пространство с помощью TabPFN-2.5 — новой табличной фундаментной модели, которая масштабирует контекстное обучение до 50 … Читать далее

Создание продвинутого многостраничного веб-приложения с использованием Reflex

В этом руководстве мы создадим продвинутое веб-приложение на Reflex полностью на языке Python, которое будет без проблем работать внутри Colab. Приложение разработано для демонстрации того, как Reflex позволяет осуществлять разработку полного стека без JavaScript, используя только реактивный код Python. Мы создадим полноценную панель управления для управления заметками, которая будет включать в себя две страницы, взаимодействие … Читать далее

Google выпускает ADK Go: новый фреймворк с открытым исходным кодом для разработчиков на Go

Google выпустила Agent Development Kit для Go (ADK Go) — новый фреймворк с открытым исходным кодом, который позволяет разработчикам на Go создавать мощных агентов искусственного интеллекта (ИИ). Как создавать надёжных агентов ИИ, которые подключаются к существующим сервисам на Go без необходимости использования отдельного языкового стека? Раньше разработчикам приходилось использовать отдельный стек на Python для агентов. … Читать далее

Инициатива MIT в области энергетики запускает форум по энергоснабжению дата-центров

Глобальный спрос на электроэнергию для дата-центров, как ожидается, более чем удвоится к 2030 году. Инициатива MIT в области энергетики (MITEI) в сентябре инициировала проект, который объединяет исследователей MIT и экспертов отрасли для изучения инновационных решений по обеспечению энергией будущего, основанного на данных. На своей ежегодной исследовательской конференции MITEI объявила о создании форума по энергоснабжению дата-центров … Читать далее

Понимание инъекций промптов: вызов в области безопасности

Инъекции промптов — это вызов в области безопасности для систем искусственного интеллекта. Узнайте, как работают эти атаки, и как OpenAI продвигает исследования, обучает модели и создаёт защитные меры для пользователей. Основные моменты: Инъекции промптов представляют собой серьёзную угрозу для безопасности систем ИИ. OpenAI активно занимается исследованиями и разработкой защитных механизмов. Важно понимать механизмы таких атак … Читать далее

Редизайн Notion для агентского ИИ: как GPT-5 помог реализовать автономные рабочие процессы

Узнайте, как Notion перестроила свою архитектуру искусственного интеллекта с помощью GPT-5 для создания автономных агентов, которые могут рассуждать, действовать и адаптироваться в рабочих процессах. Узнайте, как этот переход обеспечил более высокую, быструю и гибкую продуктивность в Notion 3.0. #GPT-5 #автономныеагенты #рабочиепроцессы 1. Какие возможности GPT-5 были использованы для перестройки архитектуры искусственного интеллекта в Notion? Ответ: … Читать далее

Почему пространственное сверхчувственное восприятие становится ключевой способностью для мультимодальных систем искусственного интеллекта?

Даже мощные модели ИИ, работающие с длинным контекстом, плохо справляются с отслеживанием объектов и подсчётом их количества в длинных и запутанных видеопотоках. Поэтому следующее конкурентное преимущество получат модели, которые предсказывают, что будет дальше, и выборочно запоминают только удивительные, важные события, а не просто покупают больше вычислительных мощностей и увеличивают размер контекстных окон. Команда исследователей из … Читать далее

Сравнение шести сред выполнения для обслуживания больших языковых моделей в 2025 году

Большие языковые модели (LLM) сейчас ограничены не столько обучением, сколько скоростью и стоимостью обслуживания токенов при реальном трафике. Это зависит от трёх деталей реализации:* как среда выполнения обрабатывает запросы пакетами;* как она совмещает предварительное заполнение и декодирование;* как она хранит и повторно использует кэш KV. В статье сравниваются шесть сред выполнения, которые часто встречаются в … Читать далее

Создание мультиагентной системы для интерпретации данных транскриптомики, протеомики и метаболомики с учётом путей метаболизма

В этом руководстве мы создаём продвинутый мультиагентный конвейер, который интерпретирует интегрированные данные омиков, включая транскриптомику, протеомику и метаболомику, чтобы выявить ключевые биологические закономерности. Этапы работы 1. Генерация согласованных синтетических наборов данных, которые имитируют реалистичные биологические тенденции.2. Статистический анализ: агенты для статистического анализа, вывода сети, обогащения путей и перепрофилирования лекарств.3. Анализ сетей: определение главных регуляторов и … Читать далее

Обучение с подкреплением без обучения с временной разницей (RL without TD learning)

В этом посте я представлю алгоритм обучения с подкреплением (RL), основанный на «альтернативной» парадигме: «разделяй и властвуй». В отличие от традиционных методов, этот алгоритм не основан на обучении с временной разницей (TD learning), которое имеет проблемы с масштабируемостью, и хорошо масштабируется для задач с длинным горизонтом. Мы можем использовать RL на основе «разделяй и властвуй» … Читать далее

Moonshot AI выпускает модель мышления Kimi K2: впечатляющая модель, способная выполнять до 200–300 последовательных вызовов инструментов без вмешательства человека

Как спроектировать системы ИИ, которые могут планировать, рассуждать и действовать в течение длительных последовательностей решений без постоянного руководства человека? Компания Moonshot AI выпустила модель мышления Kimi K2 Thinking — модель-агент с открытым исходным кодом, которая демонстрирует полный поток рассуждений архитектуры Kimi K2 Mixture of Experts. Она предназначена для рабочих нагрузок, требующих глубокого анализа, длительного использования … Читать далее

Создание автономного планировщика и валидатора протоколов для влажной лаборатории с помощью Salesforce CodeGen для оптимизации проектирования экспериментов и обеспечения безопасности

В этом руководстве мы создаём планировщик и валидатор протоколов для влажной лаборатории, который действует как интеллектуальный агент для проектирования и проведения экспериментов. Мы разрабатываем систему на Python и интегрируем модель Salesforce CodeGen-350M-mono для рассуждений на естественном языке. Структура конвейера Мы структурируем конвейер на модульные компоненты:* ProtocolParser для извлечения структурированных данных, таких как шаги, продолжительность и … Читать далее

Google AI представляет DS STAR: мультиагентную систему для научных исследований данных, которая планирует, кодирует и проверяет аналитику от начала до конца

Google представила DS STAR (Data Science Agent via Iterative Planning and Verification) — мультиагентную систему, которая превращает открытые вопросы в области научных исследований данных в исполняемые скрипты на Python для работы с разнородными файлами. Вместо того чтобы полагаться на чистую базу данных SQL и один запрос, DS STAR решает задачу преобразования текста в Python и … Читать далее

На пути к будущему искусственного интеллекта: от более безопасных ответов к ускоренному мышлению

Внедрение новых инструментов и технологий происходит, когда пользователи в значительной степени воспринимают их как надёжные, доступные и более совершенные по сравнению с имеющимися методами и рабочими процессами при данной стоимости. Пять аспирантов из первого набора летней программы MIT-IBM Watson AI Lab используют современные ресурсы, устраняя болевые точки искусственного интеллекта (ИИ) и создавая новые функции и … Читать далее

От пилотного проекта к практике: как BBVA внедряет искусственный интеллект в работу организации

BBVA переосмысливает подход сотрудников к работе с ChatGPT Enterprise, интегрируя ИИ в повседневные операции. Банк сэкономил часы рабочего времени сотрудников в неделю, создал более 20 000 пользовательских версий GPT и добился повышения эффективности до 80%. 1. Какие конкретные результаты были достигнуты BBVA после внедрения ИИ в рабочие процессы? Ответ: BBVA сэкономил часы рабочего времени сотрудников … Читать далее

Исследователи MIT предложили новую модель понятного и модульного программного обеспечения

Использование больших языковых моделей (LLMs) в программировании открывает огромные перспективы, но также обнажает давние недостатки программного обеспечения: код, который является запутанным, сложным для безопасного изменения и часто непрозрачным в отношении того, что происходит под капотом. Исследователи из Лаборатории компьютерных наук и искусственного интеллекта MIT (CSAIL) намечают более «модульный» путь вперёд. Их новый подход разбивает системы … Читать далее

Исследователи из CMU представили PPP и UserVille для обучения проактивных и персонализированных агентов LLM

Большинство агентов LLM настроены на максимизацию успеха в выполнении задач. Они решают проблемы на GitHub или отвечают на сложные исследовательские запросы, но не всегда тщательно продумывают, когда задавать вопросы пользователю или как учитывать индивидуальные предпочтения в общении. Как разработать агентов LLM, которые будут знать, когда задавать более качественные вопросы и адаптировать своё поведение под каждого … Читать далее

Как CRED использует искусственный интеллект для обеспечения премиального качества обслуживания клиентов

CRED трансформирует взаимодействие с клиентами премиум-сегмента в Индии с помощью OpenAI. Используя инструменты на базе GPT, компания повышает точность поддержки, сокращает время отклика и увеличивает удовлетворённость клиентов. #CRED #ИИ #обслуживание_клиентов 1. Какие конкретные инструменты на базе GPT использует CRED для улучшения качества обслуживания клиентов? CRED использует инструменты на базе GPT от OpenAI для повышения точности … Читать далее

Generalist AI представляет GEN-θ: новый класс воплощённых фундаментальных моделей для мультимодального обучения на основе реальных физических взаимодействий

Как создать единую модель, которая сможет изучать физические навыки на основе хаотичных данных о работе роботов в реальном мире, не прибегая к симуляции? Компания Generalist AI представила GEN-θ — семейство воплощённых фундаментальных моделей, обученных непосредственно на данных о реальных физических взаимодействиях высокого качества, а не на интернет-видео или симуляциях. Система создана для установления законов масштабирования … Читать далее

Как Chime переопределяет маркетинг с помощью искусственного интеллекта

Винит Мехра, директор по маркетингу в Chime, рассказывает, как искусственный интеллект меняет маркетинг, превращая его в дисциплину, ориентированную на агентов. Он объясняет, почему директора по маркетингу, которые пропагандируют грамотность в области ИИ и его продуманное внедрение, станут лидерами в новую эпоху роста. #Как #Chime #маркетинг #ИИ 1. Какие изменения в маркетинге происходят благодаря искусственному интеллекту? … Читать далее

Как создать модель-агент, который учится внутреннему планированию, памяти и многоинструментальному мышлению с помощью сквозного обучения с подкреплением

В этом руководстве мы рассмотрим, как агент может усвоить планирование, память и использование инструментов в рамках единой нейронной модели, а не полагаться на внешнюю координацию. Мы разрабатываем компактного агента, который учится выполнять арифметические задачи с помощью обучения с подкреплением. Этапы разработки 1. Создание среды: мы создаём небольшой синтетический мир, где каждое действие, такое как умножение, … Читать далее

OpenAI представляет IndQA: бенчмарк, учитывающий культурные особенности индийских языков

Как можно достоверно проверить, понимают ли большие языковые модели индийские языки и культуру в реальных условиях? OpenAI выпустила IndQA — бенчмарк, который оценивает, насколько хорошо модели ИИ понимают вопросы и рассуждают о них на индийских языках в различных культурных областях. Зачем нужен IndQA? OpenAI заявляет, что около 80% людей в мире не говорят на английском … Читать далее

Более 1 миллиона бизнес-клиентов по всему миру уже используют OpenAI. В здравоохранении, медико-биологических науках, финансовых услугах и других сферах ChatGPT и наши API открывают новую эру интеллектуальной работы на базе искусственного интеллекта.

1 миллион компаний применяет ИИ в работе. 1. Какие сферы бизнеса уже используют технологии OpenAI? * В здравоохранении, медико-биологических науках, финансовых услугах и других сферах бизнес применяет ChatGPT и API от OpenAI. 2. Почему использование ИИ в бизнесе может быть интересным для потенциальных клиентов? * Более 1 миллиона бизнес-клиентов по всему миру уже используют OpenAI, … Читать далее

Обучение роботов построению карт больших пространств

Роботы, предназначенные для поиска людей в частично обрушенных шахтах, должны быстро создавать карту местности и определять своё местоположение на этой карте при передвижении по опасной местности. Исследователи начали разрабатывать мощные модели машинного обучения для выполнения этой сложной задачи, используя только изображения с бортовых камер робота. Однако даже лучшие модели могут обрабатывать лишь несколько изображений одновременно. … Читать далее

Google AI представляет обучение согласованности для повышения безопасности языковых моделей при подхалимских и джейлбрейк-стиле запросов

Как обучение согласованности помогает языковым моделям противостоять подхалимским запросам и атакам в стиле джейлбрейк, сохраняя при этом свои возможности? Большие языковые модели часто безопасно отвечают на простые запросы, но меняют поведение, когда та же задача оформлена с помощью лести или ролевой игры. Исследователи из DeepMind предлагают последовательное обучение в качестве простого инструмента для решения этой … Читать далее

Как создать масштабируемые и воспроизводимые конвейеры экспериментов в машинном обучении с помощью Meta Research Hydra?

В этом руководстве мы рассмотрим Hydra — продвинутую систему управления конфигурациями, разработанную компанией Meta Research и доступную с открытым исходным кодом. Мы начнём с определения структурированных конфигураций с использованием классов данных Python, что позволит нам управлять параметрами экспериментов чисто, модульно и воспроизводимо. Установка и импорт модулей Для начала установим Hydra и импортируем все необходимые модули, … Читать далее

В Бразилии наступил момент расцвета искусственного интеллекта.

Сейчас Бразилия — одна из самых активных стран в мире в сфере ИИ. От школьных классов до ферм и малого бизнеса — бразильцы используют продукты OpenAI для обучения, творчества и внедрения инноваций. 🤖 1. Какие сферы жизни в Бразилии охватывает использование продуктов OpenAI? Использование продуктов OpenAI охватывает различные сферы жизни в Бразилии, включая образование (школьные … Читать далее

Сравнение семи крупных языковых моделей для кодирования в 2025 году

Языковые модели, ориентированные на код, перешли от автозавершения к системам разработки программного обеспечения. В 2025 году ведущие модели должны исправлять реальные проблемы на GitHub, рефакторить бэкенды с несколькими репозиториями, писать тесты и работать как агенты в течение длительного времени. Основной вопрос для команд — не «может ли модель кодировать», а какая модель соответствует каким ограничениям. … Читать далее

Cache-to-Cache (C2C): прямая семантическая коммуникация между большими языковыми моделями через слияние KV-кэша

Могут ли большие языковые модели (LLM) взаимодействовать, не отправляя ни одного текстового токена? Команда исследователей из Университета Цинхуа, Infinigence AI, Китайского университета Гонконга, Шанхайской лаборатории искусственного интеллекта и Шанхайского университета Цзяо Тун утверждает, что да. Cache-to-Cache (C2C) — это новая парадигма коммуникации, при которой большие языковые модели обмениваются информацией через свой KV-кэш, а не через … Читать далее