NVIDIA XGBoost 3.0: обучение датасетов масштаба терабайт с помощью суперчипа Grace Hopper

NVIDIA представила важную веху в области масштабируемого машинного обучения: XGBoost 3.0, который теперь может обучать модели на основе градиентного бустинга для деревьев решений (GBDT) от гигабайт до 1 терабайта (ТБ) на одном суперчипе GH200 Grace Hopper Superchip. Этот прорыв позволяет компаниям обрабатывать огромные массивы данных для таких приложений, как обнаружение мошенничества, моделирование кредитного риска и … Читать далее

Реализация кодирования для продвинутого исследовательского конвейера LangGraph с использованием мультиагентов для генерации автоматизированных инсайтов

Мы создаём продвинутую мультиагентную систему LangGraph, которая использует модель Gemini от Google для сквозных исследовательских рабочих процессов. В этом руководстве мы начнём с установки необходимых библиотек: LangGraph, LangChain-Google-GenAI и LangChain-Core. Затем мы определим структурированное состояние, симулируем инструменты исследования и анализа и настроим трёх специализированных агентов: Research (Исследование), Analysis (Анализ) и Report (Отчёт). Установка библиотек !pip … Читать далее

OpenAI только что выпустила GPT-5: самую умную, быструю и полезную модель OpenAI

Компания OpenAI выпустила модель GPT-5, что стало значительным шагом вперёд в области генеративного искусственного интеллекта. Новая модель обладает расширенными возможностями для решения общих и узкоспециализированных задач. В этой статье мы подробно рассмотрим архитектуру GPT-5, новые функции, улучшения производительности и стратегическое значение для разработчиков, предприятий и экосистемы искусственного интеллекта. Архитектурные усовершенствования и дизайн системы GPT-5 — … Читать далее

Google AI выпускает DeepPolisher: новый инструмент глубокого обучения для повышения точности сборки геномов

Google AI совместно с Genomics Institute в UC Santa Cruz представил DeepPolisher — передовой инструмент для глубокого обучения, который значительно повышает точность сборки геномов за счёт исправления ошибок на уровне отдельных оснований. Эффективность инструмента была недавно продемонстрирована в рамках продвижения Human Pangenome Reference — важного этапа в исследованиях геномики. Проблема точной сборки генома Справочный геном … Читать далее

Alibaba представляет оптимизацию групповой последовательной политики (GSPO): эффективный алгоритм обучения с подкреплением, лежащий в основе моделей Qwen3

Обучение с подкреплением (RL) играет решающую роль в масштабировании языковых моделей, позволяя им решать сложные задачи, такие как математика на уровне соревнований и программирование, благодаря более глубокому анализу. Однако достижение стабильной и надёжной динамики обучения — это сложная задача при масштабировании RL с использованием более крупных вычислительных ресурсов. Современные передовые алгоритмы, такие как GRPO, сталкиваются … Читать далее

GPT-5 и новая эра работы

От категоричных отказов к безопасным завершениям: к обучению безопасности, ориентированному на результат GPT-5 — это самая продвинутая модель OpenAI, которая меняет корпоративный искусственный интеллект, автоматизацию и производительность труда в новую эру интеллектуальной работы. Узнайте, как новый подход OpenAI к безопасным завершениям в GPT-5 повышает безопасность и полезность ответов ИИ. Модель выходит за рамки категоричных отказов … Читать далее

Сравнение архитектур MoE: Qwen3 30B-A3B и GPT-OSS 20B

В этой статье представлено техническое сравнение двух недавно выпущенных моделей-трансформеров Mixture-of-Experts (MoE): Alibaba Qwen3 30B-A3B (выпущена в апреле 2025 года) и GPT-OSS 20B от OpenAI (выпущена в августе 2025 года). Обе модели представляют различные подходы к проектированию архитектуры MoE, балансируя между вычислительной эффективностью и производительностью в разных сценариях развёртывания. Обзор моделей | Характеристика | Qwen3 … Читать далее

Google DeepMind представляет Genie 3: модель мира общего назначения, которая может создавать невиданное ранее разнообразие интерактивных сред

Google DeepMind объявила о Genie 3 — революционной системе искусственного интеллекта, способной генерировать интерактивные, физически согласованные виртуальные миры из простых текстовых описаний. Это знаменует собой существенный скачок в области моделей мира — класса ИИ, предназначенных не просто для визуализации, а для понимания и симуляции сред, создания динамических пространств, в которых можно перемещаться и взаимодействовать в … Читать далее

Меры эковождения могут существенно сократить выбросы транспортных средств

Каждый автомобилист знает, как раздражают заторы на перекрёстках из-за долгих ожиданий смены сигнала светофора. Но простои на перекрёстках не только проверяют терпение водителей — неэффективный холостой ход транспортных средств может стать причиной до 15 процентов выбросов углекислого газа от наземных перевозок в США. Масштабное моделирование, проведённое исследователями MIT, показывает, что меры эковождения, которые включают динамическую … Читать далее

Школа архитектуры и градостроительства приветствует новых преподавателей в 2025 году

Этой осенью к Школе архитектуры и градостроительства (SA+P) присоединяются четыре новых преподавателя, которые внесут свой вклад в творческое и научное сообщество MIT благодаря своим знаниям и исследовательским навыкам в различных дисциплинах. «Эти люди значительно усиливают и углубляют наш преподавательский состав», — говорит Хашим Саркис, декан Школы архитектуры и градостроительства. «Мы рады академической энергии, которую они … Читать далее

Предоставление доступа к ChatGPT для всех сотрудников федеральных органов власти США

Сегодня компания OpenAI for Government объявляет о новом партнёрстве с Администрацией общих служб США (GSA). В рамках этой инициативы на следующий год ChatGPT Enterprise станет доступным для всех сотрудников федеральной исполнительной власти практически бесплатно. 1. Какие преимущества получит федеральная исполнительная власть США от использования ChatGPT Enterprise? В рамках партнёрства с OpenAI for Government и Администрацией … Читать далее

Что такое протокол Model Context (MCP)?

Протокол Model Context (MCP) — это открытый стандартизированный протокол для безопасного и структурированного взаимодействия между моделями искусственного интеллекта (такими как Claude, GPT-4 и другими) и внешними инструментами, сервисами и источниками данных. Представьте его как универсальный соединитель — вроде USB-C для ИИ, — позволяющий моделям получать доступ к базам данных, API, файловым системам, бизнес-инструментам и многому … Читать далее

В статье представлен новый билингвальный набор данных и система оценки для моделирования сложных устных диалогов

Модели устного диалога (SDMs) находятся на переднем крае разговорного искусственного интеллекта, обеспечивая плавное взаимодействие между людьми и машинами. Однако, несмотря на то что SDMs становятся неотъемлемой частью цифровых помощников, умных устройств и ботов для обслуживания клиентов, оценка их способности справляться с реальными сложностями человеческого диалога остаётся сложной задачей. Неизученная сложность устного диалога Хотя текстовые модели … Читать далее

Реализация кодирования для создания самоадаптивного целенаправленного агента ИИ с использованием Google Gemini и фреймворка SAGE

В этом руководстве мы рассмотрим создание продвинутой системы агентов ИИ на основе фреймворка SAGE (Self-Adaptive Goal-oriented Execution), используя API Google Gemini. Мы рассмотрим каждый ключевой компонент фреймворка: самооценка, адаптивное планирование, целенаправленное выполнение и интеграция опыта. Объединив их, мы стремимся создать интеллектуального, самосовершенствующегося агента, который может деконструировать высокоуровневую цель, планировать свои шаги, методично выполнять задачи и … Читать далее

Помощь системам хранения данных в условиях революции искусственного интеллекта

Искусственный интеллект меняет подход компаний к хранению данных и обеспечению доступа к ним. Дело в том, что традиционные системы хранения данных были разработаны для выполнения простых команд от нескольких пользователей одновременно. Сегодня же системам ИИ с миллионами агентов необходимо постоянно получать доступ к большим объёмам данных и обрабатывать их параллельно. Сложность традиционных систем хранения данных … Читать далее

OpenAI только что выпустила две новые языковые модели с открытым весом

Компания OpenAI выпустила две новые языковые модели с открытым весом: gpt-oss-120B и gpt-oss-20B. Их можно скачать, изучить, настроить и запустить на собственном оборудовании. Знакомьтесь с моделями: технические чудеса с практическими возможностями gpt-oss-120B * Размер: 117 миллиардов параметров (с 5,1 миллиарда активных параметров на токен благодаря технологии Mixture-of-Experts).* Производительность: на уровне OpenAI o4-mini (или лучше) в … Читать далее

Anthropic AI представляет векторы персон для мониторинга и контроля изменений личности в больших языковых моделях

Большие языковые модели (LLMs) используются через диалоговые интерфейсы, которые представляют полезные, безвредные и честные помощники. Однако они не могут поддерживать согласованные черты личности на этапах обучения и развёртывания. LLM демонстрируют резкие и непредсказуемые изменения личности при использовании различных стратегий подсказок или контекстуальных входных данных. Процесс обучения также может вызывать непреднамеренные изменения личности, как это видно, … Читать далее

Модели с открытым весом: gpt-oss-120b и gpt-oss-20b

Следующий рубеж развития искусственного интеллекта (ИИ) — это не только его возможности, но и то, кто сможет их использовать. Наша миссия — предоставить ИИ как можно большему числу людей — вот что нами движет. Сегодняшний выпуск наших наиболее мощных моделей с открытым весом — это значительный шаг вперёд, который делает передовой ИИ более открытым, гибким … Читать далее

Создание многофункциональной системы диалогового ИИ с помощью Microsoft AutoGen и Gemini API

В этом руководстве мы рассмотрим, как интегрировать Microsoft AutoGen с бесплатным API Google Gemini с помощью LiteLLM. Это позволит нам создать мощную систему диалогового ИИ с несколькими агентами, которая будет без проблем работать в Google Colab. Мы подробно разберём процесс настройки среды, настройки Gemini для совместимости с AutoGen и создания специализированных команд агентов для выполнения … Читать далее

Google AI выпускает LangExtract: открытую библиотеку Python для извлечения структурированных данных из неструктурированных текстовых документов

В современном мире, управляемом данными, ценные сведения часто скрыты в неструктурированном тексте — будь то клинические записи, длинные юридические договоры или отзывы клиентов. Извлечение значимой, отслеживаемой информации из этих документов является сложной технической и практической задачей. Новая открытая библиотека Python от Google AI, LangExtract, предназначена для решения этой проблемы напрямую, используя большие языковые модели (LLMs) … Читать далее

NASA представляет Galileo: мультимодальную модель с открытым исходным кодом для наблюдения за Землёй и дистанционного зондирования

Введение Galileo — это модель с открытым исходным кодом, разработанная для обработки, анализа и понимания различных потоков данных дистанционного зондирования Земли, включая оптические, радарные, высотные, климатические данные и вспомогательные карты. Модель создана при поддержке исследователей из Университета Макгилла, NASA Harvest Ai2, Карлтонского университета, Университета Британской Колумбии, Векторного института и Университета штата Аризона. Цель Galileo — … Читать далее

Инструмент MIT визуализирует и редактирует «физически невозможные» объекты

Творчество М. К. Эшера открывает дверь в мир оптических иллюзий, бросающих вызов законам физики. Его работы включают «невозможные объекты» со сложной геометрией. То, как вы воспринимаете иллюстрации Эшера, зависит от вашей точки зрения. Например, человек, идущий вверх по лестнице, может на самом деле спускаться по ней, если вы наклоните голову в сторону. Учёные и дизайнеры … Читать далее

Для чего мы оптимизируем ChatGPT.

Мы создаём ChatGPT, чтобы помочь вам преуспеть во всех сферах жизни. Узнайте, как мы улучшаем поддержку в трудные моменты, внедрили напоминания о перерывах и работаем над улучшением жизненных советов — и всё это под руководством экспертов. 1. Какие конкретные задачи решает оптимизация ChatGPT? Ответ: оптимизация ChatGPT направлена на улучшение поддержки пользователей в трудные моменты, внедрение … Читать далее

Теперь мир принадлежит Клоду: как Anthropic обогнала OpenAI в гонке корпоративных ИИ-решений

Ситуация на рынке корпоративных ИИ-решений изменилась. Согласно отчёту Menlo Ventures «Mid-Year LLM Market Update» за 2025 год, языковая модель Claude от компании Anthropic обогнала OpenAI и стала лидером на рынке корпоративных решений, захватив 32% доли рынка по сравнению с 25% у OpenAI — это разительно отличается от доминирующих 50% доли рынка, которые были у OpenAI … Читать далее

Семь основных слоёв для создания реальных ИИ-агентов в 2025 году: комплексная структура

Создание интеллектуального агента — это гораздо больше, чем просто разработка эффективных запросов для языковых моделей. Чтобы разработать автономные системы искусственного интеллекта (ИИ), способные мыслить, рассуждать, действовать и учиться, необходимо создать комплексное решение, которое объединяет несколько тесно интегрированных компонентов. 1. Уровень взаимодействия — Human Interface (человеческий интерфейс) Уровень взаимодействия служит связующим звеном между человеком и агентом. … Читать далее

ByteDance представляет Seed-Prover: передовую систему формальных рассуждений для автоматизированного доказательства математических теорем

Системы на базе больших языковых моделей (LLMs) продемонстрировали заметные улучшения в математическом мышлении благодаря работе с естественным языком. Это привело к повышению производительности по таким бенчмаркам, как MATH и AIME. Однако при обучении этих моделей с помощью подкрепляющего обучения (RL) возникает проблема: проверка правильности доказательств на естественном языке очень сложна. Требуется тщательная ручная проверка каждого … Читать далее

Tutorial: изучение визуализаций SHAP-IQ

В этом руководстве мы рассмотрим различные визуализации SHAP-IQ, которые помогают понять, как модель машинного обучения делает свои прогнозы. Эти визуализации разбивают сложное поведение модели на интерпретируемые компоненты, показывая как индивидуальный, так и совместный вклад признаков в конкретное предсказание. Установка зависимостей Для начала работы установите необходимые зависимости: `!pip install shapiq overrides scikit-learn pandas numpy seaborn` Импортирование … Читать далее

Техническая дорожная карта по разработке механизмов обработки контекста в больших языковых моделях: механизмы, критерии оценки и открытые вызовы

Оглавление Что такое обработка контекста? Таксономия обработки контекста Ключевые идеи и пробелы в исследованиях Применение и влияние Перспективы развития В статье «Обзор методов обработки контекста для больших языковых моделей» обработка контекста определяется как формальная дисциплина, выходящая далеко за рамки разработки запросов. Она представляет собой единую систематическую основу для проектирования, оптимизации и управления информацией, которая направляет … Читать далее

Полное руководство по CPU, GPU, NPU и TPU для искусственного интеллекта и машинного обучения: производительность, варианты использования и ключевые различия

Искусственный интеллект и рабочие нагрузки машинного обучения способствовали развитию специализированного оборудования для ускорения вычислений, далеко выходящего за рамки возможностей традиционных центральных процессоров (ЦП). Каждое вычислительное устройство — ЦП, графический процессор (ГПУ), нейронный процессор (НПУ) и тензорный процессор (ТПУ) — играет определённую роль в экосистеме искусственного интеллекта, оптимизированную для определённых моделей, приложений или сред. Вот технический … Читать далее

Создание комплексной системы отслеживания объектов и аналитики с помощью Roboflow Supervision

В этом продвинутом руководстве по Roboflow Supervision мы создадим полный конвейер обнаружения объектов с помощью библиотеки Supervision. Начало работы 1. Настройка отслеживания объектов в реальном времени с помощью ByteTracker, добавление сглаживания обнаружения и определение полигональных зон для мониторинга определённых областей в видеопотоке.2. Обработка кадров и аннотирование их с помощью ограничивающих рамок, идентификаторов объектов и данных … Читать далее