ИИ как величайший источник возможностей для всех.

Я всегда считал себя прагматичным технологом — человеком, который любит технологии не ради них самих, а за то прямое влияние, которое они могут оказать на жизнь людей. Именно это делает мою работу такой увлекательной, поскольку я верю, что ИИ откроет больше возможностей для большего числа людей, чем любая другая технология в истории. Если мы всё … Читать далее

Математические приёмы, которые языковые модели используют для прогнозирования динамических сценариев

Представьте, что вы читаете историю или играете в шахматы. Возможно, вы не замечали, но ваш разум отслеживает, как меняется ситуация (или «состояние мира»). Это можно представить как список последовательности событий, который мы используем для обновления наших прогнозов о том, что произойдёт дальше. Языковые модели, такие как ChatGPT, также отслеживают изменения внутри себя, когда завершают блок … Читать далее

Исследователи TikTok представили SWE-Perf: первый бенчмарк для оптимизации производительности кода на уровне репозитория

Введение По мере развития больших языковых моделей (LLM) в области разработки программного обеспечения — от генерации кода до исправления ошибок — оптимизация производительности остаётся сложной задачей, особенно на уровне репозитория. Чтобы восполнить этот пробел, исследователи из TikTok и сотрудничающих институтов представили SWE-Perf — первый бенчмарк, специально разработанный для оценки способности LLM оптимизировать производительность кода в … Читать далее

Институт Аллена по искусственному интеллекту (AI2) представляет AutoDS: механизм для открытых научных открытий, основанный на принципе «Байесовской неожиданности»

Институт Аллена по искусственному интеллекту (AI2) представил AutoDS (Autonomous Discovery via Surprisal) — инновационный прототип механизма для открытых научных открытий. В отличие от традиционных помощников в исследованиях ИИ, которые зависят от целей или запросов, определённых человеком, AutoDS автономно генерирует, тестирует и итеративно развивает гипотезы, количественно оценивая и выявляя «Байесовскую неожиданность» — обоснованную меру подлинного открытия, … Читать далее

Создание интеллектуального конвертера кода Python в R с проверкой и обратной связью на базе Gemini AI

В этом руководстве мы рассмотрим создание интеллектуального конвертера кода Python в R, который использует бесплатный API Gemini от Google для проверки и предложений по улучшению. Шаг 1: определение логики преобразования Мы начнём с определения логики преобразования, сопоставляя функции Python, библиотеки и синтаксические шаблоны с их ближайшими эквивалентами в R. Шаг 2: использование Gemini AI Затем … Читать далее

MIRIX: модульная мультиагентная система памяти для улучшения долгосрочного мышления и персонализации в агентах на базе LLM

Недавние разработки в области агентов LLM в основном были сосредоточены на расширении возможностей выполнения сложных задач. Однако одно важное направление остаётся недостаточно изученным: память — способность агентов сохранять, вспоминать и рассуждать на основе специфичной для пользователя информации в течение времени. Без постоянной памяти большинство агентов на базе LLM остаются без состояния, неспособными создавать контекст за … Читать далее

Можно ли доверять моделям вознаграждения LLM? Master-RM выявляет и устраняет их слабые места

Генеративные модели вознаграждения, в которых большие языковые модели (LLM) выступают в роли оценщиков, набирают популярность в обучении с подкреплением с проверяемыми вознаграждениями (RLVR). Эти модели предпочтительнее систем, основанных на правилах, для задач, связанных с открытыми или сложными ответами. Вместо того чтобы полагаться на строгие правила, LLM сравнивают ответ кандидата с эталонным ответом и генерируют бинарную … Читать далее

Протокол Model Context (MCP) для предприятий: безопасная интеграция с AWS, Azure и Google Cloud — обновление 2025 года

Оглавление 1. Обзор MCP и экосистема.2. AWS: MCP в масштабе облака.3. Microsoft Azure: MCP в Copilot и AI Foundry.4. Google Cloud: MCP Toolbox и Vertex AI.5. Лучшие практики для разных облаков.6. Безопасность и управление рисками (ландшафт угроз 2025 года).7. Расширенная экосистема: за пределами «большой тройки».8. Пример: поток интеграции AWS MSK MCP.9. Резюме (июль 2025 года). … Читать далее

NVIDIA представила OpenReasoning-Nemotron: набор языковых моделей с улучшенными возможностями логического вывода

Компания NVIDIA AI выпустила OpenReasoning-Nemotron — семейство больших языковых моделей (LLM), которые предназначены для решения сложных задач, связанных с логическим выводом в математике, науке и программировании. Основные характеристики В набор входят версии с количеством параметров 1,5 млрд, 7 млрд, 14 млрд и 32 млрд. Эти модели были созданы на основе модели DeepSeek R1 0528 с … Читать далее

Возможно, ИИ, основанный на физике, — это правильный подход: переосмысление основ интеллекта

За последнее десятилетие глубокое обучение произвело революцию в искусственном интеллекте, став движущей силой прорывов в распознавании изображений, языковом моделировании и играх. Однако появились постоянные ограничения: неэффективность использования данных, отсутствие устойчивости к изменениям распределения, высокая потребность в энергии и поверхностное понимание физических законов. По мере того как внедрение ИИ углубляется в критически важные сектора — от … Читать далее

Создание современной системы управления асинхронной конфигурацией с обеспечением типобезопасности и горячей перезагрузкой

В этом руководстве мы познакомим вас с разработкой и функциональностью AsyncConfig — современной библиотеки управления конфигурацией для Python, ориентированной на асинхронные операции. Мы создадим её с нуля, чтобы поддержать мощные функции, включая загрузку конфигурации на основе типов данных, множественные источники конфигурации (например, переменные окружения, файлы и словари) и горячую перезагрузку с помощью watchdog. Импортируем необходимые … Читать далее

Системный план развития Deep Research Agents: автономные исследовательские системы на основе больших языковых моделей

Команда исследователей из Ливерпульского университета, лаборатории Huawei Noah’s Ark, Оксфордского университета и Университетского колледжа Лондона представляет отчёт, объясняющий Deep Research Agents (DR agents) — новую парадигму в автономных исследованиях. Эти системы работают на основе больших языковых моделей (LLMs) и предназначены для решения сложных задач, требующих динамического анализа, адаптивного планирования, итеративного использования инструментов и структурированных аналитических … Читать далее

MemAgent: система на основе обучения с подкреплением, переопределяющая обработку длинных контекстов в больших языковых моделях

Обработка чрезвычайно длинных документов остаётся сложной задачей для больших языковых моделей (LLM). Даже с такими методами, как экстраполяция длины и разрежённое внимание, модели часто страдают от снижения производительности и высоких вычислительных затрат. Чтобы решить эту проблему, исследователи из ByteDance Seed и Университета Цинхуа разработали MemAgent — систему на основе обучения с подкреплением, предназначенную для обработки … Читать далее

Полное руководство по агентам искусственного интеллекта: архитектуры, фреймворки и практическое применение (2025)

Содержание 1. Что такое агент ИИ?2. Почему агенты ИИ важны в 2025 году?3. Типы агентов ИИ.4. Ключевые компоненты агента ИИ.5. Ведущие фреймворки агентов ИИ в 2025 году.6. Практические примеры использования агентов ИИ.7. Агент ИИ против чат-бота против LLM.8. Будущее агентских систем ИИ.9. Часто задаваемые вопросы об агентах ИИ.10. Заключение. Что такое агент ИИ? Агент ИИ … Читать далее

Создание мультиагентской исследовательской группы ИИ с помощью LangGraph и Gemini для автоматизированного составления отчётов

В этом руководстве мы создадим полноценную систему мультиагентской исследовательской группы, используя LangGraph и API Google Gemini. Мы используем агентов, выполняющих определённые роли: исследователь, аналитик, писатель и руководитель. Каждый из них отвечает за отдельный этап исследовательского процесса. Вместе они собирают данные, анализируют информацию, составляют отчёт и координируют рабочий процесс. Мы также включаем такие функции, как сохранение … Читать далее

Эта статья об искусственном интеллекте представляет ARAG: мультиагентную систему RAG для контекстно-зависимых и персонализированных рекомендаций

Персонализированные рекомендации стали важным компонентом многих цифровых систем. Их цель — предложить контент, продукты или услуги, соответствующие предпочтениям пользователя. Процесс основан на анализе прошлого поведения, взаимодействий и закономерностей, чтобы предсказать, что пользователи могут посчитать релевантным. Со временем методы рекомендаций перешли от базовой фильтрации к продвинутым моделям, основанным на понимании языка. Эти достижения позволяют системам предоставлять … Читать далее

Больше не нужно делиться данными для обучения языковой модели — FlexOlmo демонстрирует как

Разработка масштабных языковых моделей (LLM) исторически требовала централизованного доступа к обширным наборам данных, многие из которых чувствительны, защищены авторским правом или регулируются ограничениями на использование. Это ограничение серьёзно ограничивает участие организаций, богатых данными, работающих в регулируемых или закрытых средах. FlexOlmo — предложенная исследователями из Института Аллена по искусственному интеллекту и их коллегами — представляет собой … Читать далее

Использование Chain-of-Thought (CoT) рассуждений с библиотекой Mirascope

В этом руководстве мы рассмотрим, как реализовать рассуждения Chain-of-Thought (CoT) с помощью библиотеки Mirascope и модели Groq’s LLaMA 3. Вместо того чтобы модель сразу выдавала ответ, подход CoT побуждает её разбить задачу на логические шаги — подобно тому, как это сделал бы человек. Этот подход повышает точность, прозрачность и помогает более надёжно решать сложные многошаговые … Читать далее

EG-CFG: улучшение генерации кода с помощью обратной связи в реальном времени

Большие языковые модели (LLMs) добились впечатляющих успехов в генерации кода для различных задач программирования. Однако они в основном полагаются на распознавание шаблонов из статических примеров кода, а не на понимание того, как код ведёт себя во время выполнения. Это часто приводит к тому, что программы выглядят корректными, но терпят неудачу при запуске. Роль синтеза программ … Читать далее

Адаптивная система безопасности AegisLLM для повышения защищённости больших языковых моделей (LLM) во время вывода

Рост угроз для LLM Большие языковые модели (LLM) становятся основной мишенью для быстро развивающихся атак, включая внедрение запросов (prompt injection), взлом (jailbreaking) и несанкционированный вынос конфиденциальных данных. Из-за изменчивого характера этих угроз необходимо адаптировать защитные механизмы, выходящие за рамки статических мер безопасности. Существующие методы защиты LLM страдают из-за своей зависимости от статических вмешательств во время … Читать далее

Фонд размером в 50 миллионов долларов для совместной работы с сообществами.

Компания OpenAI запускает первоначальный фонд размером в 50 миллионов долларов, который поддерживает некоммерческие организации и общественные объединения. Об этом стало известно после публикации отчёта независимой комиссии OpenAI Nonprofit Commission. 1. Какова цель создания фонда OpenAI размером в 50 миллионов долларов? * Цель создания фонда — поддержка некоммерческих организаций и общественных объединений. 2. Какие организации могут … Читать далее

OpenAI представляет ChatGPT Agent: от исследований до автоматизации в реальном мире

17 июля 2025 года компания OpenAI выпустила ChatGPT Agent, преобразовав ChatGPT из разговорного помощника в унифицированного ИИ-агента, способного автономно выполнять сложные многоэтапные задачи — от просмотра веб-страниц до выполнения кода — в виртуальной компьютерной среде. Предыдущие возможности и их объединение ChatGPT Agent основан на двух предыдущих инструментах:* Operator предоставлял ограниченные возможности взаимодействия с веб-сайтами — … Читать далее

Модель прогнозирует долгосрочное воздействие ядерных отходов на системы подземного захоронения

По мере того как в разных странах мира вновь активизируются проекты в области ядерной энергетики, вопросы о том, где и как утилизировать ядерные отходы, остаются столь же политически острыми, как и прежде. Например, в Соединённых Штатах Америки на неопределённый срок приостановлено создание единственного долгосрочного подземного хранилища ядерных отходов. Учёные используют как моделирование, так и экспериментальные … Читать далее

Invideo AI использует модели OpenAI, включая GPT-4.1, gpt-image-1 и text-to-speech, чтобы создавать профессиональные видеоролики за считанные минуты, ускоряя процесс в 10 раз.

1. Какие модели искусственного интеллекта используются в Invideo AI для создания видеороликов? Ответ: в Invideo AI используются модели OpenAI, включая GPT-4.1, gpt-image-1 и text-to-speech. 2. Во сколько раз Invideo AI ускоряет процесс создания видеороликов по сравнению с традиционными методами? Ответ: Invideo AI ускоряет процесс создания видеороликов в 10 раз по сравнению с традиционными методами. 3. … Читать далее

GLM-4.1V-Thinking: развитие общего мультимодального понимания и рассуждений

Модели зрения и языка (VLM) играют решающую роль в современных интеллектуальных системах, обеспечивая детальное понимание визуального контента. Сложность задач мультимодального интеллекта возросла, начиная от решения научных задач и заканчивая разработкой автономных агентов. Текущие требования к VLM вышли далеко за рамки простого восприятия визуального контента, и всё больше внимания уделяется продвинутому мышлению. Недавние работы показывают, что … Читать далее

Mirage: мультимодальное рассуждение в VLM без визуализации изображений

Хотя VLM (Vision-Language Models, модели зрения и языка) хорошо справляются с пониманием текста и изображений, при рассуждениях они часто полагаются исключительно на текст, что ограничивает их способность решать задачи, требующие визуального мышления, например, пространственные головоломки. Люди естественным образом визуализируют решения, а не описывают каждую деталь, но VLM с этим справляются плохо. Хотя некоторые современные модели … Читать далее

NVIDIA выпустила гибридную модель Canary-Qwen-2.5B: передовой гибрид ASR и LLM с лучшими показателями в OpenASR

Компания NVIDIA выпустила модель Canary-Qwen-2.5B — инновационный гибрид автоматической системы распознавания речи (ASR) и языковой модели (LLM). Она заняла первое место в рейтинге Hugging Face OpenASR с рекордным показателем Word Error Rate (WER) в 5,63%. Ключевые особенности:* WER — 5,63%, самый низкий показатель в Hugging Face OpenASR.* RTFx — 418, высокая скорость вывода на 2,5 … Читать далее

Google Search только что получил серьёзное обновление искусственного интеллекта: Gemini 2.5 Pro, Deep Search и агентский интеллект

Google меняет подход к взаимодействию с поиском. Недавнее внедрение Gemini 2.5 Pro, Deep Search и мощной новой агентской функции делает поисковую систему Google более интеллектуальной, интерактивной и контекстуальной. Эти функции пока доступны только пользователям из США, но они знаменуют собой серьёзный сдвиг в интеграции Google Search с передовым искусственным интеллектом, приближая его к полноценному помощнику … Читать далее

Представляем агента ChatGPT: он мыслит и действует, используя инструменты для выполнения таких задач, как исследования, бронирование и создание презентаций — и всё это под вашим руководством.

Системная карточка агента ChatGPT: агентская модель от OpenAI объединяет исследования, автоматизацию работы в браузере и инструменты для работы с кодом с мерами безопасности в рамках системы Preparedness Framework. 1. Какие основные функции выполняет агент ChatGPT? Ответ: агент ChatGPT выполняет функции исследований, автоматизации работы в браузере и работы с кодом, действуя под руководством пользователя. 2. Какие … Читать далее

В OpenAI мы создаём инструменты, которые помогают людям решать сложные задачи, в том числе некоммерческим организациям, работающим на благо своих сообществ. Академия OpenAI совместно с Фондом семьи Уолтон, Emerson Collective и сетью местных некоммерческих организаций проводит мероприятие Nonprofit Jam — однодневное событие национального масштаба, которое объединит более 1000 лидеров некоммерческих организаций в 10 локациях.

#OpenAI #nonprofit #nonprofitjam 1. Какова цель мероприятия Nonprofit Jam, организуемого OpenAI? Ответ: цель мероприятия Nonprofit Jam — объединить более 1000 лидеров некоммерческих организаций в 10 локациях для обсуждения и решения сложных задач. 2. Какие организации участвуют в организации Nonprofit Jam? Ответ: в организации Nonprofit Jam участвуют Академия OpenAI, Фонд семьи Уолтон, Emerson Collective и сеть … Читать далее