От 100 000 до менее 500 меток: как ИИ Google сокращает данные для обучения больших языковых моделей на порядки

Исследователи из Google представили инновационный метод тонкой настройки больших языковых моделей (БЯМ), который сокращает объём необходимых данных для обучения до 10 000 раз, сохраняя или даже улучшая качество модели. Этот подход основан на активном обучении и сосредоточении усилий экспертов по разметке на наиболее информативных примерах — «пограничных случаях», где модель наиболее неопределённа. Традиционные узкие места … Читать далее

Тенденции развития ИИ-агентов в 2025 году: преобразующий ландшафт

2025 год знаменует собой определяющий момент в эволюции искусственного интеллекта, открывая эру, в которой агентские системы — автономные ИИ-агенты, способные к сложным рассуждениям и скоординированным действиям — преобразуют корпоративные рабочие процессы, исследования, разработку программного обеспечения и повседневный пользовательский опыт. В этой статье основное внимание уделяется пяти основным тенденциям развития ИИ-агентов в 2025 году:* Agentic RAG;* … Читать далее

Тенденции развития ИИ-агентов в 2025 году: трансформационный ландшафт

2025 год знаменует собой определяющий момент в эволюции искусственного интеллекта, открывая эру, в которой агентские системы — автономные ИИ-агенты, способные к сложным рассуждениям и скоординированным действиям, — преобразуют корпоративные рабочие процессы, исследования, разработку программного обеспечения и повседневный опыт пользователей. В этой статье основное внимание уделяется пяти основным тенденциям развития ИИ-агентов в 2025 году: агентским RAG, … Читать далее

9 шаблонов агентских рабочих процессов, преобразующих ИИ-агентов в 2025 году

Оглавление * Почему классические рабочие процессы ИИ-агентов терпят неудачу* 9 шаблонов агентских рабочих процессов на 2025 год * Последовательный интеллект * Параллельная обработка * Интеллектуальная маршрутизация * Самосовершенствующиеся системы* Как эти шаблоны революционизируют ИИ-агентов* Реальное влияние и лучшие практики внедрения* Заключение Почему классические рабочие процессы ИИ-агентов терпят неудачу Большинство неудачных реализаций агентов основаны на «одношаговом … Читать далее

Создание продвинутого исследовательского агента PaperQA2 с помощью Google Gemini для анализа научной литературы

В этом руководстве мы рассмотрим создание продвинутого агента искусственного интеллекта PaperQA2 на базе модели Gemini от Google, разработанной специально для анализа научной литературы. Мы настроим среду в Google Colab/Notebook, сконфигурируем API Gemini и интегрируем его с PaperQA2 для обработки и запроса множества научных статей. К концу настройки у нас будет интеллектуальный агент, способный отвечать на … Читать далее

Graph-R1: агентская система GraphRAG для структурированных многоэтапных рассуждений с использованием обучения с подкреплением

Введение Большие языковые модели (LLM) установили новые стандарты в обработке естественного языка, но их склонность к галлюцинациям — генерации неточных результатов — остаётся серьёзной проблемой для приложений, требующих глубоких знаний. Системы генерации с дополнением на основе поиска (RAG) пытаются решить эту проблему, включая внешние знания в генерацию языка. Однако традиционные подходы RAG основаны на фрагментарном … Читать далее

Mixture-of-Agents (MoA): прорыв в производительности больших языковых моделей

Архитектура Mixture-of-Agents (MoA) — это инновационный подход к повышению производительности больших языковых моделей (LLM), особенно в сложных задачах, где одной модели может быть сложно обеспечить точность, обоснованность или специфику предметной области. Как работает архитектура Mixture-of-Agents 1. Многоуровневая структура: — В рамках MoA несколько специализированных агентов LLM организованы в слои. — Каждый агент в слое получает … Читать далее

Часто задаваемые вопросы: всё, что вам нужно знать об агентах искусственного интеллекта в 2025 году

1. Что такое агент искусственного интеллекта (определение 2025 года)? Агент искусственного интеллекта — это система, управляемая LLM, которая воспринимает, планирует, использует инструменты, действует в программных средах и поддерживает состояние для достижения целей при минимальном контроле. В 2025 году такие агенты надёжны в узких, хорошо инструментированных рабочих процессах; быстро совершенствуются в использовании компьютеров (настольные компьютеры/веб) и … Читать далее

Автоматизация освоения агентов LLM для любого сервера MCP с помощью MCP-RL и ART

Введение Расширение возможностей больших языковых моделей (LLM) для гибкого взаимодействия с динамичной, реальной средой — это новое направление в инженерии искусственного интеллекта. Спецификация Model Context Protocol (MCP) предлагает стандартизированный шлюз, через который LLM могут взаимодействовать с произвольными внешними системами — API, файловыми системами, базами данных, приложениями или инструментами — без необходимости каждый раз писать специальный … Читать далее

Alibaba представляет Qwen3-4B-Instruct-2507 и Qwen3-4B-Thinking-2507: обновление важности небольших языковых моделей

Небольшие модели с улучшенной производительностью и поддержкой контекста 256K Команда Alibaba Qwen представила два мощных дополнения к линейке небольших языковых моделей: Qwen3-4B-Instruct-2507 и Qwen3-4B-Thinking-2507. Несмотря на то, что у них всего 4 миллиарда параметров, эти модели демонстрируют исключительные возможности в решении задач общего и экспертного уровня, при этом эффективно работая на потребительском оборудовании. Обе модели … Читать далее

VL-Cogito: развитие мультимодального мышления с помощью поэтапного обучения с подкреплением

Мультимодальное мышление, при котором модели интегрируют и интерпретируют информацию из разных источников, таких как текст, изображения и диаграммы, является одной из самых сложных задач в области искусственного интеллекта. VL-Cogito — это современная мультимодальная большая языковая модель (MLLM), предложенная Академией DAMO (Alibaba Group) и партнёрами. Она представляет собой надёжный механизм обучения с подкреплением, который существенно улучшает … Читать далее

Руководство разработчика по возможностям модели GPT-5 от OpenAI

В этом руководстве мы рассмотрим новые возможности, представленные в последней модели OpenAI — GPT-5. Обновление включает несколько мощных функций, среди которых параметр Verbosity, вызов функций в свободной форме, контекстно-свободная грамматика (CFG) и минимальные рассуждения. Мы рассмотрим, как они работают, и как их использовать на практике. Установка библиотек Чтобы установить необходимые библиотеки, выполните следующие команды: «`!pip … Читать далее

Cloudflare против Perplexity: борьба за право веб-скрапинга в сфере ИИ накаляется

Читая подробное разоблачение от Cloudflare и обширное освещение в СМИ, становится ясно, что противоречия, связанные с методами веб-скрапинга от Perplexity AI, глубже и острее, чем кажется на первый взгляд. Cloudflare обвиняет Perplexity в следующем: * Систематическое игнорирование блокировок веб-сайтов и маскировка своей идентичности для извлечения данных с сайтов, которые отказались от использования ИИ-инструментов.* Изменение пользовательских … Читать далее

Реализация кода для создания мультиагентной исследовательской системы с помощью агентов OpenAI

В этом руководстве мы покажем возможности агентов OpenAI в качестве движущей силы нашей мультиагентной исследовательской системы. Мы настроим среду Colab с ключом API OpenAI, установим SDK агентов OpenAI и определим пользовательские инструменты: `websearch`, `analyzedata` и `save_research`, чтобы использовать возможности агентов. Мы создадим трёх специализированных агентов OpenAI (специалист по исследованиям, аналитик данных и координатор исследований), каждому … Читать далее

Meta CLIP 2: первая модель предварительной подготовки Contrastive Language-Image (CLIP) на основе мировых пар изображений и текста

Contrastive Language-Image Pre-training (CLIP) стал важным инструментом для современных визуальных и мультимодальных моделей, позволяя применять такие технологии, как классификация изображений без примеров (zero-shot image classification), и использоваться в качестве кодировщиков изображений в MLLMs. Однако большинство вариантов CLIP, включая Meta CLIP, ограничиваются обработкой данных только на английском языке, игнорируя значительное количество неанглоязычного контента из интернета. Масштабирование … Читать далее

Что такое прокси-сервер? Подробное техническое погружение с тенденциями и лучшими прокси-серверами (издание 2025 года)

Введение Прокси-сервер — это важный посредник между клиентами и серверами назначения, обеспечивающий безопасность и скорость в современном интернете. В 2025 году, когда на первый план вышли цифровая конфиденциальность, корпоративная безопасность и автоматизация на основе данных, прокси-серверы стали незаменимыми для частных лиц и организаций. Прокси-серверы перехватывают и фильтруют запросы, переводят протоколы (HTTP, HTTPS, SOCKS5), кэшируют веб-контент … Читать далее

Знакомьтесь: CoAct-1 — новая мультиагентная система

Команда исследователей из Университета Южной Калифорнии, Salesforce AI и Вашингтонского университета представила CoAct-1 — новаторскую мультиагентную систему, которая знаменует собой значительный прорыв в области автономной работы компьютеров. Что такое CoAct-1? CoAct-1 — это мультиагентный компьютерный агент (CUA), который позволяет выполнять сложные задачи более эффективно и надёжно. Система сочетает в себе управление на основе графического интерфейса … Читать далее

NVIDIA XGBoost 3.0: обучение датасетов масштаба терабайт с помощью суперчипа Grace Hopper

NVIDIA представила важную веху в области масштабируемого машинного обучения: XGBoost 3.0, который теперь может обучать модели на основе градиентного бустинга для деревьев решений (GBDT) от гигабайт до 1 терабайта (ТБ) на одном суперчипе GH200 Grace Hopper Superchip. Этот прорыв позволяет компаниям обрабатывать огромные массивы данных для таких приложений, как обнаружение мошенничества, моделирование кредитного риска и … Читать далее

Реализация кодирования для продвинутого исследовательского конвейера LangGraph с использованием мультиагентов для генерации автоматизированных инсайтов

Мы создаём продвинутую мультиагентную систему LangGraph, которая использует модель Gemini от Google для сквозных исследовательских рабочих процессов. В этом руководстве мы начнём с установки необходимых библиотек: LangGraph, LangChain-Google-GenAI и LangChain-Core. Затем мы определим структурированное состояние, симулируем инструменты исследования и анализа и настроим трёх специализированных агентов: Research (Исследование), Analysis (Анализ) и Report (Отчёт). Установка библиотек !pip … Читать далее

OpenAI только что выпустила GPT-5: самую умную, быструю и полезную модель OpenAI

Компания OpenAI выпустила модель GPT-5, что стало значительным шагом вперёд в области генеративного искусственного интеллекта. Новая модель обладает расширенными возможностями для решения общих и узкоспециализированных задач. В этой статье мы подробно рассмотрим архитектуру GPT-5, новые функции, улучшения производительности и стратегическое значение для разработчиков, предприятий и экосистемы искусственного интеллекта. Архитектурные усовершенствования и дизайн системы GPT-5 — … Читать далее

Google AI выпускает DeepPolisher: новый инструмент глубокого обучения для повышения точности сборки геномов

Google AI совместно с Genomics Institute в UC Santa Cruz представил DeepPolisher — передовой инструмент для глубокого обучения, который значительно повышает точность сборки геномов за счёт исправления ошибок на уровне отдельных оснований. Эффективность инструмента была недавно продемонстрирована в рамках продвижения Human Pangenome Reference — важного этапа в исследованиях геномики. Проблема точной сборки генома Справочный геном … Читать далее

Alibaba представляет оптимизацию групповой последовательной политики (GSPO): эффективный алгоритм обучения с подкреплением, лежащий в основе моделей Qwen3

Обучение с подкреплением (RL) играет решающую роль в масштабировании языковых моделей, позволяя им решать сложные задачи, такие как математика на уровне соревнований и программирование, благодаря более глубокому анализу. Однако достижение стабильной и надёжной динамики обучения — это сложная задача при масштабировании RL с использованием более крупных вычислительных ресурсов. Современные передовые алгоритмы, такие как GRPO, сталкиваются … Читать далее

GPT-5 и новая эра работы

От категоричных отказов к безопасным завершениям: к обучению безопасности, ориентированному на результат GPT-5 — это самая продвинутая модель OpenAI, которая меняет корпоративный искусственный интеллект, автоматизацию и производительность труда в новую эру интеллектуальной работы. Узнайте, как новый подход OpenAI к безопасным завершениям в GPT-5 повышает безопасность и полезность ответов ИИ. Модель выходит за рамки категоричных отказов … Читать далее

Сравнение архитектур MoE: Qwen3 30B-A3B и GPT-OSS 20B

В этой статье представлено техническое сравнение двух недавно выпущенных моделей-трансформеров Mixture-of-Experts (MoE): Alibaba Qwen3 30B-A3B (выпущена в апреле 2025 года) и GPT-OSS 20B от OpenAI (выпущена в августе 2025 года). Обе модели представляют различные подходы к проектированию архитектуры MoE, балансируя между вычислительной эффективностью и производительностью в разных сценариях развёртывания. Обзор моделей | Характеристика | Qwen3 … Читать далее

Google DeepMind представляет Genie 3: модель мира общего назначения, которая может создавать невиданное ранее разнообразие интерактивных сред

Google DeepMind объявила о Genie 3 — революционной системе искусственного интеллекта, способной генерировать интерактивные, физически согласованные виртуальные миры из простых текстовых описаний. Это знаменует собой существенный скачок в области моделей мира — класса ИИ, предназначенных не просто для визуализации, а для понимания и симуляции сред, создания динамических пространств, в которых можно перемещаться и взаимодействовать в … Читать далее

Меры эковождения могут существенно сократить выбросы транспортных средств

Каждый автомобилист знает, как раздражают заторы на перекрёстках из-за долгих ожиданий смены сигнала светофора. Но простои на перекрёстках не только проверяют терпение водителей — неэффективный холостой ход транспортных средств может стать причиной до 15 процентов выбросов углекислого газа от наземных перевозок в США. Масштабное моделирование, проведённое исследователями MIT, показывает, что меры эковождения, которые включают динамическую … Читать далее

Школа архитектуры и градостроительства приветствует новых преподавателей в 2025 году

Этой осенью к Школе архитектуры и градостроительства (SA+P) присоединяются четыре новых преподавателя, которые внесут свой вклад в творческое и научное сообщество MIT благодаря своим знаниям и исследовательским навыкам в различных дисциплинах. «Эти люди значительно усиливают и углубляют наш преподавательский состав», — говорит Хашим Саркис, декан Школы архитектуры и градостроительства. «Мы рады академической энергии, которую они … Читать далее

Предоставление доступа к ChatGPT для всех сотрудников федеральных органов власти США

Сегодня компания OpenAI for Government объявляет о новом партнёрстве с Администрацией общих служб США (GSA). В рамках этой инициативы на следующий год ChatGPT Enterprise станет доступным для всех сотрудников федеральной исполнительной власти практически бесплатно. 1. Какие преимущества получит федеральная исполнительная власть США от использования ChatGPT Enterprise? В рамках партнёрства с OpenAI for Government и Администрацией … Читать далее

Что такое протокол Model Context (MCP)?

Протокол Model Context (MCP) — это открытый стандартизированный протокол для безопасного и структурированного взаимодействия между моделями искусственного интеллекта (такими как Claude, GPT-4 и другими) и внешними инструментами, сервисами и источниками данных. Представьте его как универсальный соединитель — вроде USB-C для ИИ, — позволяющий моделям получать доступ к базам данных, API, файловым системам, бизнес-инструментам и многому … Читать далее

В статье представлен новый билингвальный набор данных и система оценки для моделирования сложных устных диалогов

Модели устного диалога (SDMs) находятся на переднем крае разговорного искусственного интеллекта, обеспечивая плавное взаимодействие между людьми и машинами. Однако, несмотря на то что SDMs становятся неотъемлемой частью цифровых помощников, умных устройств и ботов для обслуживания клиентов, оценка их способности справляться с реальными сложностями человеческого диалога остаётся сложной задачей. Неизученная сложность устного диалога Хотя текстовые модели … Читать далее