Zhipu AI выпускает «Glyph»: фреймворк ИИ для масштабирования длины контекста через визуально-текстовое сжатие

Команда исследователей из Zhipu AI выпустила Glyph — фреймворк искусственного интеллекта для масштабирования длины контекста с помощью визуально-текстового сжатия. Система преобразует длинные текстовые последовательности в изображения, а затем обрабатывает их с помощью моделей зрения и языка (VLM). Каждый визуальный токен кодирует множество символов, поэтому эффективная последовательность токенов сокращается, при этом семантика сохраняется. Glyph может обеспечить … Читать далее

Система защиты от атак AI от Doppel

Система защиты от атак AI от Doppel предотвращает распространение атак до их распространения, создана для пользы каждого. Новая глава партнёрства Microsoft и OpenAI Использование возможностей AI Система защиты от атак AI от Doppel использует GPT-5 от OpenAI и тонкую настройку с помощью подкрепления (RFT), чтобы остановить распространение атак с использованием дипфейков и подражания. Это сокращает … Читать далее

Как создать систему RAG с интеллектуальной маршрутизацией запросов, самопроверкой и итеративным уточнением

В этом руководстве мы создадим продвинутую систему Agentic Retrieval-Augmented Generation (RAG), которая выходит за рамки простого ответа на вопросы. Мы разработаем её так, чтобы она интеллектуально направляла запросы к нужным источникам знаний, выполняла самопроверку для оценки качества ответов и итеративно уточняла ответы для повышения точности. Мы реализуем всю систему с помощью инструментов с открытым исходным … Читать далее

Знакомьтесь: kvcached — библиотека машинного обучения для виртуализации и эластичного KV-кэша при обслуживании больших языковых моделей на общих GPU

Большие языковые модели часто тратят впустую память GPU, поскольку механизмы предварительно резервируют большие статические области KV-кэша для каждой модели, даже когда запросы поступают всплесками или модель простаивает. kvcached — это библиотека, разработанная исследователями из Berkeley’s Sky Computing Lab (Университет Калифорнии, Беркли) в тесном сотрудничестве с Rice University и UCLA, а также при участии коллег из … Читать далее

Пять основных параметров больших языковых моделей (LLM): объяснение с примерами

Большие языковые модели (LLM) предлагают несколько параметров, которые позволяют точно настроить их поведение и контролировать генерацию ответов. В этом руководстве мы рассмотрим наиболее часто используемые параметры: `maxcompletiontokens`, `temperature`, `topp`, `presencepenalty` и `frequency_penalty` — и разберёмся, как каждый из них влияет на результат работы модели. Max Tokens (максимальное количество токенов) `Max Tokens` — это максимальное количество … Читать далее

Как создать, обучить и сравнить несколько агентов обучения с подкреплением в пользовательской торговой среде с помощью Stable-Baselines3

В этом руководстве мы рассмотрим продвинутые применения Stable-Baselines3 в обучении с подкреплением. Мы разработаем полнофункциональную пользовательскую торговую среду, интегрируем несколько алгоритмов, таких как PPO и A2C, и разработаем собственные обратные вызовы для отслеживания производительности. Создание пользовательской торговой среды Мы определяем нашу пользовательскую среду TradingEnv, в которой агент учится принимать решения о покупке, продаже или удержании … Читать далее

Новое исследование в области ИИ: стресс-тестирование спецификаций моделей и выявление различий в поведении языковых моделей

Компании, занимающиеся разработкой ИИ, используют спецификации моделей для определения целевых моделей поведения во время обучения и оценки. Достаточно ли точно спецификации описывают целевое поведение, и демонстрируют ли передовые модели различные поведенческие профили при одинаковых спецификациях? Команда исследователей из Anthropic, Thinking Machines Lab и Constellation представила систематический метод, который стресс-тестирует спецификации моделей, используя сценарии компромисса между … Читать далее

Как создать полностью функционального агента для использования на компьютере, который мыслит, планирует и выполняет виртуальные действия с помощью локальных моделей ИИ

Введение В этом руководстве мы создадим с нуля продвинутого агента для использования на компьютере, который сможет рассуждать, планировать и выполнять виртуальные действия с помощью локальной модели с открытым весом. Мы создадим миниатюрный смоделированный рабочий стол, оснастим его интерфейсом инструментов и разработаем интеллектуального агента, который сможет анализировать окружающую среду, принимать решения о таких действиях, как нажатие … Читать далее

Liquid AI представляет LFM2-VL-3B: модель языка и зрения с 3 миллиардами параметров для устройств класса «edge»

Компания Liquid AI выпустила LFM2-VL-3B — модель языка и зрения с 3 миллиардами параметров для задач преобразования текста в изображение и обратно. Она расширяет семейство LFM2-VL за пределы вариантов на 450 миллионов и 1,6 миллиарда параметров. Основные характеристики модели:* нацелена на более высокую точность при сохранении скоростного профиля архитектуры LFM2;* доступна на LEAP и Hugging … Читать далее

Реализация создания продвинутых API для машинного обучения с несколькими конечными точками с помощью LitServe: пакетная обработка, потоковая передача, кэширование и локальный вывод

В этом руководстве мы рассмотрим LitServe — лёгкую и мощную платформу для запуска моделей машинного обучения в виде API с минимальными усилиями. Мы создадим и протестируем несколько конечных точек, которые демонстрируют функциональные возможности в реальных условиях, такие как генерация текста, пакетная обработка, потоковая передача, многозадачная обработка и кэширование, все работающие локально без использования внешних API. … Читать далее

Salesforce AI Research представляет WALT (Web Agents that Learn Tools): агенты с возможностью автоматического обнаружения инструментов на любом сайте

Команда исследователей Salesforce AI представила WALT (Web Agents that Learn Tools) — фреймворк, который преобразует скрытые функции веб-сайтов в повторно используемые инструменты. Что такое WALT? Веб-агенты часто сталкиваются с проблемами при изменении макетов или выполнении длинных последовательностей действий. WALT решает эти проблемы, анализируя функциональность сайта в автономном режиме и предоставляя инструменты, которые инкапсулируют навигацию, выборку, … Читать далее

Мозговая мощь устойчивого искусственного интеллекта

Как использовать науку для создания лучшего пряничного домика? Миранда Шваке много думала об этом. Студентка Массачусетского технологического института (MIT) на факультете материаловедения и инженерии (DMSE) является частью группы Kitchen Matters — группы аспирантов, которые используют еду и кухонные инструменты для объяснения научных концепций через короткие видео и просветительские мероприятия. В прошлом группа рассматривала такие темы, … Читать далее

Google AI представляет подход FLAME: одношаговое активное обучение, которое выбирает наиболее информативные выборки для обучения и позволяет очень быстро специализировать модель

Обнаруживающие объекты с открытым словарём отвечают на текстовые запросы с помощью блоков. В дистанционном зондировании производительность в нулевом приближении падает, потому что классы детализированы, а визуальный контекст необычен. Команда исследователей Google предлагает FLAME — стратегию одношагового активного обучения, которая основана на мощном детекторе с открытым словарём и добавляет крошечный механизм уточнения, который можно обучить почти … Читать далее

OpenAI приобрела компанию Software Applications Incorporated, разработчика приложения Sky.

OpenAI купила компанию Software Applications Incorporated, которая создала Sky — интерфейс естественного языка для Mac, интегрирующий искусственный интеллект прямо в рабочий процесс на вашем компьютере. Вместе мы внедряем глубокие возможности macOS в ChatGPT, чтобы сделать искусственный интеллект более интуитивно понятным, контекстуальным и ориентированным на действия. 1. Какие возможности ChatGPT улучшатся после интеграции с технологиями купленной … Читать далее

Консенсус ускоряет научные исследования с помощью GPT-5 и Responses API.

Консенсус использует GPT-5 и Responses API от OpenAI для работы мультиагентного исследовательского помощника, который за минуты читает, анализирует и обобщает данные — помогая более чем 8 миллионам исследователей ускорить научные открытия. 1. Какие технологии лежат в основе работы мультиагентного исследовательского помощника от Консенсуса? В основе работы мультиагентного исследовательского помощника от Консенсуса лежат технологии GPT-5 и … Читать далее

UltraCUA: модель для агентов использования компьютера, которая объединяет общие графические пользовательские интерфейсы (GUI) и специализированные агенты на основе API

Агенты, используемые для работы с компьютером, ограничены примитивными действиями: они могут нажимать, вводить текст, прокручивать. Длинные цепочки действий увеличивают количество ошибок и приводят к лишним шагам. Исследователи из Apple представляют UltraCUA — модель, которая создаёт гибридное пространство действий, позволяя агенту чередовать низкоуровневые действия с графическим интерфейсом (GUI) с высокоуровневыми программными вызовами инструментов. Как работает гибридное … Читать далее

Руководство по программированию для создания полнофункционального мультиагентного рынка с помощью uAgent

В этом руководстве мы рассмотрим, как создать небольшую, но функциональную мультиагентную систему с использованием фреймворка uAgents. Мы настроим трёх агентов — Directory, Seller и Buyer — которые будут взаимодействовать через чётко определённые протоколы обмена сообщениями, чтобы имитировать взаимодействие на реальном рынке. Шаг 1: установка библиотеки uAgents Сначала мы устанавливаем библиотеку uAgents и определяем все модели … Читать далее

Anthrogen представляет Odyssey: семейство языковых моделей для работы с белками

Anthrogen представил Odyssey — семейство языковых моделей для работы с белками, предназначенное для генерации последовательностей и структур, редактирования белков и условного проектирования. Модели производства варьируются от 1,2 млрд до 102 млрд параметров. Исследовательская группа Anthrogen позиционирует Odyssey как передовую мультимодальную модель для реальных задач проектирования белков и отмечает, что API находится в раннем доступе. Какую … Читать далее

Экономический план OpenAI для Кореи: как стимулировать рост с помощью доверенного искусственного интеллекта

План OpenAI по экономике Кореи описывает, как Южная Корея может развивать доверенные технологии искусственного интеллекта за счёт суверенных возможностей и стратегического партнёрства. 1. Какие основные аспекты экономического плана OpenAI для Кореи могут способствовать развитию доверенных технологий искусственного интеллекта? Ответ: План OpenAI для экономики Кореи предусматривает развитие доверенных технологий искусственного интеллекта за счёт суверенных возможностей и … Читать далее

Экономический план OpenAI для Южной Кореи

Экономический план OpenAI для Кореи описывает, как Южная Корея может расширить использование надёжных ИИ-технологий за счёт суверенных возможностей и стратегических партнёрств для стимулирования экономического роста. #AI #ЮжнаяКорея #OpenAI 1. Какие возможности для экономического роста Южной Кореи открывает использование надёжных ИИ-технологий? Ответ: Использование надёжных ИИ-технологий может стимулировать экономический рост Южной Кореи за счёт расширения их применения … Читать далее

PokeeResearch-7B: агент глубокого исследования с обучением на основе обратной связи от ИИ

Pokee AI выпустила PokeeResearch-7B — агента глубокого исследования с 7 миллиардами параметров. Этот агент выполняет полные циклы исследований, разлагает запросы, выполняет поиск и чтение, проверяет ответы-кандидаты, а затем синтезирует несколько исследовательских потоков в окончательный ответ. Структура и обучение Агент работает по циклу исследования и проверки. В исследовании он вызывает внешние инструменты для веб-поиска и чтения … Читать далее

Новая глава для суверенного ИИ в Великобритании.

Компания OpenAI расширяет своё партнёрство с Великобританией, заключив новое соглашение с Министерством юстиции. Благодаря этому ChatGPT станет доступен государственным служащим. Кроме того, в стране будет обеспечено хранение данных пользователей сервисов ChatGPT Enterprise, ChatGPT Edu и API Platform. Это должно поддержать надёжное и безопасное внедрение ИИ. 1. Какие преимущества для государственных служащих принесёт доступность ChatGPT? * … Читать далее

Пятеро, связанных с MIT, избраны в Национальную медицинскую академию на 2025 год

20 октября в ходе ежегодного собрания Национальная медицинская академия (NAM) объявила о выборе 100 новых членов, включая преподавателей MIT Дину Катаби и Факундо Батиста, а также трёх других выпускников MIT. Избрание в Национальную медицинскую академию — одна из самых высоких наград в области здравоохранения и медицины Избрание в Национальную медицинскую академию (NAM) считается одной из … Читать далее

Google AI представляет VISTA: самосовершенствующийся агент для генерации видео по тексту

Что такое VISTA? VISTA (Video Iterative Self improvementT Agent) — это система, которая улучшает генерацию видео по тексту во время вывода. Она представляет собой многоагентную структуру, которая планирует структурированные подсказки в виде сцен, проводит парные турниры для выбора наилучшего кандидата, использует специализированных судей по визуальным, аудио и контекстуальным критериям, а затем переписывает подсказку с помощью … Читать далее

OpenAI представляет ChatGPT Atlas: браузер на базе Chromium с встроенным ИИ-агентом

Компания OpenAI только что выпустила ChatGPT Atlas — новый браузер с искусственным интеллектом, в котором ChatGPT встроен в основу навигации, поиска и помощи на страницах. Atlas доступен сегодня для пользователей тарифов Free, Plus, Pro и Go, а также в бета-версии для бизнес-пользователей и в версиях для предприятий и образовательных учреждений; сборки для Windows, iOS и … Читать далее

Как создать интеллектуальную мультиагентную систему с помощью AutoGen, LangChain и Hugging Face

В этом руководстве мы погружаемся в суть агентского ИИ, объединяя LangChain, AutoGen и Hugging Face в единый, полностью функциональный фреймворк, который работает без платных API. Шаг 1: настройка среды Мы начинаем с настройки облегчённого конвейера с открытым исходным кодом, а затем переходим к структурированному рассуждению, многошаговым рабочим процессам и взаимодействию агентов. Используем Hugging Face FLAN-T5 … Читать далее

Экономический план OpenAI для Японии: как использовать ИИ для стимулирования инноваций

В экономическом плане OpenAI для Японии описывается, как страна может использовать искусственный интеллект для активизации инноваций, повышения конкурентоспособности и обеспечения устойчивого и инклюзивного роста. План OpenAI подчёркивает потенциал ИИ в различных секторах экономики Японии, предлагая стратегии для интеграции технологий в существующие бизнес-модели и разработки новых. Это включает в себя не только технологические инновации, но и … Читать далее

Представляем ChatGPT Atlas — браузер с встроенным ChatGPT.

ChatGPT Atlas — это браузер, в котором есть ChatGPT. Получайте мгновенные ответы, краткие содержания и интеллектуальную помощь в интернете — прямо с любой страницы. Вы можете управлять настройками конфиденциальности. Доступен сейчас для MacOS. 1. Какие основные функции ChatGPT Atlas, отличающие его от других браузеров? Ответ: ChatGPT Atlas позволяет получать мгновенные ответы, краткие содержания и интеллектуальную … Читать далее

Google AI Research выпускает DeepSomatic: новую модель ИИ для выявления генетических вариантов раковых клеток

Команда исследователей из Google Research и UC Santa Cruz выпустила модель ИИ DeepSomatic, которая выявляет генетические варианты раковых клеток. В сотрудничестве с Children’s Mercy она обнаружила 10 вариантов в клетках детского лейкоза, которые были пропущены другими инструментами. DeepSomatic имеет инструмент для выявления малых соматических вариантов в геномах рака, который работает с короткими прочтениями Illumina, длинными … Читать далее