Система управления с поддержкой ИИ помогает автономным дронам сохранять курс в неопределённых условиях

Автономный дрон, доставляющий воду для тушения лесных пожаров в Сьерра-Неваде, может столкнуться со свирепыми ветрами Санта-Ана, которые угрожают сбить его с курса. Быстрая адаптация к таким неизвестным возмущениям в полёте представляет огромную сложность для системы управления дроном. Адаптивный алгоритм управления на основе машинного обучения Чтобы помочь дрону сохранять курс, исследователи из Массачусетского технологического института (MIT) … Читать далее

Представления о будущем: технологии здравоохранения, которые могут оставить некоторых позади

Может ли идеальный шторм из революционных технологий здравоохранения на основе искусственного интеллекта и стремления к увеличению прибыли за счёт подписных моделей оттолкнуть уязвимых пациентов? Третий год подряд MIT вручает приз за лучшее описание будущего компьютерных технологий. Студентам предлагается в 3000 слов или меньше рассказать, как достижения в области вычислений могут изменить общество к лучшему или … Читать далее

Помогая машинам понимать визуальный контент с помощью ИИ

Данные должны лежать в основе каждого решения, которое принимает современный бизнес. Но у большинства компаний есть серьёзная проблема: они не знают, что происходит с их визуальными данными. Компания Coactive работает над тем, чтобы изменить эту ситуацию. Основанная Коди Коулманом (Cody Coleman) и Уильямом Гавириа Рохасом (William Gaviria Rojas), она создала платформу на базе искусственного интеллекта, … Читать далее

Яндекс выпустил Alchemist: компактный набор данных для тонкой настройки под контролем учителя для повышения качества моделей генерации текста в изображение

Несмотря на значительный прогресс в генерации текста в изображение (T2I), достигнутый благодаря таким моделям, как DALL-E 3, Imagen 3 и Stable Diffusion 3, достижение стабильного качества выходных данных — как с точки зрения эстетики, так и согласованности — остаётся сложной задачей. Крупномасштабное предварительное обучение даёт общие знания, но этого недостаточно для достижения высокого эстетического качества … Читать далее

Лимит памяти ChatGPT разочаровывает — мозг подсказывает решение

Если вы активно пользуетесь ChatGPT, то могли столкнуться с неприятным сообщением «Память заполнена». Оно появляется, когда вы достигаете лимита сохранённых воспоминаний ChatGPT, и может стать серьёзным препятствием для выполнения длительных проектов. Проблема с лимитом памяти ChatGPT Основная проблема не в том, что существует лимит памяти — даже пользователи ChatGPT Plus понимают, что есть практические ограничения … Читать далее

Яндекс выпустил Alchemist: компактный набор данных для тонкой настройки под контролем учителя для повышения качества моделей генерации текста в изображение

Несмотря на значительный прогресс в генерации текста в изображение (T2I), достигнутый благодаря таким моделям, как DALL-E 3, Imagen 3 и Stable Diffusion 3, достижение стабильного качества выходных данных — как с точки зрения эстетики, так и согласованности — остаётся сложной задачей. Хотя крупномасштабное предварительное обучение предоставляет общие знания, этого недостаточно для достижения высокого эстетического качества … Читать далее

Предотвращение «галлюцинаций» ИИ: руководство по борьбе с ними

Введение ИИ революционизирует работу практически во всех отраслях. Он делает нас более эффективными, продуктивными и — при правильном внедрении — лучше выполняющими свою работу. Но по мере того, как наша зависимость от этой новой технологии стремительно растёт, мы должны помнить об одном простом факте: ИИ не безошибочен. Его результаты не стоит принимать за чистую монету, … Читать далее

«Защищённые» изображения легче украсть с помощью ИИ

Новое исследование показывает, что инструменты для водяных знаков, предназначенные для блокировки редактирования изображений с помощью ИИ, могут иметь обратный эффект. Вместо того чтобы останавливать такие модели, как Stable Diffusion, от внесения изменений, некоторые средства защиты помогают ИИ более точно следовать указаниям по редактированию, упрощая нежелательные манипуляции. Литература по компьютерному зрению В литературе по компьютерному зрению … Читать далее

Создание интеллектуальных мультиагентных рабочих процессов с помощью функции передачи задач в Mistral Agents API

В этом руководстве мы рассмотрим, как создавать интеллектуальные мультиагентные рабочие процессы с помощью функции передачи задач в Mistral Agents API. Это позволяет различным агентам работать вместе, передавая задачи друг другу, что позволяет решать сложные задачи модульным и эффективным способом. Мы создадим систему, в которой агенты сотрудничают для ответа на вопросы, связанные с инфляцией — выполняют … Читать далее

ALPHAONE: универсальная система управления рассуждениями в моделях искусственного интеллекта во время тестирования

Большие модели рассуждений, часто основанные на больших языковых моделях, всё чаще используются для решения сложных задач в математике, научном анализе и генерации кода. Основная идея заключается в имитации двух типов мышления: быстрых ответов для простых рассуждений и обдуманных, более медленных размышлений для более сложных задач. Это двоякое мышление отражает то, как люди переходят от интуитивных … Читать далее

Почему основная ставка Meta в сфере ИИ — это не модели, а данные

Компания Meta объявила об инвестициях в размере $10 миллиардов в компанию Scale AI. Это не просто очередной раунд финансирования — это сигнал о фундаментальной стратегической эволюции в подходе технологических гигантов к гонке вооружений в сфере ИИ. Цифры и факты: * Потенциальные инвестиции Meta в Scale AI: $10 миллиардов.* Рост выручки Scale AI: с $870 миллионов … Читать далее

Выбор токенов с высокой энтропией в обучении с подкреплением с верифицируемыми вознаграждениями (RLVR) повышает точность и снижает затраты на обучение для больших языковых моделей (LLMs)

Большие языковые модели (LLMs) генерируют пошаговые ответы, известные как «цепочка мыслей» (CoT), где каждый токен способствует созданию связного и логического повествования. Для повышения качества рассуждений применяются различные методы обучения с подкреплением. Эти методы позволяют модели учиться на основе механизмов обратной связи, сопоставляя сгенерированные выходные данные с критериями корректности. Проблема равномерного отношения ко всем выходным токенам … Читать далее

Как создать асинхронную сеть агентов искусственного интеллекта с помощью Gemini для задач исследования, анализа и валидации

В этом руководстве мы познакомим вас с протоколом Gemini Agent Network — мощным и гибким фреймворком, предназначенным для интеллектуального взаимодействия между специализированными агентами искусственного интеллекта. Используя модели Google Gemini, протокол облегчает динамическую связь между агентами, каждый из которых выполняет определённые роли: Анализатор, Исследователь, Синтезатор и Валидатор. Пользователи научатся настраивать асинхронную сеть агентов, что позволит автоматизировать … Читать далее

Google представляет полнофункциональный стек агентов искусственного интеллекта с открытым исходным кодом на базе Gemini 2.5 и LangGraph для многоэтапного веб-поиска, рефлексии и синтеза

Введение: необходимость в динамических помощниках для исследований в области ИИ Конверсационный ИИ быстро вышел за рамки базовых фреймворков чат-ботов. Однако большинство крупных языковых моделей (LLM) всё ещё страдают от критического ограничения — они генерируют ответы, основываясь только на статических обучающих данных, не имея возможности самостоятельно выявлять пробелы в знаниях или выполнять синтез информации в реальном … Читать далее

Страхование ответственности за использование искусственного интеллекта: следующий шаг в защите бизнеса от сбоев ИИ

Сегодня бизнес во многом полагается на искусственный интеллект (ИИ) для выполнения важных задач, таких как обработка вопросов клиентов, выявление финансовых рисков, управление цепочками поставок и поддержка медицинских решений. ИИ помогает повысить скорость и точность, но также несёт в себе риски, которые не покрываются старыми страховыми полисами. ИИ может принимать неверные решения, предоставлять ложную информацию или … Читать далее

Список серверов, поддерживающих Model Context Protocol (MCP)

Model Context Protocol (MCP) — это стандартизированный и безопасный интерфейс, который позволяет моделям искусственного интеллекта взаимодействовать с внешними инструментами через протокол на основе JSON-RPC 2.0. MCP был представлен компанией Anthropic в ноябре 2024 года. На данный момент его поддерживают Claude, Gemini и OpenAI, а также он быстро внедряется на таких платформах, как Replit, Sourcegraph и … Читать далее

Генеративный искусственный интеллект для количественной оценки неопределённости в прогнозировании погоды

Автор: Лизао (Ларри) Ли, инженер-программист, и Роб Карвер, научный сотрудник, Google Research Точные прогнозы погоды могут напрямую влиять на жизнь людей: от помощи в принятии повседневных решений, например, что взять с собой на прогулку, до информирования о срочных действиях, например, защиты людей в опасных погодных условиях. Значение точных и своевременных прогнозов погоды будет только возрастать … Читать далее

Защита от внедрения запросов (Prompt Injection) с помощью структурированных запросов (StruQ) и оптимизации предпочтений (SecAlign)

Введение Недавние достижения в области больших языковых моделей (LLM) открывают новые возможности для приложений, интегрированных с LLM. Однако с улучшением LLM растут и атаки на них. Одной из основных угроз для приложений, интегрированных с LLM, является атака внедрения запросов (Prompt Injection), при которой входные данные LLM содержат доверенную подсказку (инструкцию) и недоверенные данные. Данные могут … Читать далее

Обучение моделей ИИ тому, чего они не знают

Системы искусственного интеллекта, такие как ChatGPT, дают правдоподобные ответы на любые вопросы. Однако они не всегда показывают пробелы в своих знаниях или области, в которых они не уверены. Эта проблема может иметь серьёзные последствия, поскольку ИИ-системы всё чаще используются для разработки лекарств, синтеза информации и управления автономными транспортными средствами. Компания Themis AI, созданная на базе … Читать далее

Как включить вызов функций в Mistral Agents с помощью стандартного формата JSON Schema

В этом руководстве мы покажем, как включить вызов функций в Mistral Agents с помощью стандартного формата JSON Schema. Определив входные параметры вашей функции с помощью чёткой схемы, вы сможете сделать свои пользовательские инструменты легко вызываемыми агентом, что обеспечит мощные динамические взаимодействия. Мы будем использовать AviationStack API для получения данных о статусе рейсов в режиме реального … Читать далее

Встречайте BioReason: первая в мире модель рассуждений в биологии, которая позволяет ИИ рассуждать о геномике как эксперт-биолог

Одним из серьёзных препятствий для использования ИИ в геномике является отсутствие интерпретируемых пошаговых рассуждений на основе сложных данных ДНК. Хотя модели, основанные на ДНК, превосходно обучаются выявлению сложных закономерностей последовательностей для таких задач, как предсказание вариантов и регуляция генов, они часто работают как «чёрные ящики», предлагая ограниченное понимание лежащих в основе биологических механизмов. В то … Читать далее

Google AI представляет систему поиска для мультиагентных систем — MASS

Введение в систему MASS Мультиагентные системы становятся ключевым направлением в искусственном интеллекте благодаря своей способности координировать несколько больших языковых моделей (LLM) для решения сложных задач. Вместо того чтобы полагаться на одну модель, эти системы распределяют роли между агентами, каждый из которых выполняет уникальную функцию. Это повышает способность системы анализировать, реагировать и действовать более эффективно. Применение … Читать далее

Исследователи ByteDance представили DetailFlow: одномерный авторегрессионный фреймворк для более быстрой и экономичной генерации изображений

Генерация изображений с помощью авторегрессионных моделей развивалась благодаря достижениям в области последовательного моделирования, изначально применявшимся в обработке естественного языка. В этой области основное внимание уделяется созданию изображений по одному токену за раз, подобно тому как строятся предложения в языковых моделях. Преимущество этого подхода заключается в способности поддерживать структурную согласованность изображения, одновременно обеспечивая высокий уровень контроля … Читать далее

Подробное руководство по кодированию для расширенной интеграции SerpAPI с Google Gemini-1.5-Flash для расширенной аналитики

В этом руководстве мы покажем, как объединить возможности поиска Google с помощью SerpAPI с моделью Google Gemini-1.5-Flash для создания расширенного рабочего процесса исследований и анализа в блокноте Google Colab. Определив класс AdvancedSerpAPI на Python, пользователи получают доступ к расширенным методам поиска, которые охватывают общие веб-результаты, новостные статьи и изображения, а также используют Gemini для глубокого … Читать далее

Повышение доверия к ИИ: программы обучения помогают устранить пробелы в знаниях

ИИ меняет рынок труда с головокружительной скоростью, однако усилия по обучению не поспевают за этим процессом. Несмотря на то что четверть руководителей компаний оптимистично настроены по отношению к технологиям, только 12% работников прошли обучение по ИИ за последний год. Отсутствие подготовки не только мешает успешному и безопасному внедрению ИИ, но и создаёт неуверенность среди сотрудников … Читать далее

Машина Дарвина-Гёделя: самосовершенствующийся ИИ-агент, который развивает код с помощью базовых моделей и реальных тестов

Введение: ограничения традиционных систем ИИ Традиционные системы искусственного интеллекта ограничены статичной архитектурой. Эти модели работают в рамках фиксированных, созданных человеком структур и не могут автономно совершенствоваться после внедрения. В отличие от этого, научный прогресс человечества итеративен и кумулятивен — каждое достижение строится на основе предыдущих открытий. Вдохновлённые этой моделью непрерывного совершенствования, исследователи ИИ изучают эволюционные … Читать далее

Обзор SciSummary: я суммировал исследование за секунды

Введение Если вы когда-нибудь смотрели на длинную научную статью и думали: «Сегодня я это точно не осилю», то вы не одиноки. Учёные часто сталкиваются с трудностями, пытаясь угнаться за растущим объёмом исследований в своих областях. SciSummary — это не просто ещё один инструмент искусственного интеллекта (ИИ) с общими результатами. Он создан специально для того, чтобы … Читать далее

Как добиться от ChatGPT более естественного общения

Чат-боты вроде ChatGPT часто льстят пользователям, дают расплывчатые ответы или используют жаргон, чтобы выглядеть умнее. Новые исследования показывают, что эти привычки формируются не только из-за моделей, но и из-за того, как люди их обучают: модели учатся копировать стиль ответов, которые нравятся людям, даже если эти ответы пустые или вводят в заблуждение. Проблема трёх F Недавно … Читать далее

Что ждёт нас после развития больших языковых моделей: человекоцентричный ИИ, пространственный интеллект и будущее практики

В недавнем выпуске программы High Signal мы поговорили с доктором Фэй-Фэй Ли о том, что на самом деле значит создавать человекоцентричный ИИ и куда эта область может двигаться дальше. Фэй-Фэй не описывает ИИ как функцию или даже отрасль. Она называет его «технологией цивилизации» — силой, основополагающей, как электричество или само вычисление. Это имеет серьёзные последствия … Читать далее

Дилемма контроля над искусственным интеллектом: риски и решения

Мы находимся на поворотном этапе, когда системы искусственного интеллекта начинают работать вне контроля человека. Эти системы способны писать собственный код, оптимизировать свою производительность и принимать решения, которые даже их создатели иногда не могут полностью объяснить. Самосовершенствующиеся системы искусственного интеллекта могут улучшать себя без необходимости прямого участия человека для выполнения задач, которые трудно контролировать. Однако этот … Читать далее