Лимит памяти ChatGPT разочаровывает — мозг подсказывает решение

Если вы активно пользуетесь ChatGPT, то могли столкнуться с неприятным сообщением «Память заполнена». Оно появляется, когда вы достигаете лимита сохранённых воспоминаний ChatGPT, и может стать серьёзным препятствием для выполнения длительных проектов. Проблема с лимитом памяти ChatGPT Основная проблема не в том, что существует лимит памяти — даже пользователи ChatGPT Plus понимают, что есть практические ограничения … Читать далее

Яндекс выпустил Alchemist: компактный набор данных для тонкой настройки под контролем учителя для повышения качества моделей генерации текста в изображение

Несмотря на значительный прогресс в генерации текста в изображение (T2I), достигнутый благодаря таким моделям, как DALL-E 3, Imagen 3 и Stable Diffusion 3, достижение стабильного качества выходных данных — как с точки зрения эстетики, так и согласованности — остаётся сложной задачей. Хотя крупномасштабное предварительное обучение предоставляет общие знания, этого недостаточно для достижения высокого эстетического качества … Читать далее

Предотвращение «галлюцинаций» ИИ: руководство по борьбе с ними

Введение ИИ революционизирует работу практически во всех отраслях. Он делает нас более эффективными, продуктивными и — при правильном внедрении — лучше выполняющими свою работу. Но по мере того, как наша зависимость от этой новой технологии стремительно растёт, мы должны помнить об одном простом факте: ИИ не безошибочен. Его результаты не стоит принимать за чистую монету, … Читать далее

«Защищённые» изображения легче украсть с помощью ИИ

Новое исследование показывает, что инструменты для водяных знаков, предназначенные для блокировки редактирования изображений с помощью ИИ, могут иметь обратный эффект. Вместо того чтобы останавливать такие модели, как Stable Diffusion, от внесения изменений, некоторые средства защиты помогают ИИ более точно следовать указаниям по редактированию, упрощая нежелательные манипуляции. Литература по компьютерному зрению В литературе по компьютерному зрению … Читать далее

Создание интеллектуальных мультиагентных рабочих процессов с помощью функции передачи задач в Mistral Agents API

В этом руководстве мы рассмотрим, как создавать интеллектуальные мультиагентные рабочие процессы с помощью функции передачи задач в Mistral Agents API. Это позволяет различным агентам работать вместе, передавая задачи друг другу, что позволяет решать сложные задачи модульным и эффективным способом. Мы создадим систему, в которой агенты сотрудничают для ответа на вопросы, связанные с инфляцией — выполняют … Читать далее

ALPHAONE: универсальная система управления рассуждениями в моделях искусственного интеллекта во время тестирования

Большие модели рассуждений, часто основанные на больших языковых моделях, всё чаще используются для решения сложных задач в математике, научном анализе и генерации кода. Основная идея заключается в имитации двух типов мышления: быстрых ответов для простых рассуждений и обдуманных, более медленных размышлений для более сложных задач. Это двоякое мышление отражает то, как люди переходят от интуитивных … Читать далее

Почему основная ставка Meta в сфере ИИ — это не модели, а данные

Компания Meta объявила об инвестициях в размере $10 миллиардов в компанию Scale AI. Это не просто очередной раунд финансирования — это сигнал о фундаментальной стратегической эволюции в подходе технологических гигантов к гонке вооружений в сфере ИИ. Цифры и факты: * Потенциальные инвестиции Meta в Scale AI: $10 миллиардов.* Рост выручки Scale AI: с $870 миллионов … Читать далее

Выбор токенов с высокой энтропией в обучении с подкреплением с верифицируемыми вознаграждениями (RLVR) повышает точность и снижает затраты на обучение для больших языковых моделей (LLMs)

Большие языковые модели (LLMs) генерируют пошаговые ответы, известные как «цепочка мыслей» (CoT), где каждый токен способствует созданию связного и логического повествования. Для повышения качества рассуждений применяются различные методы обучения с подкреплением. Эти методы позволяют модели учиться на основе механизмов обратной связи, сопоставляя сгенерированные выходные данные с критериями корректности. Проблема равномерного отношения ко всем выходным токенам … Читать далее

Как создать асинхронную сеть агентов искусственного интеллекта с помощью Gemini для задач исследования, анализа и валидации

В этом руководстве мы познакомим вас с протоколом Gemini Agent Network — мощным и гибким фреймворком, предназначенным для интеллектуального взаимодействия между специализированными агентами искусственного интеллекта. Используя модели Google Gemini, протокол облегчает динамическую связь между агентами, каждый из которых выполняет определённые роли: Анализатор, Исследователь, Синтезатор и Валидатор. Пользователи научатся настраивать асинхронную сеть агентов, что позволит автоматизировать … Читать далее

Google представляет полнофункциональный стек агентов искусственного интеллекта с открытым исходным кодом на базе Gemini 2.5 и LangGraph для многоэтапного веб-поиска, рефлексии и синтеза

Введение: необходимость в динамических помощниках для исследований в области ИИ Конверсационный ИИ быстро вышел за рамки базовых фреймворков чат-ботов. Однако большинство крупных языковых моделей (LLM) всё ещё страдают от критического ограничения — они генерируют ответы, основываясь только на статических обучающих данных, не имея возможности самостоятельно выявлять пробелы в знаниях или выполнять синтез информации в реальном … Читать далее

Страхование ответственности за использование искусственного интеллекта: следующий шаг в защите бизнеса от сбоев ИИ

Сегодня бизнес во многом полагается на искусственный интеллект (ИИ) для выполнения важных задач, таких как обработка вопросов клиентов, выявление финансовых рисков, управление цепочками поставок и поддержка медицинских решений. ИИ помогает повысить скорость и точность, но также несёт в себе риски, которые не покрываются старыми страховыми полисами. ИИ может принимать неверные решения, предоставлять ложную информацию или … Читать далее

Список серверов, поддерживающих Model Context Protocol (MCP)

Model Context Protocol (MCP) — это стандартизированный и безопасный интерфейс, который позволяет моделям искусственного интеллекта взаимодействовать с внешними инструментами через протокол на основе JSON-RPC 2.0. MCP был представлен компанией Anthropic в ноябре 2024 года. На данный момент его поддерживают Claude, Gemini и OpenAI, а также он быстро внедряется на таких платформах, как Replit, Sourcegraph и … Читать далее

Генеративный искусственный интеллект для количественной оценки неопределённости в прогнозировании погоды

Автор: Лизао (Ларри) Ли, инженер-программист, и Роб Карвер, научный сотрудник, Google Research Точные прогнозы погоды могут напрямую влиять на жизнь людей: от помощи в принятии повседневных решений, например, что взять с собой на прогулку, до информирования о срочных действиях, например, защиты людей в опасных погодных условиях. Значение точных и своевременных прогнозов погоды будет только возрастать … Читать далее

Защита от внедрения запросов (Prompt Injection) с помощью структурированных запросов (StruQ) и оптимизации предпочтений (SecAlign)

Введение Недавние достижения в области больших языковых моделей (LLM) открывают новые возможности для приложений, интегрированных с LLM. Однако с улучшением LLM растут и атаки на них. Одной из основных угроз для приложений, интегрированных с LLM, является атака внедрения запросов (Prompt Injection), при которой входные данные LLM содержат доверенную подсказку (инструкцию) и недоверенные данные. Данные могут … Читать далее

Обучение моделей ИИ тому, чего они не знают

Системы искусственного интеллекта, такие как ChatGPT, дают правдоподобные ответы на любые вопросы. Однако они не всегда показывают пробелы в своих знаниях или области, в которых они не уверены. Эта проблема может иметь серьёзные последствия, поскольку ИИ-системы всё чаще используются для разработки лекарств, синтеза информации и управления автономными транспортными средствами. Компания Themis AI, созданная на базе … Читать далее

Как включить вызов функций в Mistral Agents с помощью стандартного формата JSON Schema

В этом руководстве мы покажем, как включить вызов функций в Mistral Agents с помощью стандартного формата JSON Schema. Определив входные параметры вашей функции с помощью чёткой схемы, вы сможете сделать свои пользовательские инструменты легко вызываемыми агентом, что обеспечит мощные динамические взаимодействия. Мы будем использовать AviationStack API для получения данных о статусе рейсов в режиме реального … Читать далее

Встречайте BioReason: первая в мире модель рассуждений в биологии, которая позволяет ИИ рассуждать о геномике как эксперт-биолог

Одним из серьёзных препятствий для использования ИИ в геномике является отсутствие интерпретируемых пошаговых рассуждений на основе сложных данных ДНК. Хотя модели, основанные на ДНК, превосходно обучаются выявлению сложных закономерностей последовательностей для таких задач, как предсказание вариантов и регуляция генов, они часто работают как «чёрные ящики», предлагая ограниченное понимание лежащих в основе биологических механизмов. В то … Читать далее

Google AI представляет систему поиска для мультиагентных систем — MASS

Введение в систему MASS Мультиагентные системы становятся ключевым направлением в искусственном интеллекте благодаря своей способности координировать несколько больших языковых моделей (LLM) для решения сложных задач. Вместо того чтобы полагаться на одну модель, эти системы распределяют роли между агентами, каждый из которых выполняет уникальную функцию. Это повышает способность системы анализировать, реагировать и действовать более эффективно. Применение … Читать далее

Исследователи ByteDance представили DetailFlow: одномерный авторегрессионный фреймворк для более быстрой и экономичной генерации изображений

Генерация изображений с помощью авторегрессионных моделей развивалась благодаря достижениям в области последовательного моделирования, изначально применявшимся в обработке естественного языка. В этой области основное внимание уделяется созданию изображений по одному токену за раз, подобно тому как строятся предложения в языковых моделях. Преимущество этого подхода заключается в способности поддерживать структурную согласованность изображения, одновременно обеспечивая высокий уровень контроля … Читать далее

Подробное руководство по кодированию для расширенной интеграции SerpAPI с Google Gemini-1.5-Flash для расширенной аналитики

В этом руководстве мы покажем, как объединить возможности поиска Google с помощью SerpAPI с моделью Google Gemini-1.5-Flash для создания расширенного рабочего процесса исследований и анализа в блокноте Google Colab. Определив класс AdvancedSerpAPI на Python, пользователи получают доступ к расширенным методам поиска, которые охватывают общие веб-результаты, новостные статьи и изображения, а также используют Gemini для глубокого … Читать далее

Повышение доверия к ИИ: программы обучения помогают устранить пробелы в знаниях

ИИ меняет рынок труда с головокружительной скоростью, однако усилия по обучению не поспевают за этим процессом. Несмотря на то что четверть руководителей компаний оптимистично настроены по отношению к технологиям, только 12% работников прошли обучение по ИИ за последний год. Отсутствие подготовки не только мешает успешному и безопасному внедрению ИИ, но и создаёт неуверенность среди сотрудников … Читать далее

Машина Дарвина-Гёделя: самосовершенствующийся ИИ-агент, который развивает код с помощью базовых моделей и реальных тестов

Введение: ограничения традиционных систем ИИ Традиционные системы искусственного интеллекта ограничены статичной архитектурой. Эти модели работают в рамках фиксированных, созданных человеком структур и не могут автономно совершенствоваться после внедрения. В отличие от этого, научный прогресс человечества итеративен и кумулятивен — каждое достижение строится на основе предыдущих открытий. Вдохновлённые этой моделью непрерывного совершенствования, исследователи ИИ изучают эволюционные … Читать далее

Обзор SciSummary: я суммировал исследование за секунды

Введение Если вы когда-нибудь смотрели на длинную научную статью и думали: «Сегодня я это точно не осилю», то вы не одиноки. Учёные часто сталкиваются с трудностями, пытаясь угнаться за растущим объёмом исследований в своих областях. SciSummary — это не просто ещё один инструмент искусственного интеллекта (ИИ) с общими результатами. Он создан специально для того, чтобы … Читать далее

Как добиться от ChatGPT более естественного общения

Чат-боты вроде ChatGPT часто льстят пользователям, дают расплывчатые ответы или используют жаргон, чтобы выглядеть умнее. Новые исследования показывают, что эти привычки формируются не только из-за моделей, но и из-за того, как люди их обучают: модели учатся копировать стиль ответов, которые нравятся людям, даже если эти ответы пустые или вводят в заблуждение. Проблема трёх F Недавно … Читать далее

Что ждёт нас после развития больших языковых моделей: человекоцентричный ИИ, пространственный интеллект и будущее практики

В недавнем выпуске программы High Signal мы поговорили с доктором Фэй-Фэй Ли о том, что на самом деле значит создавать человекоцентричный ИИ и куда эта область может двигаться дальше. Фэй-Фэй не описывает ИИ как функцию или даже отрасль. Она называет его «технологией цивилизации» — силой, основополагающей, как электричество или само вычисление. Это имеет серьёзные последствия … Читать далее

Дилемма контроля над искусственным интеллектом: риски и решения

Мы находимся на поворотном этапе, когда системы искусственного интеллекта начинают работать вне контроля человека. Эти системы способны писать собственный код, оптимизировать свою производительность и принимать решения, которые даже их создатели иногда не могут полностью объяснить. Самосовершенствующиеся системы искусственного интеллекта могут улучшать себя без необходимости прямого участия человека для выполнения задач, которые трудно контролировать. Однако этот … Читать далее

Команда Alibaba Qwen выпустила серии Qwen3-Embedding и Qwen3-Reranker — новые стандарты для многоязычного встраивания и ранжирования

Встраивание текста и ранжирование являются основой современных систем поиска информации, обеспечивая работу таких приложений, как семантический поиск, рекомендательные системы и генерация с извлечением информации (RAG). Однако современные подходы часто сталкиваются с ключевыми проблемами, особенно в достижении высокой точности для нескольких языков и адаптивности к задачам без использования проприетарных API. Qwen3-Embedding и Qwen3-Reranker: новый стандарт для … Читать далее

Исследователи из Университета Южной Калифорнии представили SUM (Synthetic Unanswerable Math)

Исследователи из Университета Южной Калифорнии разработали синтетический набор данных SUM (Synthetic Unanswerable Math). Он помогает уменьшить количество «галлюцинаций» в больших языковых моделях (LLMs) с помощью подкрепляющей точной настройки (Reinforcement Fine-tuning). Подкрепляющая точная настройка Подкрепляющая точная настройка использует сигналы вознаграждения, чтобы направить большую языковую модель к желаемому поведению. Этот метод повышает способность модели выдавать логичные и … Читать далее

Cursor AI достигает оценки в 9,9 миллиарда долларов, привлекая финансирование в размере 900 миллионов долларов

Компания Anysphere, стоящая за разработкой AI-редактора кода Cursor, объявила о значительном раунде финансирования в размере 900 миллионов долларов, что привело к оценке стартапа в 9,9 миллиарда долларов. Раунд возглавил Thrive Capital при участии Andreessen Horowitz, Accel и DST Global — все они вернулись, удвоив свои ставки на то, что многие называют самым многообещающим на сегодняшний … Читать далее

Как мы реагируем на требования The New York Times о данных для защиты конфиденциальности пользователей

Компания OpenAI противодействует решению суда по требованию The New York Times и истцов, которое предусматривает неограниченное хранение данных пользователей ChatGPT и API. Узнайте, как мы работаем над сохранением конфиденциальности пользователей, выполнением юридических требований и соблюдением наших обязательств по защите данных. Источник