OThink-R1: фреймворк для рассуждений в двух режимах, позволяющий сократить избыточные вычисления в больших языковых моделях

Неэффективность статического подхода «цепочка мыслей» в больших языковых моделях (LRM) Недавние достижения LRM обусловлены использованием детального подхода «цепочка мыслей» (CoT) для решения сложных задач. Однако многие простые задачи можно решить с помощью более компактных моделей с меньшим количеством токенов, что делает такие сложные рассуждения ненужными. Это перекликается с человеческим мышлением, где мы используем быстрые, интуитивные … Читать далее

Создание приложений на базе искусственного интеллекта с использованием рабочего процесса «План → Файлы → Код» в TinyDev

В этом руководстве мы познакомим вас с реализацией класса TinyDev — минималистичным, но мощным инструментом для генерации кода на основе искусственного интеллекта, который использует Gemini API для преобразования простых идей приложений в комплексные структурированные приложения. TinyDev разработан так, чтобы без проблем работать в Notebook, и следует чёткому трёхэтапному рабочему процессу — План → Файлы → … Читать далее

Рекламный ролик, созданный с помощью ИИ Google Veo3, показан во время финала НБА, сократив производственные затраты на 95%

Одинокий режиссёр-ИИ, передовая генеративная видеомодель и рекламный ролик национального масштаба во время одного из крупнейших спортивных событий года. Это не сюжет научно-фантастического фильма — это новая реальность рекламы, созданная всего за 3 дня. TLDR: Впервые в мире: рекламный ролик для платформы ставок на события Kalshi был создан с помощью генеративной видеомодели Google Veo3 и показан … Читать далее

Microsoft представляет Code Researcher: агент глубокого исследования для работы с кодом крупных систем и историей коммитов

Рост автономных агентов кодирования в отладке системного программного обеспечения Использование искусственного интеллекта в разработке программного обеспечения стало более популярным с появлением больших языковых моделей (LLMs). Эти модели способны выполнять задачи, связанные с кодированием. Это привело к созданию автономных агентов кодирования, которые помогают или даже автоматизируют задачи, традиционно выполняемые разработчиками. Агенты варьируются от простых скриптов до … Читать далее

Максимизация внутренней согласованности (ICM): фреймворк для обучения языковых моделей без использования меток и без надзора

Методы постобучения предварительно обученных языковых моделей (LM) зависят от контроля со стороны человека через демонстрации или обратную связь по предпочтениям для определения желаемого поведения. Однако этот подход сталкивается с критическими ограничениями, поскольку задачи и поведение моделей становятся очень сложными. В таких сценариях человеческий контроль ненадёжен, поскольку LM учатся имитировать ошибки в демонстрациях или использовать недостатки … Читать далее

MemOS: операционная система, ориентированная на память, для развивающихся и адаптивных больших языковых моделей

Большие языковые модели (LLMs) всё чаще рассматриваются как ключ к достижению общего искусственного интеллекта (AGI), однако они сталкиваются с серьёзными ограничениями в управлении памятью. Большинство LLMs полагаются на фиксированные знания, хранящиеся в их весах, и краткосрочный контекст во время использования, что затрудняет сохранение и обновление информации с течением времени. Такие методы, как RAG, пытаются включить … Читать далее

Sakana AI представляет Text-to-LoRA (T2L): гиперсеть, генерирующую адаптеры LLM для конкретных задач на основе текстового описания задачи

Модели-трансформеры значительно повлияли на подход систем искусственного интеллекта к задачам в области понимания естественного языка, перевода и логического вывода. Эти крупномасштабные модели, особенно большие языковые модели (LLM), стали настолько большими и сложными, что охватывают широкие возможности в различных областях. Однако применение этих моделей для новых специализированных задач остаётся сложной операцией. Каждое новое приложение обычно требует … Читать далее

На конференции CVPR 2025 представлена работа Google DeepMind: технология «Motion Prompting» открывает новые возможности для управления видео

Основные выводы Исследователи из Google DeepMind, Мичиганского университета и Университета Брауна разработали технологию «Motion Prompting» — новый метод управления генерацией видео с помощью определённых траекторий движения. Как это работает Технология использует «моушн-промпты» — гибкое представление движения, которое может быть разреженным или плотным. Это позволяет направлять предварительно обученную модель диффузии видео. Ключевым нововведением является «расширение моушн-промптов», … Читать далее

Открытые мысли: масштабируемый механизм тонкой настройки под контролем для моделей рассуждений

Рост сложности работы с данными для рассуждений Недавние модели рассуждений, такие как DeepSeek-R1 и o3, показали выдающуюся производительность в математических, кодировочных и научных областях, используя методы пост-тренировки, такие как контролируемая тонкая настройка (SFT) и обучение с подкреплением (RL). Однако полные методологии, лежащие в основе этих передовых моделей рассуждений, не являются общедоступными, что затрудняет исследования по … Читать далее

Шесть новых функций в проектах ChatGPT, о которых нужно знать

ChatGPT Projects только что получили наиболее значительное обновление с момента запуска, и это существенно влияет на производительность. OpenAI модернизировала функцию проектов, добавив несколько важных инструментов, которые должны повысить вашу продуктивность при использовании чат-бота. Для тех, кто использует проекты для организации исследований, управления репозиториями кода или координации сложной творческой работы, эти шесть новых функций кардинально меняют … Читать далее

Хакоб Астабацян, соучредитель и генеральный директор Synthflow — серия интервью

Хакоб Астабацян, соучредитель и генеральный директор Synthflow, возглавляет разработку передовых технологий искусственного интеллекта (ИИ) для голосового взаимодействия, которые помогают компаниям автоматизировать звонки клиентов с человекоподобной реакцией. Хакоб основал Synthflow в 2023 году в Берлине с целью сделать продвинутый разговорный ИИ доступным для компаний любого размера. Под его руководством Synthflow быстро расширился в Германии и США, … Читать далее

Будущее рекламы после захвата трафика искусственным интеллектом

Крупные языковые модели постепенно вытесняют традиционный поиск, не только более точно отвечая на запросы, но и трансформируя сам интерфейс в огороженное пространство — всё более востребованную нишу, которая, похоже, призвана заменить традиционные поисковые системы. За эту нишу сейчас идёт ожесточённая борьба. Может ли издательский бизнес перенести свою видимость контента в скрытое пространство чат-ботов? В статье … Читать далее

Генеративный искусственный интеллект для количественной оценки неопределённости в прогнозировании погоды

Автор: Ляо (Ларри) Ли, инженер-программист, и Роб Карвер, научный сотрудник, Google Research Точные прогнозы погоды могут напрямую влиять на жизнь людей: от помощи в принятии повседневных решений, например, что взять с собой на прогулку, до информирования о срочных действиях, например, о защите людей в опасных погодных условиях. Точность и своевременность прогнозов погоды будет только возрастать … Читать далее

Создание безопасного рабочего процесса выполнения кода с помощью Daytona SDK

В этом руководстве по использованию Daytona SDK мы пошагово покажем, как использовать безопасную среду песочницы Daytona для безопасного выполнения ненадёжного или сгенерированного искусственным интеллектом кода Python в Notebook. Начало работы Мы начнём с создания простой песочницы и выполнения базового кода, затем продемонстрируем, как изолировать процессы, установить зависимости и запустить простые скрипты, не подвергая опасности хост-среду. … Читать далее

Исследователи Apple обнаружили структурные сбои в больших моделях рассуждений с помощью оценки на основе головоломок

Искусственный интеллект претерпел значительный переход от базовых языковых моделей к продвинутым моделям, ориентированным на задачи рассуждения. Эти новые системы, известные как большие модели рассуждений (LRMs), представляют собой класс инструментов, предназначенных для имитации человеческого мышления путём выработки промежуточных шагов рассуждения перед тем, как прийти к выводам. Фокус сместился с генерации точных результатов на понимание процесса, который … Читать далее

Google AI представляет гибридную модель AI-физики для точных прогнозов региональных климатических рисков с улучшенной оценкой неопределённости

Ограничения традиционного климатического моделирования Модели земной системы — важные инструменты для прогнозирования изменений окружающей среды и подготовки к будущему. Однако их высокие требования к вычислительным ресурсам затрудняют запуск с разрешением, достаточным для детальных локальных прогнозов. Сейчас большинство моделей ограничены разрешением около 100 километров — примерно размером Гавайев. Это затрудняет создание точных прогнозов для конкретных регионов. … Читать далее

В статье представлен ИИ-проект VLM-R³: мультимодальная платформа для распознавания регионов, рассуждений и уточнения в визуально-лингвистических задачах

Мультимодальные способности к рассуждению помогают машинам выполнять такие задачи, как решение математических задач, встроенных в диаграммы, чтение знаков на фотографиях или интерпретация научных графиков. Интеграция визуальной и лингвистической информации позволяет этим системам более точно воспроизводить мыслительные процессы человека, что делает их пригодными для задач, требующих визуального толкования в сочетании с логической последовательностью. Основная проблема в … Читать далее

Интервью-серия: Денас Грибаускас, директор по управлению и стратегии в Oxylabs

Денас Грибаускас — директор по управлению и стратегии в Oxylabs, мировом лидере в области сбора веб-аналитики и премиум-решений для прокси-серверов. Oxylabs основана в 2015 году и предоставляет одну из крупнейших в мире сетей прокси-серверов с этическим источником — более 177 миллионов IP-адресов в 195 странах. Среди её продуктов — продвинутые инструменты, такие как Web Unblocker, … Читать далее

Почему большие языковые модели переусложняют простые задачи, но сдаются перед сложными

Искусственный интеллект добился значительных успехов, и большие языковые модели (LLMs) вместе с большими моделями рассуждений (LRMs) изменили представление о том, как машины обрабатывают и генерируют текст, похожий на человеческий. Эти модели могут писать эссе, отвечать на вопросы и даже решать математические задачи. Однако, несмотря на свои впечатляющие способности, они демонстрируют любопытное поведение: часто усложняют простые … Читать далее

Как ИИ гуманизирует профессиональные связи

Страх перед искусственным интеллектом (ИИ) заключается в том, что он сделает человеческий труд ненужным, заменит рабочие места, подорвёт доверие и лишит работу человеческого элемента. Это беспокойство основано на реальных данных: по данным Всемирного экономического форума, 40% работодателей ожидают сокращения численности персонала из-за автоматизации с помощью ИИ, а Goldman Sachs прогнозирует, что до 300 миллионов рабочих … Читать далее

Почему большие языковые модели пропускают инструкции и как решить эту проблему

Большие языковые модели (БЯМ) быстро стали незаменимыми инструментами искусственного интеллекта (ИИ), лежащими в основе таких приложений, как чат-боты, создание контента и помощь в программировании. Несмотря на их впечатляющие возможности, пользователи часто сталкиваются с проблемой: эти модели иногда пропускают части полученных инструкций, особенно когда инструкции длинные или содержат несколько шагов. Это приводит к неполным или неточным … Читать далее

Применение магии искусственного интеллекта в знаковых брендах Mattel

OpenAI и Mattel объединяют усилия для интеграции искусственного интеллекта в такие знаковые бренды, как Barbie и Hot Wheels. Цель этого сотрудничества — улучшить творческий процесс разработки, оптимизировать рабочие процессы и создать новые возможности для взаимодействия поклонников с брендами. 🤖✨ Источник

Meta AI выпускает V-JEPA 2: открытые самодостаточные мировые модели для понимания, прогнозирования и планирования

Компания Meta AI представила V-JEPA 2 — масштабируемую мировую модель с открытым исходным кодом, предназначенную для обучения на видео в интернет-масштабе. Модель позволяет обеспечить надёжное визуальное понимание, прогнозирование будущего состояния и планирование без необходимости дополнительных данных. Основываясь на архитектуре прогнозирования с совместным встраиванием (JEPA), V-JEPA 2 демонстрирует, как самообучение на основе пассивного интернет-видео в сочетании … Читать далее

Запуск нескольких агентов по кодированию с помощью искусственного интеллекта параллельно с использованием контейнеров от Dagger

В разработке, управляемой искусственным интеллектом, агенты по кодированию стали незаменимыми помощниками. Эти автономные или полуавтономные инструменты могут писать, тестировать и рефакторить код, значительно ускоряя циклы разработки. Однако по мере увеличения количества агентов, работающих над одной кодовой базой, возникают проблемы: конфликты зависимостей, утечка состояния между агентами и сложность отслеживания действий каждого агента. Проект использования контейнеров от … Читать далее

CURE: система обучения с подкреплением для совместной эволюции генерации кода и модульных тестов в больших языковых моделях

Введение Большие языковые модели (LLMs) продемонстрировали значительное улучшение в рассуждениях и точности благодаря методам обучения с подкреплением (RL) и масштабированию во время тестирования. Несмотря на то, что они превосходят традиционные методы генерации модульных тестов, большинство существующих подходов, таких как O1-Coder и UTGEN, требуют контроля со стороны кода с истинными значениями. Такой контроль увеличивает затраты на … Читать далее

Разработка многофункционального ИИ-агента с безопасным выполнением кода Python с помощью Riza и Gemini

В этом руководстве мы будем использовать безопасное выполнение Python в Riza в качестве основы для мощного ИИ-агента с дополнительными инструментами в Google Colab. Начало работы Мы начнём с простого управления ключами API через секреты Colab, переменные среды или скрытые подсказки, чтобы настроить учётные данные Riza и включить выполнение кода в песочнице, готовое к аудиту. Установка … Читать далее

Внедрение технологий с учётом их значимости

В 15 презентациях в стиле TED преподаватели Массачусетского технологического института (MIT) обсудили свои новаторские исследования, которые объединяют социальные, этические и технические аспекты. Каждое исследование поддержано грантами, учреждёнными в рамках инициативы Social and Ethical Responsibilities of Computing (SERC) — междисциплинарной программы колледжа Schwarzman при MIT. Летом прошлого года на призыв о предложениях откликнулось почти 70 заявок. … Читать далее

Как на самом деле рассуждают большие языковые модели? Система для отделения логики от знаний

Разбор рассуждений в современных больших языковых моделях: почему одних конечных ответов недостаточно Недавние достижения в области больших языковых моделей (LLM), ориентированных на рассуждения, таких как OpenAI’s o1/3 и DeepSeek-R1, привели к заметным улучшениям в решении сложных задач. Однако пошаговые рассуждения, лежащие в основе этих моделей, остаются неясными. Большинство оценок фокусируется на точности конечных ответов, что … Читать далее

Обзор Artistly: инструмент для дизайна на основе ИИ заменяет дизайнеров

Что такое Artistly? Artistly — это платформа на основе ИИ, которая помогает создавать и редактировать высококачественные изображения, иллюстрации и дизайны по простым текстовым запросам. Эти изображения можно использовать для маркетинга, социальных сетей, презентаций, сторителлинга, детских книг, комиксов и многого другого. Artistly также уделяет особое внимание сохранению преемственности и стиля для брендинга или серий. Чем Artistly … Читать далее