Искусственный интеллект

Рубрика «Искусственный интеллект» на Neurosova.ru рассказывает о самых передовых алгоритмах и практических приложениях ИИ: от глубокого обучения до нейронных сетей и GPT-моделей. В разделе Искусственный интеллект вы найдёте обзоры современных исследовательских работ, кейсы внедрения ИИ в бизнесе и промышленности, а также интервью с ведущими разработчиками и учёными. Узнайте, как машинное зрение, обработка естественного языка и автономные системы меняют нашу жизнь уже сегодня.

Создание интеллектуального конвертера кода Python в R с проверкой и обратной связью на базе Gemini AI

21.07.2025 от Neuro Sova

В этом руководстве мы рассмотрим создание интеллектуального конвертера кода Python в R, который использует бесплатный API Gemini от Google для проверки и предложений по улучшению. Шаг 1: определение логики преобразования Мы начнём с определения логики преобразования, сопоставляя функции Python, библиотеки и синтаксические шаблоны с их ближайшими эквивалентами в R. Шаг 2: использование Gemini AI Затем … Читать далее

MIRIX: модульная мультиагентная система памяти для улучшения долгосрочного мышления и персонализации в агентах на базе LLM

21.07.2025 от Neuro Sova

Недавние разработки в области агентов LLM в основном были сосредоточены на расширении возможностей выполнения сложных задач. Однако одно важное направление остаётся недостаточно изученным: память — способность агентов сохранять, вспоминать и рассуждать на основе специфичной для пользователя информации в течение времени. Без постоянной памяти большинство агентов на базе LLM остаются без состояния, неспособными создавать контекст за … Читать далее

Можно ли доверять моделям вознаграждения LLM? Master-RM выявляет и устраняет их слабые места

21.07.2025 от Neuro Sova

Генеративные модели вознаграждения, в которых большие языковые модели (LLM) выступают в роли оценщиков, набирают популярность в обучении с подкреплением с проверяемыми вознаграждениями (RLVR). Эти модели предпочтительнее систем, основанных на правилах, для задач, связанных с открытыми или сложными ответами. Вместо того чтобы полагаться на строгие правила, LLM сравнивают ответ кандидата с эталонным ответом и генерируют бинарную … Читать далее

Протокол Model Context (MCP) для предприятий: безопасная интеграция с AWS, Azure и Google Cloud — обновление 2025 года

20.07.2025 от Neuro Sova

Оглавление 1. Обзор MCP и экосистема.2. AWS: MCP в масштабе облака.3. Microsoft Azure: MCP в Copilot и AI Foundry.4. Google Cloud: MCP Toolbox и Vertex AI.5. Лучшие практики для разных облаков.6. Безопасность и управление рисками (ландшафт угроз 2025 года).7. Расширенная экосистема: за пределами «большой тройки».8. Пример: поток интеграции AWS MSK MCP.9. Резюме (июль 2025 года). … Читать далее

NVIDIA представила OpenReasoning-Nemotron: набор языковых моделей с улучшенными возможностями логического вывода

20.07.2025 от Neuro Sova

Компания NVIDIA AI выпустила OpenReasoning-Nemotron — семейство больших языковых моделей (LLM), которые предназначены для решения сложных задач, связанных с логическим выводом в математике, науке и программировании. Основные характеристики В набор входят версии с количеством параметров 1,5 млрд, 7 млрд, 14 млрд и 32 млрд. Эти модели были созданы на основе модели DeepSeek R1 0528 с … Читать далее

Возможно, ИИ, основанный на физике, — это правильный подход: переосмысление основ интеллекта

20.07.2025 от Neuro Sova

За последнее десятилетие глубокое обучение произвело революцию в искусственном интеллекте, став движущей силой прорывов в распознавании изображений, языковом моделировании и играх. Однако появились постоянные ограничения: неэффективность использования данных, отсутствие устойчивости к изменениям распределения, высокая потребность в энергии и поверхностное понимание физических законов. По мере того как внедрение ИИ углубляется в критически важные сектора — от … Читать далее

Создание современной системы управления асинхронной конфигурацией с обеспечением типобезопасности и горячей перезагрузкой

20.07.2025 от Neuro Sova

В этом руководстве мы познакомим вас с разработкой и функциональностью AsyncConfig — современной библиотеки управления конфигурацией для Python, ориентированной на асинхронные операции. Мы создадим её с нуля, чтобы поддержать мощные функции, включая загрузку конфигурации на основе типов данных, множественные источники конфигурации (например, переменные окружения, файлы и словари) и горячую перезагрузку с помощью watchdog. Импортируем необходимые … Читать далее

Системный план развития Deep Research Agents: автономные исследовательские системы на основе больших языковых моделей

20.07.2025 от Neuro Sova

Команда исследователей из Ливерпульского университета, лаборатории Huawei Noah’s Ark, Оксфордского университета и Университетского колледжа Лондона представляет отчёт, объясняющий Deep Research Agents (DR agents) — новую парадигму в автономных исследованиях. Эти системы работают на основе больших языковых моделей (LLMs) и предназначены для решения сложных задач, требующих динамического анализа, адаптивного планирования, итеративного использования инструментов и структурированных аналитических … Читать далее

MemAgent: система на основе обучения с подкреплением, переопределяющая обработку длинных контекстов в больших языковых моделях

20.07.2025 от Neuro Sova

Обработка чрезвычайно длинных документов остаётся сложной задачей для больших языковых моделей (LLM). Даже с такими методами, как экстраполяция длины и разрежённое внимание, модели часто страдают от снижения производительности и высоких вычислительных затрат. Чтобы решить эту проблему, исследователи из ByteDance Seed и Университета Цинхуа разработали MemAgent — систему на основе обучения с подкреплением, предназначенную для обработки … Читать далее

Полное руководство по агентам искусственного интеллекта: архитектуры, фреймворки и практическое применение (2025)

19.07.2025 от Neuro Sova

Содержание 1. Что такое агент ИИ?2. Почему агенты ИИ важны в 2025 году?3. Типы агентов ИИ.4. Ключевые компоненты агента ИИ.5. Ведущие фреймворки агентов ИИ в 2025 году.6. Практические примеры использования агентов ИИ.7. Агент ИИ против чат-бота против LLM.8. Будущее агентских систем ИИ.9. Часто задаваемые вопросы об агентах ИИ.10. Заключение. Что такое агент ИИ? Агент ИИ … Читать далее

Создание мультиагентской исследовательской группы ИИ с помощью LangGraph и Gemini для автоматизированного составления отчётов

19.07.2025 от Neuro Sova

В этом руководстве мы создадим полноценную систему мультиагентской исследовательской группы, используя LangGraph и API Google Gemini. Мы используем агентов, выполняющих определённые роли: исследователь, аналитик, писатель и руководитель. Каждый из них отвечает за отдельный этап исследовательского процесса. Вместе они собирают данные, анализируют информацию, составляют отчёт и координируют рабочий процесс. Мы также включаем такие функции, как сохранение … Читать далее

Эта статья об искусственном интеллекте представляет ARAG: мультиагентную систему RAG для контекстно-зависимых и персонализированных рекомендаций

19.07.2025 от Neuro Sova

Персонализированные рекомендации стали важным компонентом многих цифровых систем. Их цель — предложить контент, продукты или услуги, соответствующие предпочтениям пользователя. Процесс основан на анализе прошлого поведения, взаимодействий и закономерностей, чтобы предсказать, что пользователи могут посчитать релевантным. Со временем методы рекомендаций перешли от базовой фильтрации к продвинутым моделям, основанным на понимании языка. Эти достижения позволяют системам предоставлять … Читать далее

Больше не нужно делиться данными для обучения языковой модели — FlexOlmo демонстрирует как

19.07.2025 от Neuro Sova

Разработка масштабных языковых моделей (LLM) исторически требовала централизованного доступа к обширным наборам данных, многие из которых чувствительны, защищены авторским правом или регулируются ограничениями на использование. Это ограничение серьёзно ограничивает участие организаций, богатых данными, работающих в регулируемых или закрытых средах. FlexOlmo — предложенная исследователями из Института Аллена по искусственному интеллекту и их коллегами — представляет собой … Читать далее

Использование Chain-of-Thought (CoT) рассуждений с библиотекой Mirascope

19.07.2025 от Neuro Sova

В этом руководстве мы рассмотрим, как реализовать рассуждения Chain-of-Thought (CoT) с помощью библиотеки Mirascope и модели Groq’s LLaMA 3. Вместо того чтобы модель сразу выдавала ответ, подход CoT побуждает её разбить задачу на логические шаги — подобно тому, как это сделал бы человек. Этот подход повышает точность, прозрачность и помогает более надёжно решать сложные многошаговые … Читать далее

EG-CFG: улучшение генерации кода с помощью обратной связи в реальном времени

19.07.2025 от Neuro Sova

Большие языковые модели (LLMs) добились впечатляющих успехов в генерации кода для различных задач программирования. Однако они в основном полагаются на распознавание шаблонов из статических примеров кода, а не на понимание того, как код ведёт себя во время выполнения. Это часто приводит к тому, что программы выглядят корректными, но терпят неудачу при запуске. Роль синтеза программ … Читать далее

Адаптивная система безопасности AegisLLM для повышения защищённости больших языковых моделей (LLM) во время вывода

19.07.2025 от Neuro Sova

Рост угроз для LLM Большие языковые модели (LLM) становятся основной мишенью для быстро развивающихся атак, включая внедрение запросов (prompt injection), взлом (jailbreaking) и несанкционированный вынос конфиденциальных данных. Из-за изменчивого характера этих угроз необходимо адаптировать защитные механизмы, выходящие за рамки статических мер безопасности. Существующие методы защиты LLM страдают из-за своей зависимости от статических вмешательств во время … Читать далее

Фонд размером в 50 миллионов долларов для совместной работы с сообществами.

18.07.2025 от Neuro Sova

Компания OpenAI запускает первоначальный фонд размером в 50 миллионов долларов, который поддерживает некоммерческие организации и общественные объединения. Об этом стало известно после публикации отчёта независимой комиссии OpenAI Nonprofit Commission. 1. Какова цель создания фонда OpenAI размером в 50 миллионов долларов? * Цель создания фонда — поддержка некоммерческих организаций и общественных объединений. 2. Какие организации могут … Читать далее

OpenAI представляет ChatGPT Agent: от исследований до автоматизации в реальном мире

18.07.2025 от Neuro Sova

17 июля 2025 года компания OpenAI выпустила ChatGPT Agent, преобразовав ChatGPT из разговорного помощника в унифицированного ИИ-агента, способного автономно выполнять сложные многоэтапные задачи — от просмотра веб-страниц до выполнения кода — в виртуальной компьютерной среде. Предыдущие возможности и их объединение ChatGPT Agent основан на двух предыдущих инструментах:* Operator предоставлял ограниченные возможности взаимодействия с веб-сайтами — … Читать далее

Модель прогнозирует долгосрочное воздействие ядерных отходов на системы подземного захоронения

18.07.2025 от Neuro Sova

По мере того как в разных странах мира вновь активизируются проекты в области ядерной энергетики, вопросы о том, где и как утилизировать ядерные отходы, остаются столь же политически острыми, как и прежде. Например, в Соединённых Штатах Америки на неопределённый срок приостановлено создание единственного долгосрочного подземного хранилища ядерных отходов. Учёные используют как моделирование, так и экспериментальные … Читать далее

Invideo AI использует модели OpenAI, включая GPT-4.1, gpt-image-1 и text-to-speech, чтобы создавать профессиональные видеоролики за считанные минуты, ускоряя процесс в 10 раз.

18.07.2025 от Neuro Sova

1. Какие модели искусственного интеллекта используются в Invideo AI для создания видеороликов? Ответ: в Invideo AI используются модели OpenAI, включая GPT-4.1, gpt-image-1 и text-to-speech. 2. Во сколько раз Invideo AI ускоряет процесс создания видеороликов по сравнению с традиционными методами? Ответ: Invideo AI ускоряет процесс создания видеороликов в 10 раз по сравнению с традиционными методами. 3. … Читать далее

GLM-4.1V-Thinking: развитие общего мультимодального понимания и рассуждений

18.07.2025 от Neuro Sova

Модели зрения и языка (VLM) играют решающую роль в современных интеллектуальных системах, обеспечивая детальное понимание визуального контента. Сложность задач мультимодального интеллекта возросла, начиная от решения научных задач и заканчивая разработкой автономных агентов. Текущие требования к VLM вышли далеко за рамки простого восприятия визуального контента, и всё больше внимания уделяется продвинутому мышлению. Недавние работы показывают, что … Читать далее

Mirage: мультимодальное рассуждение в VLM без визуализации изображений

18.07.2025 от Neuro Sova

Хотя VLM (Vision-Language Models, модели зрения и языка) хорошо справляются с пониманием текста и изображений, при рассуждениях они часто полагаются исключительно на текст, что ограничивает их способность решать задачи, требующие визуального мышления, например, пространственные головоломки. Люди естественным образом визуализируют решения, а не описывают каждую деталь, но VLM с этим справляются плохо. Хотя некоторые современные модели … Читать далее

NVIDIA выпустила гибридную модель Canary-Qwen-2.5B: передовой гибрид ASR и LLM с лучшими показателями в OpenASR

17.07.2025 от Neuro Sova

Компания NVIDIA выпустила модель Canary-Qwen-2.5B — инновационный гибрид автоматической системы распознавания речи (ASR) и языковой модели (LLM). Она заняла первое место в рейтинге Hugging Face OpenASR с рекордным показателем Word Error Rate (WER) в 5,63%. Ключевые особенности:* WER — 5,63%, самый низкий показатель в Hugging Face OpenASR.* RTFx — 418, высокая скорость вывода на 2,5 … Читать далее

Google Search только что получил серьёзное обновление искусственного интеллекта: Gemini 2.5 Pro, Deep Search и агентский интеллект

17.07.2025 от Neuro Sova

Google меняет подход к взаимодействию с поиском. Недавнее внедрение Gemini 2.5 Pro, Deep Search и мощной новой агентской функции делает поисковую систему Google более интеллектуальной, интерактивной и контекстуальной. Эти функции пока доступны только пользователям из США, но они знаменуют собой серьёзный сдвиг в интеграции Google Search с передовым искусственным интеллектом, приближая его к полноценному помощнику … Читать далее

Представляем агента ChatGPT: он мыслит и действует, используя инструменты для выполнения таких задач, как исследования, бронирование и создание презентаций — и всё это под вашим руководством.

17.07.2025 от Neuro Sova

Системная карточка агента ChatGPT: агентская модель от OpenAI объединяет исследования, автоматизацию работы в браузере и инструменты для работы с кодом с мерами безопасности в рамках системы Preparedness Framework. 1. Какие основные функции выполняет агент ChatGPT? Ответ: агент ChatGPT выполняет функции исследований, автоматизации работы в браузере и работы с кодом, действуя под руководством пользователя. 2. Какие … Читать далее

В OpenAI мы создаём инструменты, которые помогают людям решать сложные задачи, в том числе некоммерческим организациям, работающим на благо своих сообществ. Академия OpenAI совместно с Фондом семьи Уолтон, Emerson Collective и сетью местных некоммерческих организаций проводит мероприятие Nonprofit Jam — однодневное событие национального масштаба, которое объединит более 1000 лидеров некоммерческих организаций в 10 локациях.

17.07.2025 от Neuro Sova

#OpenAI #nonprofit #nonprofitjam 1. Какова цель мероприятия Nonprofit Jam, организуемого OpenAI? Ответ: цель мероприятия Nonprofit Jam — объединить более 1000 лидеров некоммерческих организаций в 10 локациях для обсуждения и решения сложных задач. 2. Какие организации участвуют в организации Nonprofit Jam? Ответ: в организации Nonprofit Jam участвуют Академия OpenAI, Фонд семьи Уолтон, Emerson Collective и сеть … Читать далее

20 самых горячих агентских инструментов и агентов искусственного интеллекта в 2025 году (на данный момент)

17.07.2025 от Neuro Sova

Исследования и передовые агенты 1. AlphaEvolve (Google DeepMind) — агент эволюционного кодирования, работающий на базе Gemini. AlphaEvolve автономно изобретает и оптимизирует алгоритмы в различных областях, включая математику, планирование работы центров обработки данных, проектирование микросхем и обучение языковых моделей. Это система общего назначения, которая может улучшать и находить современные решения для широкого спектра алгоритмических задач, требуя … Читать далее

Mistral AI выпускает Voxtral: лучшие в мире (и открытые) модели распознавания речи

17.07.2025 от Neuro Sova

Компания Mistral AI выпустила Voxtral — семейство моделей с открытым весом: Voxtral-Small-24B и Voxtral-Mini-3B. Они предназначены для работы как со звуковыми, так и с текстовыми данными. Эти модели построены на основе языкового фреймворка Mistral и объединяют автоматическое распознавание речи (ASR) с возможностями понимания естественного языка. Модели Voxtral доступны под лицензией Apache 2.0. Они предлагают практические … Читать далее

Руководство по написанию кода для создания агента анализа кода ИИ с помощью Griffe

17.07.2025 от Neuro Sova

В этом руководстве мы познакомимся с Griffe и рассмотрим её как центр нашего продвинутого анализатора кода ИИ. Используя богатые возможности самоанализа Griffe, мы можем легко загружать, просматривать и анализировать структуры пакетов Python в режиме реального времени. Установка библиотек !pip install griffe requests matplotlib networkx -q «`import griffeimport jsonimport requestsfrom typing import Dict, List, Anyimport matplotlib.pyplot … Читать далее

JarvisArt: мультимодальный ИИ-ретушер, объединяющий Chain-of-Thought и API Lightroom

17.07.2025 от Neuro Sova

Преодоление разрыва между художественным замыслом и техническим исполнением Ретушь фотографий — ключевой аспект цифровой фотографии, позволяющий пользователям манипулировать такими элементами изображения, как тон, экспозиция и контраст, для создания визуально привлекательного контента. Независимо от того, используются ли эти инструменты в профессиональных целях или для личного самовыражения, пользователи часто стремятся улучшить изображения в соответствии с определёнными эстетическими … Читать далее