Искусственный интеллект

Рубрика «Искусственный интеллект» на Neurosova.ru рассказывает о самых передовых алгоритмах и практических приложениях ИИ: от глубокого обучения до нейронных сетей и GPT-моделей. В разделе Искусственный интеллект вы найдёте обзоры современных исследовательских работ, кейсы внедрения ИИ в бизнесе и промышленности, а также интервью с ведущими разработчиками и учёными. Узнайте, как машинное зрение, обработка естественного языка и автономные системы меняют нашу жизнь уже сегодня.

Tencent Hunyuan выпускает HunyuanOCR: экспертная модель обработки текста из изображений с 1 миллиардом параметров

27.11.2025 от Neuro Sova

Компания Tencent Hunyuan выпустила модель HunyuanOCR — это модель обработки языка и изображений, предназначенная для оптического распознавания символов (OCR) и понимания документов. Модель построена на собственной мультимодальной архитектуре Hunyuan и выполняет обнаружение, синтаксический анализ, извлечение информации, ответы на визуальные вопросы и перевод текста в изображениях через единый сквозной механизм. Особенности HunyuanOCR HunyuanOCR — это лёгкая … Читать далее

Black Forest Labs выпускает FLUX.2: 32-битный трансформер для согласования потоков в производственных конвейерах обработки изображений

26.11.2025 от Neuro Sova

Black Forest Labs выпустила FLUX.2 — систему генерации и редактирования изображений второго поколения. FLUX.2 ориентирована на творческие рабочие процессы в реальных условиях, такие как создание маркетинговых материалов, предметная фотосъёмка, дизайн-макеты и сложная инфографика. Система поддерживает редактирование изображений с разрешением до 4 мегапикселей и обеспечивает точный контроль над макетами, логотипами и типографикой. Семейство FLUX.2 Семейство FLUX.2 … Читать далее

Исследователи обнаружили недостаток, снижающий надёжность больших языковых моделей

26.11.2025 от Neuro Sova

Большие языковые модели (LLMs) иногда усваивают неверные уроки, согласно исследованию Массачусетского технологического института (MIT). Вместо того чтобы отвечать на запрос, основываясь на знаниях в определённой области, LLM может использовать грамматические шаблоны, усвоенные во время обучения. Это может привести к неожиданным сбоям модели при выполнении новых задач. Исследователи обнаружили, что модели могут ошибочно связывать определённые структуры … Читать далее

Учёные MIT представили генеративную модель искусственного интеллекта, способную создавать молекулы для борьбы с трудноизлечимыми заболеваниями

26.11.2025 от Neuro Sova

Более 300 человек из научных кругов и промышленности собрались в аудитории, чтобы посетить семинар BoltzGen в четверг, 30 октября. Семинар организован Абдул Латиф Джамиль Клиникой машинного обучения в здравоохранении (MIT Jameel Clinic). Основным докладчиком был аспирант MIT и первый автор BoltzGen Ханнес Стёрк, который объявил о BoltzGen всего за несколько дней до этого. Основываясь на … Читать далее

Агент 0: полностью автономная структура ИИ, которая развивает высокоэффективных агентов без внешних данных через многоэтапную совместную эволюцию

25.11.2025 от Neuro Sova

Agent0 — это полностью автономная структура искусственного интеллекта (ИИ), которая развивает высокоэффективных агентов без внешних данных через многоэтапную совместную эволюцию и бесшовную интеграцию инструментов. Agent0 нацелен на математические и общие рассуждения. Он показывает, что тщательная генерация задач и интегрированные с инструментами развёртывания могут расширить возможности базовой модели по десяти бенчмаркам. Как работает Agent0 Agent0 начинается … Читать далее

Расширение доступа к размещению данных для бизнес-клиентов по всему миру

25.11.2025 от Neuro Sova

Внутри JetBrains — компании, меняющей подход к написанию кода в мире OpenAI расширяет возможности размещения данных для ChatGPT Enterprise, ChatGPT Edu и платформы API. Это позволяет соответствующим клиентам хранить данные локально в выбранном регионе. JetBrains интегрирует GPT-5 в свои инструменты для программирования. Это помогает миллионам разработчиков быстрее создавать, проектировать и разрабатывать программное обеспечение. 1. Какие … Читать далее

Microsoft выпускает Fara-7B: эффективную агентскую модель для использования на компьютере

25.11.2025 от Neuro Sova

Компания Microsoft Research выпустила Fara-7B — небольшую языковую модель с 7 миллиардами параметров, разработанную специально для использования на компьютере. Это открытый агент по использованию компьютера, который работает со скриншотами, предсказывает действия мыши и клавиатуры и может выполняться на одном устройстве пользователя, что снижает задержки и сохраняет данные локально. От чат-ботов к агентам использования компьютера Традиционные … Читать далее

Как искусственный интеллект может помочь в переходе к чистой энергии

25.11.2025 от Neuro Sova

Искусственный интеллект (ИИ) всё чаще становится объектом внимания в контексте растущего спроса на энергию. Однако центры обработки данных, которые строятся для поддержки ИИ, могут создавать нагрузку на электросети, повышать цены для потребителей и вызывать перебои в обслуживании. Тем не менее использование ИИ может способствовать переходу к чистой энергии. Снижение энергопотребления и выбросов Использование ИИ помогает … Читать далее

NVIDIA выпускает модель ИИ Nemotron-Elastic-12B: одна модель ИИ, которая предоставляет варианты 6B/9B/12B без дополнительных затрат на обучение

24.11.2025 от Neuro Sova

NVIDIA AI выпускает Nemotron-Elastic-12B — модель искусственного интеллекта с 12 миллиардами параметров, которая включает в себя вложенные варианты с 9 миллиардами и 6 миллиардами параметров в том же пространстве параметров. Это означает, что все три размера получаются из одной эластичной контрольной точки без дополнительных этапов дистилляции для каждого размера. Почему команды разработчиков ИИ всё ещё … Читать далее

Представляем исследование покупок в ChatGPT.

24.11.2025 от Neuro Sova

Исследование покупок в ChatGPT помогает вам изучать, сравнивать и находить товары с помощью персонализированных руководств для покупателей, которые упрощают процесс принятия решений. 1. Какие задачи помогает решать исследование покупок в ChatGPT? Исследование покупок в ChatGPT помогает изучать, сравнивать и находить товары, а также упрощает процесс принятия решений за счёт персонализированных руководств для покупателей. 2. Какие … Читать далее

NVIDIA выпускает модель ИИ Nemotron-Elastic-12B: одна модель ИИ, которая предоставляет варианты на 6B, 9B и 12B параметров без дополнительных затрат на обучение

24.11.2025 от Neuro Sova

NVIDIA AI выпускает Nemotron-Elastic-12B — модель искусственного интеллекта с 12 миллиардами параметров, которая включает в себя вложенные варианты с 9 миллиардами и 6 миллиардами параметров в одном и том же пространстве параметров. Это означает, что все три размера получаются из одной эластичной контрольной точки без дополнительных прогонов дистилляции для каждого размера. Почему команды разработчиков ИИ … Читать далее

NVIDIA выпускает модель искусственного интеллекта Nemotron-Elastic-12B

24.11.2025 от Neuro Sova

Компания NVIDIA представила модель Nemotron-Elastic-12B — единую модель искусственного интеллекта, которая генерирует варианты с 6, 9 и 12 миллиардами параметров без дополнительных затрат на обучение. Почему команды разработчиков ИИ всё ещё обучают и хранят несколько больших языковых моделей для разных целей развёртывания, когда одна эластичная модель может генерировать несколько размеров с теми же затратами? Команда … Читать далее

NVIDIA представляет Nemotron-Elastic-12B: одна модель ИИ, которая даёт варианты 6B/9B/12B без дополнительных затрат на обучение

24.11.2025 от Neuro Sova

NVIDIA AI выпускает Nemotron-Elastic-12B — модель искусственного интеллекта с 12 миллиардами параметров, которая включает в себя вложенные варианты с 9 миллиардами и 6 миллиардами параметров в том же пространстве параметров. Это означает, что все три размера получаются из одной эластичной контрольной точки без дополнительных прогонов дистилляции для каждого размера. Почему команды разработчиков ИИ всё ещё … Читать далее

Исследователи из Moonshot AI представили Seer: систему онлайн-обучения контексту для быстрого синхронного подкрепления обучения RL

23.11.2025 от Neuro Sova

Команда исследователей из Moonshot AI и Университета Цинхуа разработала новую систему онлайн-обучения контексту под названием Seer. Она направлена на решение проблемы узких мест в синхронном подкреплении обучения RL для больших языковых моделей. Почему синхронный вывод замедляется для моделей рассуждений? Современные рабочие нагрузки RL используют длинные цепочки рассуждений. В экспериментах с Seer исследователи применили GRPO к … Читать далее

Как спроектировать мини-среду для обучения с подкреплением с интеллектуальной локальной обратной связью, адаптивным принятием решений и координацией нескольких агентов

23.11.2025 от Neuro Sova

В этом руководстве мы создадим мини-среду для обучения с подкреплением, в которой многоагентная система учится перемещаться по сетке через взаимодействие, обратную связь и многоуровневое принятие решений. Мы создадим всё с нуля и объединим три роли агентов: агент действия, агент инструмента и супервизор, чтобы наблюдать, как простые эвристики, анализ и надзор способствуют более интеллектуальному поведению. Создание … Читать далее

Google DeepMind представляет Nano Banana Pro: модель генерации изображений Gemini 3 Pro для точного текста и студийного качества визуалов

22.11.2025 от Neuro Sova

Nano Banana Pro, также известная как Gemini 3 Pro Image, — это новая модель Google DeepMind для генерации и редактирования изображений, созданная на основе Gemini 3 Pro. Она позиционируется как современная система для создания и редактирования изображений, учитывающая структуру, мировые знания и расположение текста, а не только стиль. Nano Banana Pro и её предшественница Nano … Читать далее

Perplexity AI выпускает TransferEngine и pplx garden для запуска языковых моделей с триллионом параметров на существующих кластерах GPU

21.11.2025 от Neuro Sova

Как команды могут запускать языковые модели с триллионом параметров на существующих смешанных кластерах GPU без дорогостоящего нового оборудования или глубокой привязки к поставщику? Исследовательская группа Perplexity выпустила TransferEngine и сопутствующий инструментарий pplx garden в виде инфраструктуры с открытым исходным кодом для систем больших языковых моделей. Это позволяет запускать модели с до 1 триллиона параметров на … Читать далее

Реализация полностью отслеживаемого и оценённого локального конвейера LLM с использованием Opik для прозрачных, измеримых и воспроизводимых рабочих процессов искусственного интеллекта

21.11.2025 от Neuro Sova

В этом руководстве мы реализуем полный рабочий процесс для создания, отслеживания и оценки конвейера LLM с использованием Opik. Мы пошагово структурируем систему, начиная с лёгкой модели, добавляя планирование на основе подсказок, создавая набор данных и, наконец, выполняя автоматическую оценку. Установка среды Мы устанавливаем необходимые библиотеки и инициализируем Opik. Мы загружаем основные модули, определяем устройство и … Читать далее

Институт Аллена для искусственного интеллекта (AI2) представляет Olmo 3: семейство больших языковых моделей с 7 и 32 миллиардами параметров

21.11.2025 от Neuro Sova

Институт Аллена для искусственного интеллекта (AI2) выпускает Olmo 3 в качестве полностью открытой модели, которая раскрывает весь «поток модели» — от необработанных данных и кода до промежуточных контрольных точек и вариантов, готовых к развёртыванию. Olmo 3 — это набор плотных трансформеров с моделями на 7 миллиардов и 32 миллиарда параметров. В семейство входят Olmo 3-Base, … Читать далее

OpenAI и Foxconn сотрудничают для укрепления производственной сферы США в цепочке поставок искусственного интеллекта.

21.11.2025 от Neuro Sova

Компании OpenAI и Foxconn объединили усилия с целью разработки и производства оборудования для инфраструктуры искусственного интеллекта нового поколения в США. В рамках партнёрства планируется разработка нескольких поколений систем для дата-центров, укрепление цепочек поставок в США и создание ключевых компонентов внутри страны для ускорения развития передовой инфраструктуры искусственного интеллекта. #️⃣ 🔬🏭 1. Какие цели стоят перед … Читать далее

Сравнение технологий для промышленного вывода LLM: vLLM, TensorRT-LLM, Hugging Face TGI и LMDeploy

20.11.2025 от Neuro Sova

Введение Выбор стека для вывода (inference) больших языковых моделей (LLM) в промышленном масштабе — это важная задача, которая влияет на производительность и стоимость системы. В этой статье мы рассмотрим четыре широко используемых стека: vLLM, TensorRT-LLM, Hugging Face Text Generation Inference (TGI v3) и LMDeploy. 1. vLLM: PagedAttention как открытая базовая линия * Основная идея: vLLM … Читать далее

OpenAI сотрудничает с DoorDash, SCORE и местными организациями, чтобы помочь 1000 малым предприятиям использовать искусственный интеллект. Программа Small Business AI Jam предоставляет владельцам малого бизнеса практические инструменты и обучение, чтобы они могли конкурировать и развиваться.

20.11.2025 от Neuro Sova

1. Какие организации сотрудничают с OpenAI в рамках программы помощи малым предприятиям? Ответ: OpenAI сотрудничает с DoorDash, SCORE и местными организациями. 2. Какова цель программы Small Business AI Jam? Ответ: цель программы Small Business AI Jam — предоставить владельцам малого бизнеса практические инструменты и обучение, чтобы они могли конкурировать и развиваться с помощью искусственного интеллекта. … Читать далее

Google Antigravity превращает среду разработки в панель управления для агентского программирования

20.11.2025 от Neuro Sova

Google представила Antigravity — агентскую платформу разработки, которая работает на основе Gemini 3. Это не просто слой автозаполнения, а полноценная среда разработки (IDE), где агенты планируют, выполняют и объясняют сложные программные задачи в редакторе, терминале и браузере. Antigravity была запущена 18 ноября 2025 года вместе с Gemini 3 в рамках стремления Google к созданию инструментов … Читать далее

Комплексная эмпирическая система для оценки стратегий рассуждений в современных системах искусственного интеллекта

20.11.2025 от Neuro Sova

В этом руководстве мы подробно рассмотрим, как систематически оцениваются компоненты системы, путём анализа различных стратегий рассуждения в разнообразных задачах. Мы изучим, как разные архитектуры, такие как Direct, Chain-of-Thought, ReAct и Reflexion, ведут себя при решении задач возрастающей сложности, и количественно оценим их точность, эффективность, задержку и модели использования инструментов. Основные компоненты системы Мы определяем основные … Читать далее

Стоимость мышления

20.11.2025 от Neuro Sova

Большие языковые модели (БЯМ), такие как ChatGPT, могут почти мгновенно написать эссе или спланировать меню. Но до недавнего времени их можно было легко поставить в тупик. Модели, которые отвечают на запросы пользователей, опираясь на языковые шаблоны, часто не справлялись с математическими задачами и не были хороши в сложных рассуждениях. Однако внезапно они стали намного лучше … Читать далее

Укрепление нашей системы безопасности с помощью внешнего тестирования.

20.11.2025 от Neuro Sova

OpenAI сотрудничает с независимыми экспертами для оценки передовых систем искусственного интеллекта. Тестирование третьими сторонами повышает безопасность, подтверждает эффективность защитных мер и увеличивает прозрачность в оценке возможностей моделей и рисков. 1. Какова роль независимых экспертов в оценке систем искусственного интеллекта? Ответ: независимые эксперты проводят оценку передовых систем искусственного интеллекта, сотрудничая с OpenAI. Это помогает повысить безопасность, … Читать далее

Как оценки влияют на новую главу искусственного интеллекта в бизнесе.

19.11.2025 от Neuro Sova

Узнайте, как оценки помогают компаниям определять, измерять и улучшать производительность ИИ — снижая риски, повышая производительность и обеспечивая стратегическое преимущество. 1. Какие риски помогает снизить использование оценок в новой главе искусственного интеллекта в бизнесе? Ответ: использование оценок помогает компаниям снижать риски, связанные с внедрением ИИ, путём более точного определения и измерения производительности систем ИИ. Это … Читать далее

OpenAI и Target объединились для создания новых возможностей на базе искусственного интеллекта.

19.11.2025 от Neuro Sova

Компании OpenAI и Target начали сотрудничество, чтобы внедрить новое приложение Target в ChatGPT. Это позволит предлагать персонализированные покупки и ускорить процесс оформления заказов. Кроме того, Target расширит использование ChatGPT Enterprise для повышения производительности и улучшения качества обслуживания клиентов. #OpenAI #Target #ChatGPT #партнёрство 1. Какие возможности предоставит новое приложение Target в ChatGPT? Ответ:Новое приложение Target в … Читать далее

Новый ИИ-агент учится использовать САПР для создания 3D-объектов по эскизам

19.11.2025 от Neuro Sova

Компьютерное проектирование (САПР) — основной метод проектирования большинства современных физических продуктов. Инженеры используют САПР, чтобы превратить 2D-эскизы в 3D-модели, которые затем можно протестировать и доработать, прежде чем отправить окончательную версию на производственную линию. Однако программное обеспечение САПР славится своей сложностью: в нём тысячи команд на выбор. Чтобы в совершенстве овладеть программным обеспечением, требуется много времени … Читать далее

Как создать систему глубокого обучения с подкреплением, управляемую агентом, с поэтапным обучением, адаптивным исследованием и планированием на метауровне

19.11.2025 от Neuro Sova

Создание системы глубокого обучения с подкреплением, управляемой агентом В этом руководстве мы создадим продвинутую систему глубокого обучения с подкреплением, которая научит агента не только действовать в среде, но и выбирать собственные стратегии обучения. Мы разработаем Dueling Double DQN learner, представим учебный план с возрастающей сложностью и интегрируем несколько режимов исследования, которые адаптируются по мере обучения. … Читать далее