Топ-10 локальных больших языковых моделей (2025): сравнение контекстных окон, целей по VRAM и лицензий

В 2025 году локальные большие языковые модели (LLM) быстро развивались. Семейства с открытым весом, такие как Llama 3.1 (длина контекста 128K), Qwen3 (Apache-2.0, плотный + MoE), Gemma 2 (9B/27B, 8K ctx), Mixtral 8×7B (Apache-2.0 SMoE) и Phi-4-mini (3.8B, 128K ctx), теперь предлагают надёжные характеристики и первоклассные локальные средства запуска (GGUF/llama.cpp, LM Studio, Ollama), что делает … Читать далее

Последний предварительный обзор Gemini 2.5 Flash-Lite — теперь это самая быстрая проприетарная модель (внешние тесты) и на 50 % меньше выходных токенов

Google выпустил обновлённую версию предварительных моделей Gemini 2.5 Flash и Gemini 2.5 Flash-Lite в AI Studio и Vertex AI, а также ввёл псевдонимы gemini-flash-latest и gemini-flash-lite-latest, которые всегда указывают на новейший предварительный просмотр в каждом семействе. Для обеспечения стабильности производства Google рекомендует использовать фиксированные строки (gemini-2.5-flash, gemini-2.5-flash-lite). Google отправит электронное уведомление за две недели до … Читать далее

Что такое Asyncio? Начало работы с асинхронным Python и использование Asyncio в приложениях с ИИ и большими языковыми моделями

В современных приложениях с ИИ производительность имеет большое значение. Вы могли заметить, что при работе с большими языковыми моделями (LLM) тратится много времени на ожидание — ответа API, завершения нескольких вызовов или операций ввода-вывода (I/O). Именно здесь на помощь приходит asyncio. Удивительно, но многие разработчики используют LLM, не подозревая, что могут ускорить свои приложения с … Читать далее

Создание интеллектуального агента автоматизации рабочего стола с помощью команд на естественном языке и интерактивного моделирования

В этом руководстве мы рассмотрим процесс создания продвинутого агента автоматизации рабочего стола на базе искусственного интеллекта, который будет без проблем работать в Google Colab. Мы разработаем его так, чтобы он интерпретировал команды на естественном языке, моделировал задачи на рабочем столе, такие как операции с файлами, действия в браузере и рабочие процессы, и предоставлял интерактивную обратную … Читать далее

Знакомьтесь: Qwen3Guard — модели для обеспечения безопасности в реальном времени на основе Qwen3

Команда Qwen из Alibaba разработала Qwen3Guard — семейство мультиязычных моделей-ограничителей, предназначенных для модерации запросов и потоковых ответов в реальном времени. Qwen3Guard представлен в двух вариантах:* Qwen3Guard-Gen (генеративный классификатор, который читает полный контекст запроса/ответа);* Qwen3Guard-Stream (классификатор на уровне токенов, который модерирует по мере генерации текста). Оба варианта выпущены в размерах параметров 0,6B, 4B и 8B и … Читать далее

Hugging Face выпустила Smol2Operator: полностью открытый конвейер для обучения модели VLM с 2,2 млрд параметров в качестве агента, работающего с графическим интерфейсом

Hugging Face (HF) выпустила Smol2Operator — воспроизводимый, комплексный рецепт, который превращает небольшую модель зрения и языка (VLM) без предварительной привязки к пользовательскому интерфейсу в агента, работающего с графическим интерфейсом и использующего инструменты. Что нового? * Двухэтапное пост-обучение на небольшой VLM. Начиная с модели SmolVLM2-2.2B-Instruct, которая «изначально не имеет возможностей для работы с графическим интерфейсом», Smol2Operator … Читать далее

Партнёрство с AARP для обеспечения безопасности пожилых людей в интернете.

Компания OpenAI и организация AARP сотрудничают, чтобы помочь пожилым людям оставаться в безопасности в интернете. Для этого разрабатываются новые программы обучения с использованием искусственного интеллекта, создаются инструменты для распознавания мошенничеств, а также реализуются общенациональные программы через OpenAI Academy и инициативу Senior Planet организации OATS. 1. Какие цели преследует сотрудничество OpenAI и AARP? Ответ: сотрудничество OpenAI … Читать далее

Sakana AI выпустила ShinkaEvolve: фреймворк с открытым исходным кодом, который эволюционирует программы для научных открытий с беспрецедентной эффективностью использования выборки

Что это решает на самом деле? Большинство систем эволюционного кодирования исследуют методом перебора: они вносят изменения в код, запускают его, оценивают и повторяют, расходуя огромные бюджеты на выборку. ShinkaEvolve явно нацелена на устранение этих потерь с помощью трёх взаимодействующих компонентов:* Адаптивная выборка родителей для балансировки исследования и эксплуатации. Родители выбираются из «островов» на основе политик, … Читать далее

Google запустил сервер Model Context Protocol (MCP) для Data Commons, предоставляя агентам искусственного интеллекта первоклассный доступ к открытым статистическим данным

Google выпустил сервер Model Context Protocol (MCP) для Data Commons. Этот проект объединяет общедоступные наборы данных — переписи, здравоохранение, климат, экономика — через стандартизированный интерфейс, к которому системы-агенты могут обращаться на естественном языке. Сервер Data Commons MCP уже доступен, вместе с инструкциями для быстрого старта работы с Gemini CLI и набором для разработки агентов Google … Читать далее

OpenAI выпускает ChatGPT Pulse: персональные ежедневные сводки для пользователей Pro

OpenAI представила ChatGPT Pulse — инструмент, который собирает персонализированные обновления, основанные на исследованиях, каждое утро. В режиме предварительного просмотра в мобильном приложении Pulse доступен за 200 долларов в месяц для подписчиков Pro. Pulse использует данные из чатов пользователя, его явные отзывы и подключённые приложения (например, календарь/электронная почта), превращая ChatGPT из инструмента по запросу в контекстно-зависимого … Читать далее

Дополнительные возможности для работы с командой и инструментами в ChatGPT.

Бизнес-планы ChatGPT теперь поддерживают совместные проекты, более интеллектуальные коннекторы и расширенные функции соответствия требованиям, чтобы помочь командам работать быстрее и безопаснее. 1. Какие новые функции ChatGPT поддерживают работу в совместных проектах? Ответ: бизнес-планы ChatGPT теперь поддерживают совместные проекты, что позволяет командам работать быстрее и эффективнее. 2. Какие преимущества дают интеллектуальные коннекторы в ChatGPT для команд? … Читать далее

Измерение производительности наших моделей в реальных задачах

Компания OpenAI представляет GDPval-v0 — новую систему оценки, которая измеряет производительность моделей в экономически значимых задачах из 44 профессий в реальных условиях. Представляем ChatGPT Pulse Сегодня мы выпускаем предварительный просмотр ChatGPT Pulse для пользователей Pro на мобильных устройствах. Pulse — это новый подход, при котором ChatGPT активно проводит исследования и предоставляет персонализированные обновления на основе … Читать далее

Система искусственного интеллекта помогает в научных исследованиях

Модели машинного обучения могут ускорить открытие новых материалов, делая прогнозы и предлагая эксперименты. Однако большинство моделей сегодня учитывают лишь несколько конкретных типов данных или переменных. Сравните это с учёными, которые работают в условиях сотрудничества и учитывают результаты экспериментов, обширную научную литературу, изображения и структурный анализ, личный опыт или интуицию, а также отзывы коллег и рецензентов. … Читать далее

Meta FAIR выпустила Code World Model (CWM): большая языковая модель для исследований в области генерации кода

Meta FAIR выпустила Code World Model (CWM) — большую языковую модель (LLM) с 32 миллиардами параметров. Она предназначена для исследований в области генерации кода с использованием мировых моделей. Что нового? CWM обучается на двух больших семействах траекторий «наблюдение-действие»:* Трассы интерпретатора Python, которые записывают состояния локальных переменных после каждой выполненной строки.* Агентские взаимодействия внутри докеризированных репозиториев, … Читать далее

Как создать комплексный рабочий процесс в области науки о данных с машинным обучением, интерпретируемостью и помощью Gemini AI?

В этом руководстве мы рассмотрим продвинутый комплексный рабочий процесс в области науки о данных, в котором мы объединяем традиционное машинное обучение с возможностями Gemini. Подготовка и моделирование набора данных по диабету Мы начнём с подготовки и моделирования набора данных по диабету, затем углубимся в оценку, важность признаков и частичную зависимость. На этом пути мы будем … Читать далее

Новая система искусственного интеллекта может ускорить клинические исследования

Аннотация регионов интереса на медицинских изображениях — процесс, известный как сегментация, часто является одним из первых шагов, которые предпринимают клинические исследователи при запуске нового исследования, связанного с биомедицинскими изображениями. Например, чтобы определить, как размер гиппокампа мозга меняется с возрастом пациентов, учёный сначала обводит каждый гиппокамп на серии снимков мозга. Для многих структур и типов изображений … Читать далее

Vision-RAG vs Text-RAG: техническое сравнение для корпоративного поиска

Основные причины сбоев RAG Большинство сбоев RAG происходят на этапе извлечения, а не генерации. В текстовых конвейерах (Text-first pipelines) теряется семантика макета, структура таблиц и связь текста с изображениями при преобразовании PDF→text, что снижает точность и полноту до запуска LLM. Vision-RAG — извлечение визуализированных страниц с помощью встраиваний языка и изображений — напрямую нацелено на … Читать далее

Преобразование производственной отрасли с помощью ChatGPT

Используя ChatGPT Enterprise, компания ENEOS Materials оптимизировала свою деятельность, ускорив научные исследования, повысив безопасность проектирования заводов и оптимизировав кадровые процессы. Более 80% сотрудников отмечают значительные улучшения в рабочих процессах, что укрепляет конкурентоспособность в производстве. 📈 1. Какие конкретные аспекты деятельности компании ENEOS Materials были оптимизированы с помощью ChatGPT Enterprise? Ответ: с помощью ChatGPT Enterprise компания … Читать далее

Освоение продвинутых преобразований TorchVision v2, MixUp, CutMix и современного обучения CNN для компьютерного зрения на уровне передовых технологий

В этом руководстве мы рассмотрим продвинутые методы компьютерного зрения с использованием преобразований TorchVision v2, современных стратегий аугментации и мощных улучшений обучения. Мы разберём процесс создания конвейера аугментации, применения MixUp и CutMix, разработки современной CNN с вниманием и реализации надёжного цикла обучения. Установка библиотек и импорт модулей Мы начнём с установки библиотек и импорта всех необходимых … Читать далее

Alibaba выпустила Qwen3-Max: модель для производственного использования с параметрами более триллиона

Alibaba представила модель Qwen3-Max — модель Mixture-of-Experts (MoE) с более чем триллионом параметров, которая позиционируется как самая мощная базовая модель на сегодняшний день. Модель доступна для широкой публики через Qwen Chat и Alibaba Cloud’s Model Studio API. Что нового на уровне модели? Масштаб и архитектура: Qwen3-Max преодолевает отметку в 1 триллион параметров благодаря дизайну MoE … Читать далее

SAP и OpenAI запустили проект «OpenAI для Германии» — партнёрство, запланированное на 2026 год. Его цель — предоставить надёжные и суверенные решения в сфере искусственного интеллекта для государственного сектора Германии. Это позволит повысить безопасность и эффективность государственных услуг.

SAP и OpenAI объявили о запуске проекта «OpenAI для Германии». Партнёрство, запланированное на 2026 год, призвано обеспечить государственный сектор Германии безопасными и суверенными решениями в области искусственного интеллекта. 1. Какова цель проекта «OpenAI для Германии»? Ответ: цель проекта «OpenAI для Германии» — предоставить надёжные и суверенные решения в сфере искусственного интеллекта для государственного сектора Германии, … Читать далее

Команда Cloudflare AI открыла исходный код VibeSDK

Команда Cloudflare AI открыла исходный код VibeSDK — платформы для создания и развёртывания полнофункциональной системы кодирования с искусственным интеллектом (ИИ) одним кликом в сети Cloudflare или в репозитории GitHub Repo Fork. Что такое VibeSDK? VibeSDK — это производственная эталонная реализация, а не игрушечный пользовательский интерфейс. Репозиторий (с лицензией MIT) включает в себя интерфейс React+Vite, серверную … Читать далее

Улучшение рабочего места будущего

Уитни Чжан, студентка докторантуры Массачусетского технологического института (MIT) в области экономики, изучает вопросы экономики труда. Она исследует, как технологические и управленческие решения компаний влияют на работников с разным уровнем оплаты труда. Важность поддержки работников Чжан считает важным выстраивать отношения с лицами, формирующими политику, уделяя особое внимание подходу, основанному на доказательствах, при разработке политики, не забывая … Читать далее

Google Research представляет новый подход к машинному обучению для прогнозирования временных рядов

Введение в контекстуальную тонкую настройку (ICF) для прогнозирования временных рядов Google Research представляет TimesFM-ICF — метод продолжения предварительного обучения, который позволяет TimesFM использовать несколько связанных серий, предоставленных непосредственно в запросе во время вывода. В результате получается модель прогнозирования, которая работает с несколькими примерами и соответствует тонкой настройке под наблюдением, обеспечивая при этом точность на 6,8% … Читать далее

Оптимизация модели Transformer от начала до конца с помощью Hugging Face Optimum, ONNX Runtime и квантования

В этом руководстве мы рассмотрим, как использовать Hugging Face Optimum для оптимизации моделей Transformer, чтобы ускорить их работу, сохранив точность. Подготовка среды Сначала мы установим необходимые библиотеки и настроим среду для работы с Hugging Face Optimum и ONNX Runtime. Мы зададим пути, размер пакета и параметры итераций, а также проверим, работаем ли мы на CPU … Читать далее

OpenAI, Oracle и SoftBank расширяют проект Stargate, открыв пять новых площадок для дата-центров с искусственным интеллектом.

Компании OpenAI, Oracle и SoftBank объявили о создании пяти новых площадок для дата-центров Stargate. Это способствует ускорению реализации инфраструктурного проекта стоимостью 500 миллиардов долларов и мощностью 10 гигаватт в США. Цель проекта — обеспечить работу искусственного интеллекта нового поколения и создать десятки тысяч рабочих мест. 1. Какие компании участвуют в проекте Stargate и какова их … Читать далее

Google AI представляет общедоступную предварительную версию Chrome DevTools MCP

Google выпустила общедоступную предварительную версию «Chrome DevTools MCP» — сервера Model Context Protocol (MCP), который позволяет агентам по кодированию с использованием искусственного интеллекта контролировать и проверять работающий экземпляр Chrome. Сервер записывает данные о производительности, проверяет DOM и CSS, выполняет JavaScript, считывает вывод консоли и автоматизирует пользовательские потоки. Что такое Chrome DevTools MCP? MCP — это … Читать далее

Знакомьтесь: VoXtream — модель синтеза речи с открытым исходным кодом для использования в реальном времени, которая начинает говорить с первого слова

VoXtream — модель синтеза речи (Text-to-Speech, TTS) с открытым исходным кодом, разработанная группой Speech, Music and Hearing Королевского технологического института (KTH). Она предназначена для использования в реальном времени и начинает говорить после первого слова. Проблемы существующих систем TTS Большинство систем потокового TTS всё ещё ожидают получения фрагмента текста, прежде чем начать воспроизведение звука. Из-за этого … Читать далее

Как создать надёжных диалоговых агентов искусственного интеллекта с помощью Parlant?

Parlant — это фреймворк, разработанный для помощи разработчикам в создании готовых к производству агентов искусственного интеллекта, которые работают стабильно и надёжно. При развёртывании агентов на основе больших языковых моделей (LLM) часто возникает проблема: они хорошо работают при тестировании, но не справляются при взаимодействии с реальными пользователями. Они могут игнорировать тщательно разработанные системные подсказки, генерировать неточные … Читать далее

CNA внедряет искусственный интеллект в работу редакции.

В серии материалов от OpenAI «Executive Function» вы узнаете, как CNA трансформирует свою редакцию с помощью ИИ. Главный редактор Вальтер Фернандес делится мыслями о внедрении искусственного интеллекта, корпоративной культуре и будущем журналистики. 1. Какие аспекты работы редакции CNA трансформирует искусственный интеллект? Ответ: в статье упоминается, что ИИ внедряется в работу редакции CNA, но конкретные аспекты … Читать далее