Руководство по программированию для создания и проверки сквозных разделённых конвейеров обработки данных в Dagster с интеграцией машинного обучения

В этом руководстве мы реализуем продвинутый конвейер обработки данных с помощью Dagster. Мы настроим специальный CSV-IOManager для сохранения ресурсов, определим разделённую ежедневную генерацию данных и обработаем синтетические данные о продажах с помощью очистки, разработки функций и обучения модели. Установка необходимых библиотек Мы начнём с установки необходимых библиотек: Dagster, Pandas и scikit-learn, чтобы иметь полный набор … Читать далее

Встречайте dots.ocr: новая модель vision-language на 1,7 миллиарда параметров, которая демонстрирует передовые результаты в многоязычном анализе документов

dots.ocr — это модель-трансформер с открытым исходным кодом, разработанная для анализа структуры многоязычных документов и оптического распознавания символов (OCR). Она объединяет в себе обнаружение структуры и распознавание контента в рамках единой архитектуры, поддерживая более 100 языков и широкий спектр структурированных и неструктурированных типов документов. Архитектура Единая модель: dots.ocr объединяет обнаружение структуры и распознавание контента в … Читать далее

Amazon представляет AgentCore Gateway: новый уровень интеграции инструментов для корпоративных ИИ-агентов

Amazon Web Services (AWS) запустила Amazon Bedrock AgentCore Gateway — управляемый сервис, призванный упростить и масштабировать интеграцию ИИ-агентов с инструментами для корпоративных клиентов. Основные инновации, лежащие в основе интеграции агентов Создание инструментов MCP без написания кода Одной из выдающихся особенностей AgentCore Gateway является его способность трансформировать существующие REST API и функции AWS Lambda в инструменты, … Читать далее

NVIDIA выпустила крупнейший датасет для искусственного интеллекта в области распознавания речи и передовые модели для европейских языков

Компания NVIDIA сделала значительный шаг вперёд в разработке мультилингвального искусственного интеллекта для распознавания речи. Она представила Granary — крупнейший датасет с открытым исходным кодом для европейских языков, а также две передовые модели: Canary-1b-v2 и Parakeet-tdt-0.6b-v3. Этот релиз устанавливает новый стандарт для доступных и высококачественных ресурсов в области автоматического распознавания речи (ASR) и речевого перевода (AST), … Читать далее

R-Zero: полностью автономная система искусственного интеллекта, которая генерирует собственные обучающие данные с нуля

Большие языковые модели (LLM) произвели революцию в таких областях, как понимание естественного языка, логическое мышление и генерация кода. Однако их способность рассуждать на поистине сверхчеловеческом уровне ограничивается необходимостью в огромных объёмах высококачественных данных, размеченных человеком. Команда исследователей из Tencent AI Seattle Lab, Вашингтонского университета, Университета Мэриленда и Техасского университета предложила R-Zero — систему, предназначенную для … Читать далее

РеаГАН: сетевая агентская сеть с возможностью извлечения глобальной семантики, которая наделяет узлы автономным планированием

Группа исследователей из Университета Рутгерса представила ReaGAN — сетевую агентскую сеть с возможностью извлечения глобальной семантики, которая позволяет каждому узлу действовать как независимый агент. Почему традиционные ГНС испытывают трудности Графические нейронные сети (ГНС) являются основой для многих задач, таких как анализ цитирования, рекомендательные системы и научная категоризация. Традиционно ГНС работают через статическую, однородную передачу сообщений: … Читать далее

Salesforce выпускает Moirai 2.0: новейшая модель для работы с временными рядами

Исследователи из Salesforce AI представили Moirai 2.0 — последний шаг вперёд в области моделей для работы с временными рядами. Модель построена на архитектуре декодер-только (decoder-only transformer), что устанавливает новый стандарт производительности и эффективности. Она заняла первое место в бенчмарке GIFT-Eval — золотом стандарте для оценки моделей прогнозирования временных рядов. Что делает Moirai 2.0 особенной? Инновации … Читать далее

Руководство по реализации интеллектуальных параллельных рабочих процессов в Parsl для выполнения мультиинструментов AI-агента

В этом руководстве мы реализуем конвейер AI-агента с использованием Parsl, используя его возможности параллельного выполнения для запуска нескольких вычислительных задач в виде независимых приложений Python. Мы настраиваем локальный ThreadPoolExecutor для параллельного выполнения, определяем специализированные инструменты, такие как вычисление чисел Фибоначчи, подсчёт простых чисел, извлечение ключевых слов и имитация вызовов API, и координируем их через упрощённый … Читать далее

Как искусственный интеллект может ускорить разработку РНК-вакцин и других РНК-терапий

Исследователи из Массачусетского технологического института (MIT) разработали новый способ создания наночастиц, которые могут более эффективно доставлять РНК-вакцины и другие виды РНК-терапии. Используя искусственный интеллект, они обучили модель машинного обучения анализировать тысячи существующих частиц-носителей. Затем модель использовали для прогнозирования новых материалов, которые работают ещё лучше. «Мы применили инструменты машинного обучения, чтобы ускорить идентификацию оптимальных смесей ингредиентов … Читать далее

Ведущие модели искусственного интеллекта в Европе в 2025 году: многоязычные, открытые и готовые для корпоративного использования

Экосистема искусственного интеллекта в Европе в 2025 году — это мощная площадка для открытых инноваций, многоязычных возможностей и корпоративных решений. Ниже представлен подробный, проверенный обзор наиболее продвинутых моделей искусственного интеллекта в регионе с техническими характеристиками, лицензиями и выдающимися преимуществами. Mistral AI (Франция) Компания Mistral AI, основанная в Париже в 2023 году, является ведущей силой в … Читать далее

Шесть топовых новостных блогов о Model Context Protocol (MCP) (обновление за 2025 год)

По мере развития Model Context Protocol (MCP) в направлении «USB-C порта для приложений искусственного интеллекта», соединяющего агентов ИИ с инструментами и данными всего мира, эти авторитетные блоги и сайты становятся незаменимыми для всех, кто стремится использовать MCP для корпоративной интеграции, разработки или исследований. Вот список лучших ресурсов MCP, за которыми стоит следить в 2025 году. … Читать далее

Эффективные агенты искусственного интеллекта не обязательно должны быть дорогими: вот доказательства

Проблема дороговизны агентов ИИ Использование агентов искусственного интеллекта в больших масштабах становится слишком дорогим? Это актуальная тема в мире искусственного интеллекта, и новое исследование от команды OPPO AI Agent Team наконец-то представляет реальные цифры и решения. Современные впечатляющие агенты ИИ могут решать масштабные многоэтапные задачи с помощью таких мощных языковых моделей, как GPT-4 и Claude. … Читать далее

Динамическая точная настройка (DFT): преодоление разрыва в обобщении при контролируемой точной настройке (SFT) для больших языковых моделей

Контролируемая точная настройка (SFT) — это стандартный метод адаптации больших языковых моделей (LLM) к новым задачам путём их обучения на экспертных демонстрационных наборах данных. Он ценится за свою простоту и способность быстро развивать поведение, похожее на экспертное, но часто не достигает нужного уровня обобщения по сравнению с обучением с подкреплением (RL). RL позволяет моделям исследовать … Читать далее

Guardrails AI представляет Snowglobe: механизм симуляции для агентов и чат-ботов на основе ИИ

Компания Guardrails AI объявила о доступности Snowglobe — прорывного механизма симуляции, разработанного для решения одной из самых сложных задач в области диалогового ИИ: надёжного тестирования агентов и чат-ботов в масштабе перед их запуском в производство. Борьба с бесконечным пространством входных данных с помощью симуляции Оценка агентов ИИ, особенно открытых чат-ботов, традиционно требовала кропотливого создания сценариев … Читать далее

Google AI представляет Gemma 3 270M: компактная модель для высокоэффективной тонкой настройки под конкретные задачи

Компания Google AI расширила семейство Gemma, представив модель Gemma 3 270M — экономичную модель с 270 миллионами параметров, созданную специально для эффективной тонкой настройки под конкретные задачи. Эта модель демонстрирует надёжные возможности следования инструкциям и структурирования текста «из коробки», то есть готова к немедленному развёртыванию и настройке с минимальным дополнительным обучением. Философия дизайна: «правильный инструмент … Читать далее

Meta AI только что выпустила DINOv3: передовую модель компьютерного зрения, обученную с помощью самообучающегося обучения, генерирующую характеристики изображений высокого разрешения

Компания Meta AI выпустила DINOv3 — прорывную модель компьютерного зрения, работающую на основе самообучающегося обучения (SSL). Она устанавливает новые стандарты универсальности и точности при решении задач плотного прогнозирования без необходимости использования размеченных данных. Основные инновации и технические особенности * Обучение без использования меток. Модель DINOv3 обучается полностью без аннотаций человека, что делает её идеальной для … Читать далее

Использование генеративного искусственного интеллекта для разработки новых антибиотиков

С помощью генеративного искусственного интеллекта (ГИИ) исследователи из Массачусетского технологического института (MIT) разработали новые антибиотики, которые могут бороться с двумя устойчивыми к лекарствам инфекциями: Neisseria gonorrhoeae и Staphylococcus aureus (MRSA). Исследование химического пространства За последние 45 лет FDA одобрило несколько десятков новых антибиотиков, но большинство из них — варианты уже существующих препаратов. В то же … Читать далее

12 лучших инструментов для тестирования API в 2025 году

Тестирование API — важная часть современной разработки программного обеспечения, которая обеспечивает безопасность, надёжность и скорость цифровых сервисов. По мере того как API становятся всё более важными в облачных, мобильных, корпоративных и микросервисных экосистемах, инструменты для их тестирования должны развиваться, чтобы соответствовать техническим и бизнес-потребностям. Вот список из 12 лучших инструментов для тестирования API, которые стоит … Читать далее

Microsoft выпускает язык разметки для оркестрации промтов — POML

Разработка продвинутых приложений на основе больших языковых моделей (LLMs) стала основополагающей в сфере искусственного интеллекта. По мере усложнения промтов — включения в них динамических компонентов, множества ролей, структурированных данных и разнообразных форматов вывода — стали очевидны ограничения подходов, основанных на неструктурированном тексте. Microsoft выпустила Prompt Orchestration Markup Language (POML) — новый фреймворк с открытым исходным … Читать далее

ByteDance представляет ToolTrain: новая интегрированная с инструментами система обучения с подкреплением, которая переопределяет глубокий поиск в репозиториях

Локализация ошибок включает в себя определение точных мест в коде, которые требуют изменений для устранения проблем в программном обеспечении. Этот процесс часто требует значительных усилий со стороны разработчиков, особенно в крупных репозиториях. Из-за сложности и затратности по времени автоматизация этой задачи стала ключевым направлением исследований. Агенты на основе LLM позволяют языковым моделям использовать различные инструменты … Читать далее

Новый способ тестирования эффективности систем искусственного интеллекта при классификации текста

В современном мире всё чаще встречаются автоматизированные системы, которые классифицируют текст. Это могут быть системы, которые определяют, является ли отзыв о фильме положительным или отрицательным, или системы, которые проверяют, содержит ли новостная статья информацию о бизнесе или технологиях. Но как мы можем быть уверены в точности таких классификаций? Команда из Лаборатории информационных и управленческих систем … Читать далее

10 лучших блогов о новостях в сфере агентского ИИ и ИИ-агентов (обновление 2025 года)

В быстроразвивающейся области агентского ИИ и ИИ-агентов важно быть в курсе последних новостей. Представляем вам список из 10 лучших блогов о новостях в сфере ИИ-агентов и агентского ИИ (обновление 2025 года) — от лидеров отрасли до представителей академического сообщества. Эти ресурсы предлагают аналитику, руководства и обзоры, посвящённые ИИ-агентам и агентскому ИИ в 2025 году. 1. … Читать далее

Руководство по созданию модульного диалогового агента ИИ с помощью Pipecat и HuggingFace

В этом руководстве мы рассмотрим, как создать полноценного диалогового агента ИИ с нуля, используя фреймворк Pipecat. Мы настроим Pipeline, который связывает пользовательский ввод и генерацию ответов с помощью модели HuggingFace, а также форматирование и отображение потока беседы. Установка необходимых библиотек Сначала мы устанавливаем необходимые библиотеки, включая Pipecat, Transformers и PyTorch, а затем настраиваем импорты. Мы … Читать далее

Хотите быть в курсе последних новостей об ИИ-агентах и агентском ИИ? Обязательно посетите эти 10 сайтов! (Обновление 2025 года)

В стремительно развивающейся области агентского ИИ и ИИ-агентов важно быть в курсе событий. Вот полный, актуальный список лучших блогов и сайтов — от лидеров отрасли до представителей академического сообщества, предлагающих идеи, руководства и обзоры, посвящённые ИИ-агентам и агентскому ИИ в 2025 году. 1. OpenAI Blog Официальный блог OpenAI, создателей таких знаковых моделей, как ChatGPT, является … Читать далее

Почему Docker важен для стека искусственного интеллекта: воспроизводимость, переносимость и равенство сред

Рабочие процессы в области искусственного интеллекта (ИИ) и машинного обучения (МО) известны своей сложностью. Они включают в себя быстро меняющийся код, разнородные зависимости и необходимость строго повторяемых результатов. Подход к проблеме с базовых принципов — что на самом деле нужно ИИ для надёжности, совместной работы и масштабируемости — показывает, что контейнерные технологии, такие как Docker, … Читать далее

Mistral AI представляет Mistral Medium 3.1: повышение производительности и удобства использования искусственного интеллекта

Компания Mistral AI представила модель Mistral Medium 3.1, которая устанавливает новые стандарты в области мультимодального интеллекта, готовности к использованию на предприятиях и экономической эффективности для больших языковых моделей (LLM). Ключевые технические характеристики Mistral Medium 3.1 Общее повышение производительности:* Mistral Medium 3.1 вносит значительные улучшения в основные рассуждения, кодирование и мультимодальные компетенции. Пользователи получают более точное … Читать далее

Nebius AI продвигает открытые LLM с помощью обучения с подкреплением для создания эффективных агентов в области разработки ПО

Сфера автоматизации разработки программного обеспечения быстро развивается благодаря достижениям в области больших языковых моделей (LLM). Однако большинство подходов к обучению эффективных агентов основаны на проприетарных моделях или дорогостоящих методах, основанных на работе с учителями, что ограничивает возможности LLM с открытым исходным кодом в реальных сценариях. Команда исследователей из Nebius AI и Humanoid представила фреймворк обучения … Читать далее

NVIDIA представляет ProRLv2: новые горизонты в обучении языковых моделей с расширенным подкрепляющим обучением (RL)

Что такое ProRLv2? ProRLv2 — это новейшая версия технологии Prolonged Reinforcement Learning (ProRL) от NVIDIA, разработанная специально для расширения возможностей рассуждений в больших языковых моделях (LLM). Увеличивая количество шагов подкрепляющего обучения (RL) с 2000 до 3000, ProRLv2 систематически тестирует, как расширенное RL может открыть новые пространства решений, креативность и высокоуровневое рассуждение, которые ранее были недоступны … Читать далее

Знакомьтесь: LEANN — самая маленькая векторная база данных, которая демократизирует персональный искусственный интеллект с помощью эффективного поиска по приближённым соседям (ANN)

Поиск на основе встраивания превосходит традиционные методы поиска по ключевым словам в различных областях, фиксируя семантическое сходство с помощью плотных векторных представлений и поиска по приближённым соседям (ANN). Однако структура данных ANN требует чрезмерного объёма памяти, часто в 1,5–7 раз превышающего размер исходных необработанных данных. Такой объём памяти допустим в крупномасштабных веб-приложениях, но становится непрактичным … Читать далее

Масштабирование бухгалтерских мощностей с помощью OpenAI.

Разработано с использованием OpenAI o3, o3-Pro, GPT-4.1 и GPT-5. Агенты искусственного интеллекта от Basis помогают бухгалтерским фирмам сэкономить до 30% времени и расширить возможности для консалтинга и роста. 1. Какие модели искусственного интеллекта используются для масштабирования бухгалтерских мощностей? * В статье упоминается, что для масштабирования бухгалтерских мощностей используются модели OpenAI o3, o3-Pro, GPT-4.1 и GPT-5. … Читать далее