Переход на протокол Model Context (MCP): руководство по внедрению с акцентом на адаптеры

Protocol Model Context (MCP) быстро стал универсальным стандартом для подключения моделей искусственного интеллекта (ИИ) к различным приложениям, системам и инструментам. Представьте себе MCP как «USB-C для интеграций ИИ», как это часто описывают в отрасли. Для организаций, привыкших к индивидуальным интеграциям, переход на MCP может стать настоящим преобразованием, одновременно сокращая технический долг и открывая новые возможности … Читать далее

Привет, формулы с ИИ: почему =COPILOT() — это крупнейшее обновление Excel за последние годы

Microsoft официально представила функцию COPILOT в Excel для Windows и Mac. Она позволяет использовать возможности больших языковых моделей (LLMs) прямо в электронных таблицах. Это фундаментальный сдвиг: ИИ теперь является встроенной функцией, а не просто внешней надстройкой или отдельным инструментом. Пользователи могут анализировать, обобщать и генерировать данные, используя подсказки на естественном языке прямо внутри формул Excel. … Читать далее

Оценка надёжности больших языковых моделей: сигнал и шум

Оценка больших языковых моделей (LLM) требует значительных научных и экономических затрат. Поскольку сфера стремится к созданию всё более крупных моделей, методология их оценки и сравнения становится всё более важной — не только для получения эталонных показателей, но и для обоснованных решений о разработке. Недавнее исследование Института искусственного интеллекта Аллена (Ai2) представляет надёжную систему, основанную на … Читать далее

Реализация кодирования для создания полноценного рабочего процесса LLM на собственном оборудовании с помощью Ollama, REST API и интерфейса чата Gradio

В этом руководстве мы реализуем полнофункциональную среду Ollama внутри Google Colab для воспроизведения рабочего процесса LLM на собственном оборудовании. Установка Ollama в Google Colab 1. Устанавливаем Ollama непосредственно на виртуальную машину Colab с помощью официального установщика Linux.2. Запускаем сервер Ollama в фоновом режиме, чтобы открыть HTTP API на `localhost:11434`.3. Проверяем службу.4. Загружаем лёгкие модели, такие … Читать далее

Знакомьтесь: M3-Agent — мультимодальный агент с долговременной памятью и улучшенными способностями к рассуждению

В будущем домашний робот сможет самостоятельно управлять повседневными делами и изучать закономерности в ведении хозяйства на основе полученного опыта. Например, он может подавать кофе по утрам без напоминаний, запомнив ваши привычки. Для мультимодального агента такой интеллект зависит от:* непрерывного наблюдения за миром с помощью мультимодальных датчиков;* сохранения опыта в долговременной памяти;* рассуждений на основе этой … Читать далее

NVIDIA выпустила семейство моделей искусственного интеллекта Nemotron Nano 2

Компания NVIDIA представила семейство гибридных больших языковых моделей (LLM) Nemotron Nano 2. Они не только обеспечивают высочайшую точность рассуждений, но и демонстрируют в 6 раз более высокую производительность по сравнению с моделями аналогичного размера. Основные характеристики:* Производительность: модели Nemotron Nano 2 обеспечивают в 6,3 раза более высокую скорость генерации токенов по сравнению с моделями типа … Читать далее

Memp: универсальная платформа для оптимизации процедурной памяти в агентах на базе LLM

Агенты на базе больших языковых моделей (LLM) стали достаточно мощными, чтобы справляться со сложными задачами, начиная от веб-исследований и создания отчётов и заканчивая анализом данных и многошаговыми рабочими процессами в программном обеспечении. Однако они испытывают трудности с процедурной памятью, которая сегодня часто жёстко запрограммирована, разработана вручную или «зашита» в весах моделей. Это делает их уязвимыми: … Читать далее

Новая модель предсказывает, как молекулы будут растворяться в разных растворителях

Используя машинное обучение, инженеры-химики из Массачусетского технологического института (MIT) создали вычислительную модель, которая может предсказать, насколько хорошо любая заданная молекула растворится в органическом растворителе. Это ключевой шаг в синтезе почти любого фармацевтического препарата. Предсказание растворимости Новая модель, которая предсказывает, сколько растворённого вещества растворится в конкретном растворителе, должна помочь химикам выбирать правильный растворитель для любой заданной … Читать далее

BlackRock представляет AlphaAgents: продвижение в построении портфелей акций с помощью совместной работы мультиагентных языковых моделей

Использование искусственного интеллекта (ИИ) на финансовых рынках стремительно развивается, и большие языковые модели (LLM) всё чаще применяются для анализа акций, управления портфелями и выбора ценных бумаг. Исследовательская группа BlackRock предложила AlphaAgents для инвестиционных исследований. Необходимость мультиагентных систем в исследованиях акций Управление портфелями акций традиционно опирается на аналитиков, которые синтезируют огромные объёмы разнообразных данных — финансовые … Читать далее

Мастерство кодирования с помощью больших языковых моделей: плюсы, минусы и лучшие практики для инженеров данных

Большие языковые модели (LLM) позволяют инженерам описывать цели конвейера на простом английском языке и получать сгенерированный код — такой рабочий процесс называют vibe coding. При правильном использовании это может ускорить создание прототипов и документацию. Однако при небрежном подходе можно столкнуться с незаметным повреждением данных, рисками для безопасности или кодом, который сложно поддерживать. В этой статье … Читать далее

Команда Qwen представляет Qwen-Image-Edit: версию Qwen-Image для редактирования изображений с расширенными возможностями семантического и внешнего редактирования

В области мультимодального искусственного интеллекта модели для редактирования изображений на основе инструкций преобразуют взаимодействие пользователей с визуальным контентом. Команда Alibaba’s Qwen выпустила Qwen-Image-Edit в августе 2025 года. Эта модель основана на Qwen-Image с 20 миллиардами параметров и предоставляет расширенные возможности редактирования. Архитектура и ключевые инновации Qwen-Image-Edit расширяет архитектуру мультимодального диффузионного трансформатора (MMDiT) Qwen-Image, которая включает … Читать далее

Создание информационных панелей с помощью Vizro MCP

Vizro — это инструмент Python с открытым исходным кодом от McKinsey, который упрощает создание красивых, готовых к использованию приложений для визуализации данных. С помощью всего нескольких строк конфигурации (через JSON, YAML или словари Python) можно создать многостраничные информационные панели, для которых обычно требуются тысячи строк кода. Vizro, созданный на основе Plotly, Dash и Pydantic, сочетает … Читать далее

Исследователи заглянули внутрь работы языковых моделей для белков

В последние несколько лет модели, которые могут предсказывать структуру или функцию белков, стали широко использоваться в различных биологических приложениях, таких как определение мишеней для лекарств и разработка новых терапевтических антител. Эти модели, основанные на больших языковых моделях (LLMs), могут делать очень точные прогнозы о пригодности белка для конкретного применения. Однако нет способа определить, как эти … Читать далее

Вопросы и ответы с главным директором по персоналу компании DoorDash — Марианой Гаравалья

Узнайте, как компания DoorDash расширяет использование искусственного интеллекта, чтобы дать сотрудникам возможность быстрее создавать, учиться и внедрять инновации. В этом разговоре участвует главный директор по персоналу Мариана Гаравалья. 1. Какие возможности искусственного интеллекта используются в компании DoorDash для развития сотрудников? Ответ: в компании DoorDash искусственный интеллект применяется для ускорения процессов создания, обучения и внедрения инноваций … Читать далее

Протокол контекста модели MCP — недостающий стандарт в инфраструктуре искусственного интеллекта?

Бурный рост искусственного интеллекта, особенно больших языковых моделей (LLM), изменил принципы работы бизнеса: от автоматизации обслуживания клиентов до улучшения анализа данных. Однако по мере интеграции ИИ в основные рабочие процессы возникает постоянная проблема: как безопасно и эффективно подключить эти модели к реальным источникам данных без необходимости создания индивидуальных фрагментированных интеграций. В ноябре 2024 года компания … Читать далее

Alibaba выпустила новую версию мультимодальной языковой модели Ovis 2.5

Команда Alibaba AIDC-AI выпустила Ovis2.5 — новейшую большую мультимодальную языковую модель (MLLM). Она стала настоящим прорывом в сообществе разработчиков открытого ИИ благодаря своим вариантам с 9 миллиардами и 2 миллиардами параметров. Новые возможности Ovis2.5 Ovis2.5 устанавливает новые стандарты производительности и эффективности, предлагая технические усовершенствования, направленные на восприятие изображений в исходном разрешении, глубокое мультимодальное рассуждение и … Читать далее

Что такое вывод в искусственном интеллекте? Техническое погружение и топ-9 провайдеров вывода ИИ (издание 2025 года)

Искусственный интеллект (ИИ) быстро развивается, особенно в том, как модели используются и работают в реальных системах. Ключевая функция, которая связывает обучение модели с практическим применением, — это «вывод». Вывод против обучения: критическая разница Развёртывание модели ИИ состоит из двух основных этапов: 1. Обучение — это процесс, в котором модель изучает закономерности на больших размеченных наборах … Читать далее

Создание AI-агента на базе MCP с использованием Gemini и фреймворка mcp-agent: пошаговое руководство по реализации

В этом руководстве мы рассмотрим создание продвинутого AI-агента с использованием mcp-agent и Gemini. Мы начнём с настройки надёжной среды со всеми необходимыми зависимостями, а затем реализуем сервер инструментов MCP, который предоставляет структурированные сервисы, такие как веб-поиск, анализ данных, выполнение кода и получение информации о погоде. Установка пакетов Мы определяем функцию `install_packages`, которая задаёт все зависимости, … Читать далее

Hugging Face представляет AI Sheets: бесплатный инструмент без кода для работы с наборами данных на базе больших языковых моделей с открытым исходным кодом

Hugging Face выпустила AI Sheets — бесплатный инструмент без кода с открытым исходным кодом, предназначенный для радикального упрощения создания и обогащения наборов данных с помощью искусственного интеллекта. Что такое AI Sheets? AI Sheets — это инструмент для работы с данными в виде электронных таблиц, специально разработанный для работы с наборами данных и использования моделей искусственного … Читать далее

Как протестировать модель OpenAI на устойчивость к одношаговым атакам методом red teaming с помощью deepteam

В этом руководстве мы рассмотрим, как протестировать модель OpenAI на устойчивость к одношаговым атакам методом red teaming с помощью инструмента deepteam. Deepteam предлагает более 10 методов атак, таких как внедрение подсказок, взлом тюремного заключения и литский язык, которые выявляют слабые места в приложениях на основе больших языковых моделей (LLM). Установка зависимостей Для начала работы установите … Читать далее

Что такое редокомандирование в сфере ИИ?

Редокомандирование в сфере ИИ — это процесс систематической проверки систем искусственного интеллекта, особенно генеративных моделей ИИ и моделей машинного обучения, на устойчивость к атакам и сценариям нагрузки на безопасность. Редокомандирование выходит за рамки классического тестирования на проникновение. Если тестирование на проникновение направлено на выявление известных программных ошибок, то редокомандирование исследует неизвестные уязвимости, связанные с ИИ, … Читать далее

Встречайте DeepFleet: новый набор моделей искусственного интеллекта от Amazon, который может прогнозировать будущие схемы движения для парков мобильных роботов

Amazon достигла значительного рубежа, развернув свой миллионный робот в глобальных центрах выполнения заказов и сортировки, укрепив свои позиции в качестве крупнейшего в мире оператора промышленной мобильной робототехники. Это достижение совпало с запуском DeepFleet — новаторского набора базовых моделей, предназначенных для улучшения координации между огромными парками мобильных роботов. Рост популярности базовых моделей в робототехнике Базовые модели, … Читать далее

От внедрения к масштабированию: 11 основополагающих концепций корпоративного ИИ для современного бизнеса

Оглавление * The AI Integration Gap (Проблема интеграции ИИ)* The Native Advantage (Естественное преимущество)* The Human-in-the-Loop Effect (Эффект человека в контуре)* The Data Gravity Rule (Правило гравитации данных)* The RAG Reality (Реальность RAG)* The Agentic Shift (Агентский сдвиг)* The Feedback Flywheel (Механизм обратной связи)* The Vendor Lock Mirage (Мираж вендорской блокировки)* The Trust Threshold (Порог … Читать далее

Руководство по программированию для создания и проверки сквозных разделённых конвейеров обработки данных в Dagster с интеграцией машинного обучения

В этом руководстве мы реализуем продвинутый конвейер обработки данных с помощью Dagster. Мы настроим специальный CSV-IOManager для сохранения ресурсов, определим разделённую ежедневную генерацию данных и обработаем синтетические данные о продажах с помощью очистки, разработки функций и обучения модели. Установка необходимых библиотек Мы начнём с установки необходимых библиотек: Dagster, Pandas и scikit-learn, чтобы иметь полный набор … Читать далее

Встречайте dots.ocr: новая модель vision-language на 1,7 миллиарда параметров, которая демонстрирует передовые результаты в многоязычном анализе документов

dots.ocr — это модель-трансформер с открытым исходным кодом, разработанная для анализа структуры многоязычных документов и оптического распознавания символов (OCR). Она объединяет в себе обнаружение структуры и распознавание контента в рамках единой архитектуры, поддерживая более 100 языков и широкий спектр структурированных и неструктурированных типов документов. Архитектура Единая модель: dots.ocr объединяет обнаружение структуры и распознавание контента в … Читать далее

Amazon представляет AgentCore Gateway: новый уровень интеграции инструментов для корпоративных ИИ-агентов

Amazon Web Services (AWS) запустила Amazon Bedrock AgentCore Gateway — управляемый сервис, призванный упростить и масштабировать интеграцию ИИ-агентов с инструментами для корпоративных клиентов. Основные инновации, лежащие в основе интеграции агентов Создание инструментов MCP без написания кода Одной из выдающихся особенностей AgentCore Gateway является его способность трансформировать существующие REST API и функции AWS Lambda в инструменты, … Читать далее

NVIDIA выпустила крупнейший датасет для искусственного интеллекта в области распознавания речи и передовые модели для европейских языков

Компания NVIDIA сделала значительный шаг вперёд в разработке мультилингвального искусственного интеллекта для распознавания речи. Она представила Granary — крупнейший датасет с открытым исходным кодом для европейских языков, а также две передовые модели: Canary-1b-v2 и Parakeet-tdt-0.6b-v3. Этот релиз устанавливает новый стандарт для доступных и высококачественных ресурсов в области автоматического распознавания речи (ASR) и речевого перевода (AST), … Читать далее

R-Zero: полностью автономная система искусственного интеллекта, которая генерирует собственные обучающие данные с нуля

Большие языковые модели (LLM) произвели революцию в таких областях, как понимание естественного языка, логическое мышление и генерация кода. Однако их способность рассуждать на поистине сверхчеловеческом уровне ограничивается необходимостью в огромных объёмах высококачественных данных, размеченных человеком. Команда исследователей из Tencent AI Seattle Lab, Вашингтонского университета, Университета Мэриленда и Техасского университета предложила R-Zero — систему, предназначенную для … Читать далее

РеаГАН: сетевая агентская сеть с возможностью извлечения глобальной семантики, которая наделяет узлы автономным планированием

Группа исследователей из Университета Рутгерса представила ReaGAN — сетевую агентскую сеть с возможностью извлечения глобальной семантики, которая позволяет каждому узлу действовать как независимый агент. Почему традиционные ГНС испытывают трудности Графические нейронные сети (ГНС) являются основой для многих задач, таких как анализ цитирования, рекомендательные системы и научная категоризация. Традиционно ГНС работают через статическую, однородную передачу сообщений: … Читать далее

Salesforce выпускает Moirai 2.0: новейшая модель для работы с временными рядами

Исследователи из Salesforce AI представили Moirai 2.0 — последний шаг вперёд в области моделей для работы с временными рядами. Модель построена на архитектуре декодер-только (decoder-only transformer), что устанавливает новый стандарт производительности и эффективности. Она заняла первое место в бенчмарке GIFT-Eval — золотом стандарте для оценки моделей прогнозирования временных рядов. Что делает Moirai 2.0 особенной? Инновации … Читать далее