Использование генеративного искусственного интеллекта для разнообразия виртуальных тренировочных площадок для роботов

Чат-боты вроде ChatGPT и Claude за последние три года стали невероятно популярными, поскольку могут помочь вам в решении широкого спектра задач. От написания шекспировских сонетов до отладки кода или поиска ответа на каверзный вопрос — системы искусственного интеллекта, похоже, готовы прийти на помощь. Источник такой универсальности — миллиарды или даже триллионы текстовых данных из интернета. … Читать далее

Anthropic выпустила Petri: фреймворк с открытым исходным кодом для автоматизированного аудита

Как проверить пограничные языковые модели на несогласованное поведение в реалистичных условиях с использованием инструментов в многошаговых сценариях — в масштабе и за пределами общих агрегированных показателей? Anthropic выпустила Petri (Parallel Exploration Tool for Risky Interactions) — фреймворк с открытым исходным кодом, который автоматизирует аудит согласованности, используя агента-аудитора для проверки целевой модели в различных сценариях, и … Читать далее

Расширение влияния и масштабов с помощью ChatGPT.

Узнайте, как HiBob использует ChatGPT Enterprise и пользовательские GPT для расширения внедрения искусственного интеллекта, увеличения доходов, оптимизации HR-процессов и предоставления функций на базе ИИ на платформе Bob. 1. Какие конкретные HR-процессы оптимизирует компания HiBob с помощью ChatGPT Enterprise и пользовательских GPT? Ответ: в статье указано, что компания HiBob использует ChatGPT Enterprise и пользовательские GPT для … Читать далее

Model Context Protocol (MCP) vs Function Calling vs OpenAPI Tools — Когда использовать каждый из них?

Оглавление Таблица сравнения Преимущества и ограничения Безопасность и управление Сигналы экосистемы (переносимость/принятие) Правила принятия решений Ссылки Model Context Protocol (MCP) — это открытый, независимый от транспорта протокол, который стандартизирует обнаружение и вызов инструментов/ресурсов на разных хостах и серверах. Он лучше всего подходит для переносимых систем, использующих несколько инструментов и сред выполнения. Function Calling — это … Читать далее

Google AI представляет Gemini 2.5 «Computer Use» (предварительный просмотр): модель управления браузером для взаимодействия ИИ-агентов с пользовательскими интерфейсами

Что такое Gemini 2.5 «Computer Use»? Это специализированная версия Gemini 2.5, которая планирует и выполняет реальные действия с пользовательским интерфейсом в работающем браузере через ограниченный API действий. Модель доступна в виде предварительной версии через Google AI Studio и Vertex AI. Она нацелена на автоматизацию веб-процессов и тестирование пользовательских интерфейсов. Какие возможности предоставляет модель? Разработчики вызывают … Читать далее

Meta AI выпускает OpenZL: фреймворк для сжатия с учётом формата и универсальным декодером с открытым исходным кодом

Meta AI представила OpenZL — это фреймворк с открытым исходным кодом, который создаёт специализированные компрессоры с учётом формата на основе высокоуровневых описаний данных и выдаёт самоописываемый формат передачи данных, который может считывать универсальный декодер. Это позволяет отделить эволюцию компрессоров от внедрения новых версий декодеров. Насколько высокой будет степень сжатия и пропускная способность, если обучить графовый … Читать далее

Интеллектуальный диалоговый конвейер машинного обучения, объединяющий агентов LangChain и XGBoost для автоматизированных рабочих процессов в области науки о данных

В этом руководстве мы объединяем аналитические возможности XGBoost с диалоговым интеллектом LangChain. Мы создаём комплексный конвейер, который может генерировать синтетические наборы данных, обучать модель XGBoost, оценивать её производительность и визуализировать ключевые выводы — всё это с помощью модульных инструментов LangChain. Этапы работы 1. Генерация данных. Используем LangChain для генерации синтетического классификационного набора данных с помощью … Читать далее

Борьба за здоровье планеты с помощью искусственного интеллекта

Для Прии Донти детские поездки в Индию были не просто возможностью навестить родственников. Эти путешествия каждые два года пробудили в ней мотивацию, которая продолжает определять её исследования и преподавательскую деятельность. Контрастируя с семейным домом в Массачусетсе, Донти — профессор развития карьеры семьи Сильверман на факультете электротехники и информатики (EECS), общая должность между MIT Schwarzman College … Читать далее

Пресечение злонамеренного использования ИИ: октябрь 2025 года.

Узнайте, как OpenAI выявляет и пресекает злонамеренное использование ИИ, из нашего отчёта за октябрь 2025 года. Узнайте, как мы боремся со злоупотреблением, внедряем политики и защищаем пользователей от реальных угроз. 1. Какие методы и технологии использует OpenAI для выявления злонамеренного использования ИИ? Ответ: в отчёте за октябрь 2025 года указано, что OpenAI применяет различные методы … Читать далее

Google DeepMind представляет CodeMender: новый ИИ-агент для автоматического устранения критических уязвимостей в программном обеспечении

Google DeepMind представляет CodeMender — ИИ-агент, который использует Gemini Deep Think для автоматического устранения критических уязвимостей в программном обеспечении. ИИ-агент может:* локализовать первопричину;* доказать правильность предложенного исправления с помощью автоматизированного анализа и тестирования;* превентивно переписать соответствующий код, чтобы устранить целый класс уязвимостей;* открыть апстрим-патч для проверки. Что такое CodeMender? CodeMender — это инструмент, который генерирует, … Читать далее

Новая модель прогнозирования может повысить надёжность термоядерных электростанций

Печатный алюминиевый сплав устанавливает рекорды прочности, может облегчить детали самолётов Токамаки — это машины, которые должны удерживать и использовать энергию, подобную солнечной. В этих термоядерных установках используются мощные магниты для удержания плазмы, более горячей, чем ядро Солнца, и для сжатия атомов плазмы, чтобы они слились и высвободили энергию. Если токамаки будут работать безопасно и эффективно, … Читать далее

Создание интерфейса передачи дел от ИИ к человеку для страхового агента на базе Parlant и Streamlit

Передача дел от ИИ к человеку — ключевой компонент автоматизации обслуживания клиентов. Она обеспечивает плавный переход от ИИ к квалифицированному специалисту, когда ИИ достигает своих пределов. В этом руководстве мы реализуем систему передачи дел от ИИ к человеку для страхового агента на базе Parlant. Установка зависимостей Убедитесь, что у вас есть действующий ключ API OpenAI. … Читать далее

OpenAI представляет Agent Builder и AgentKit: визуальный стек для создания, развёртывания и оценки ИИ-агентов

Компания OpenAI выпустила AgentKit — интегрированную платформу, которая объединяет визуальный конструктор Agent Builder, встраиваемый интерфейс ChatKit UI и расширенные инструменты оценки Evals в единый рабочий процесс для запуска производственных агентов. Запуск включает бета-версию Agent Builder и общедоступные версии остальных компонентов. Что нового? Agent Builder (бета-версия) — это визуальный холст для создания многошаговых, мультиагентных рабочих процессов … Читать далее

Codex стал общедоступным

Представляем новые приложения в ChatGPT и новый Apps SDK. OpenAI Codex теперь доступен для общего пользования. Разработчикам предлагаются новые мощные функции: интеграция со Slack, Codex SDK и инструменты для администраторов, такие как панели мониторинга использования и инструменты управления рабочими пространствами — всё это упрощает использование Codex и управление им в крупных масштабах. Мы представляем новое … Читать далее

Новый подход к надзору, ориентированный на агентства, позволяет масштабировать программных агентов ИИ всего на 78 примерах

Исследователи из Шанхайского университета Цзяо Тун и лаборатории генеративного искусственного интеллекта SII (GAIR) предлагают метод тонкой настройки под названием LIMI («Меньше значит больше для агентства»). Этот метод превращает базовую модель в эффективного программного/исследовательского агента, используя всего 78 образцов. Принцип эффективности агентств: метод LIMI утверждает, что агентская компетентность больше зависит от качества/структуры данных, чем от количества … Читать далее

AMD и OpenAI объявили о стратегическом партнёрстве по внедрению 6 гигаватт графических процессоров AMD.

Компании AMD и OpenAI заключили многолетнее партнёрство по внедрению 6 гигаватт графических процессоров AMD Instinct. Начиная с 2026 года планируется внедрить 1 гигаватт. Это будет использоваться для обеспечения работы инфраструктуры искусственного интеллекта следующего поколения от OpenAI и ускорения глобальных инноваций в сфере ИИ. 1. Какие компании заключили стратегическое партнёрство и для чего оно необходимо? Ответ: … Читать далее

Ускорение внедрения искусственного интеллекта в Европе

OpenAI и Allied for Startups выпустили отчёт Hacktivate AI, содержащий 20 конкретных идей для политики, которые помогут ускорить внедрение искусственного интеллекта в Европе, повысить конкурентоспособность и расширить возможности для новаторов. 🚀 1. Какие основные проблемы и вызовы существуют при внедрении искусственного интеллекта в Европе, согласно отчёту Hacktivate AI? В отчёте Hacktivate AI, выпущенном OpenAI и … Читать далее

StreamTensor: компилятор для потоковой передачи промежуточных данных LLM через потоки данных FPGA

Что такое StreamTensor? StreamTensor — это компилятор, который преобразует графики PyTorch (GPT-2, Llama, Qwen, Gemma) в потоковые планировщики данных на FPGA Alveo U55C от AMD. Система вводит итеративный тип тензора (itensor) для кодирования плитки/порядка потоков, обеспечивая корректную потоковую передачу между ядрами и автоматическую вставку/настройку размеров DMA-движков, FIFO и преобразователей формата. Компилятор StreamTensor преобразует графики PyTorch … Читать далее

Salesforce AI Research выпускает CoDA-1.7B: модель кода на основе дискретной диффузии с двунаправленной параллельной генерацией токенов

Исследователи из Salesforce AI Research выпустили CoDA-1.7B — языковую модель для кода на основе диффузии, которая генерирует целые последовательности с учётом двунаправленного контекста, обновляя несколько токенов параллельно, а не последовательно, как при предсказании следующего токена слева направо. Команда исследователей опубликовала контрольные точки Base и Instruct, а также комплексный стек для обучения, оценки и обслуживания. Понимание … Читать далее

Методология агентного проектирования: как создавать надёжных и человекоподобных ИИ-агентов с помощью Parlant

Создание устойчивых ИИ-агентов принципиально отличается от традиционной разработки программного обеспечения, поскольку фокусируется на вероятностном поведении моделей, а не на детерминированном выполнении кода. В этом руководстве представлен нейтральный обзор методологий проектирования ИИ-агентов, которые являются надёжными и адаптируемыми, с акцентом на создание чётких границ, эффективного поведения и безопасных взаимодействий. Что такое агентное проектирование? Агентное проектирование относится к … Читать далее

Как оценивать голосовых агентов в 2025 году: за пределами автоматического распознавания речи (ASR) и частоты ошибок в словах (WER)

Оценка голосовых агентов выходит за рамки простого измерения точности ASR и WER. Для современных интерактивных голосовых агентов требуется комплексная оценка, включающая успешность выполнения задач, поведение при прерывании и галлюцинации в условиях шума. Почему WER недостаточно? WER измеряет точность транскрипции, а не качество взаимодействия. Два агента с одинаковым WER могут сильно различаться по успешности диалога из-за … Читать далее

Новая архитектура двуствольного энкодера-декодера для повышения качества речи без надзора

В статье предлагается новая архитектура двуствольного энкодера-декодера для повышения качества речи без надзора (Unsupervised Speech Enhancement, USE). Команда исследователей из Технологического университета Брно и Университета Джонса Хопкинса разработала метод USE-DDP (Unsupervised Speech Enhancement using Data-defined Priors). Что важно? Большинство методов повышения качества речи на основе обучения зависят от парных записей чистой и шумной речи, которые … Читать далее

Реализация кодирования для создания регрессионной языковой модели на основе трансформера для прогнозирования непрерывных значений из текста

В этой реализации кодирования мы создадим регрессионную языковую модель (Regression Language Model, RLM) — модель, которая прогнозирует непрерывные числовые значения непосредственно из текстовых последовательностей. Вместо классификации или генерации текста мы сосредоточимся на обучении архитектуры на основе трансформера, которая изучает количественные отношения, скрытые в описаниях на естественном языке. Этапы работы 1. Генерация синтетических данных: — Создаём … Читать далее

Google предлагает TUMIX: мультиагентное масштабирование времени тестирования с помощью смеси инструментов использования

Google Cloud AI Research совместно с коллегами из MIT, Гарварда и Google DeepMind представили TUMIX (Tool-Use Mixture) — фреймворк времени тестирования, который объединяет разнородные стили агентов (только текст, код, поиск, управляемые варианты) и позволяет им обмениваться промежуточными ответами в течение нескольких раундов уточнения, а затем досрочно прекращать работу с помощью судьи на основе LLM. Как … Читать далее

Может ли маленькая языковая модель предсказать задержку ядра, объём памяти и точность модели по коду? Новая регрессионная языковая модель (RLM) утверждает, что да

Исследователи из Корнелла и Google представили унифицированную регрессионную языковую модель (RLM), которая предсказывает числовые результаты непосредственно из строк кода. Модель охватывает задержку ядра GPU, использование памяти программой и даже точность и задержку нейронных сетей. При этом не требуется ручная разработка функций. Что именно нового? Унифицированная регрессия «код-метрика»: одна RLM предсказывает: — пиковую память из высокоуровневого … Читать далее

Руководство по программированию для создания автономного интеллектуального агента для прогнозирования временных рядов с помощью Darts и Hugging Face

В этом руководстве мы создаём продвинутую систему интеллектуального агента, которая автономно обрабатывает прогнозирование временных рядов с использованием библиотеки Darts в сочетании с лёгкой моделью HuggingFace для рассуждений. Мы разрабатываем агента, который будет работать по циклу «восприятие — рассуждение — действие», где он сначала анализирует закономерности в данных, затем выбирает подходящую модель прогнозирования, генерирует прогнозы и, … Читать далее

AWS представляет сервер MCP с открытым исходным кодом для упрощения разработки AI-агентов

Компания AWS выпустила сервер Model Context Protocol (MCP) с открытым исходным кодом для Amazon Bedrock AgentCore. Это решение позволяет напрямую преобразовывать запросы на естественном языке в среде разработки (IDE) в готовые к использованию агенты на платформе AgentCore Runtime. Что это такое? Сервер AgentCore MCP предоставляет клиенту (например, Kiro, Claude Code, Cursor, Amazon Q Developer CLI … Читать далее

ИИ помогает понять, как новый антибиотик действует на бактерии в кишечнике

Для пациентов с воспалительными заболеваниями кишечника антибиотики могут быть палкой о двух концах. Препараты широкого спектра действия, которые часто назначают при обострениях заболеваний кишечника, могут убивать полезные микробы вместе с вредными, иногда усугубляя симптомы со временем. Исследователи из Лаборатории компьютерных наук и искусственного интеллекта MIT (CSAIL) и Университета Макмастера 🏥🎓 выявили новое соединение, которое использует … Читать далее

Microsoft выпускает Microsoft Agent Framework: SDK и среду выполнения с открытым исходным кодом для упрощения координации мультиагентных систем

Компания Microsoft выпустила Agent Framework (в режиме общедоступной предварительной версии) — SDK и среду выполнения с открытым исходным кодом. Этот инструмент объединяет ключевые идеи из AutoGen (среда выполнения агентов и шаблоны для мультиагентов) с Semantic Kernel (корпоративные элементы управления, состояние, плагины). Он призван помочь командам создавать, развёртывать и наблюдать за агентами искусственного интеллекта и мультиагентными … Читать далее

NeuTTS Air: речевая языковая модель для устройств с мгновенным клонированием голоса от Neuphonic

Neuphonic выпустила NeuTTS Air — речевую языковую модель с открытым исходным кодом для преобразования текста в речь (TTS), предназначенную для локального запуска в режиме реального времени на процессорах. Основные характеристики модели * Параметры: модель содержит 748 миллионов параметров (архитектура Qwen2) и представлена в квантованиях GGUF (Q4/Q8), что позволяет делать выводы с помощью llama.cpp/llama-cpp-python без облачных … Читать далее