Создание комплексной системы отслеживания объектов и аналитики с помощью Roboflow Supervision

В этом продвинутом руководстве по Roboflow Supervision мы создадим полный конвейер обнаружения объектов с помощью библиотеки Supervision. Начало работы 1. Настройка отслеживания объектов в реальном времени с помощью ByteTracker, добавление сглаживания обнаружения и определение полигональных зон для мониторинга определённых областей в видеопотоке.2. Обработка кадров и аннотирование их с помощью ограничивающих рамок, идентификаторов объектов и данных … Читать далее

Команда DeepReinforce представляет CUDA-L1: автоматизированную систему обучения с подкреплением для оптимизации CUDA, раскрывающую тройной потенциал мощности GPU

Введение в прорыв: контрастивное обучение с подкреплением (Contrastive-RL) Команда DeepReinforce представила новый фреймворк под названием CUDA-L1, который обеспечивает среднее ускорение в 3,12 раза и до 120 раз на пике для 250 реальных задач на GPU. Этот фреймворк работает без вмешательства человека и использует открытый исходный код на широко используемом оборудовании NVIDIA. Как работает CUDA-L1? В … Читать далее

Google выпускает MLE-STAR: передовой агент для автоматизации задач машинного обучения

MLE-STAR (Machine Learning Engineering via Search and Targeted Refinement) — это передовая агентская система, разработанная исследователями Google Cloud для автоматизации проектирования и оптимизации сложных конвейеров машинного обучения (ML). Используя веб-поиск, целенаправленное уточнение кода и надёжные модули проверки, MLE-STAR достигает беспрецедентной производительности в решении ряда задач машинного обучения — значительно превосходя предыдущие автономные агенты ML и … Читать далее

Исследователи из MIT разработали методы контроля чувствительности трансформеров с доказуемыми границами Липшица и мюонами

Обучение крупномасштабных трансформеров является сложной задачей в области глубокого обучения, особенно когда модели становятся больше и выразительнее. Исследователи из MIT решают эту проблему на корню: нестабильный рост активаций и всплески потерь, вызванные неограниченными нормами весов и активаций. Их решение — обеспечить доказуемые границы Липшица для трансформера путём спектральной регуляции весов — без использования нормализации активаций, … Читать далее

Как использовать пакет SHAP-IQ для выявления и визуализации взаимодействий признаков в моделях машинного обучения с помощью индексов взаимодействия Шепли (SII)

В этом руководстве мы рассмотрим, как использовать пакет SHAP-IQ для выявления и визуализации взаимодействий признаков в моделях машинного обучения с помощью индексов взаимодействия Шепли (SII), основываясь на традиционных значениях Шепли. Значения Шепли отлично подходят для объяснения вклада отдельных признаков в моделях ИИ, но не учитывают взаимодействия между признаками. Индексы взаимодействия Шепли идут дальше, разделяя индивидуальные … Читать далее

Руководство по программированию для создания интеллектуальных мультиагентных систем с использованием шаблона PEER

В этом руководстве мы рассмотрим мощную мультиагентную систему, построенную на основе шаблона PEER: Plan, Execute, Express, Review (Планируй, Выполняй, Выражай, Проверяй). Мы запустим весь рабочий процесс в Google Colab/Notebook, интегрируя агентов с специализированными ролями и используя модель Google Gemini 1.5 Flash через бесплатный API-ключ. Установка необходимых библиотек Мы начнём с установки необходимых библиотек, включая agentUniverse … Читать далее

Встречайте Trackio: бесплатная библиотека-трекер экспериментов на Python с открытым исходным кодом

Отслеживание экспериментов — важная часть современных рабочих процессов в машинном обучении. Независимо от того, настраиваете ли вы гиперпараметры, отслеживаете обучающие метрики или сотрудничаете с коллегами, крайне важно иметь надёжные и гибкие инструменты, которые упрощают отслеживание экспериментов и делают его более информативным. Однако многие существующие решения для отслеживания экспериментов требуют сложной настройки, имеют лицензионные сборы или … Читать далее

Figma использует искусственный интеллект для трансформации цифрового дизайна.

Узнайте, как Figma меняет цифровой дизайн с помощью ИИ. Дэвид Коссник рассказывает, как такие инструменты, как Figma Make, дают возможность командам создавать прототипы, сотрудничать и работать с ИИ — преобразуя рабочие процессы как для дизайнеров, разработчиков, так и для неспециалистов в технических вопросах. 1. Какие возможности предоставляет Figma для работы с искусственным интеллектом? Figma использует … Читать далее

Команда разработчиков Falcon LLM выпускает технический отчёт о Falcon-H1: гибридная модель внимания и SSM, конкурирующая с моделями на 70 миллиардов параметров

Введение Серия Falcon-H1, разработанная Институтом технологических инноваций (TII), представляет собой значительный шаг вперёд в эволюции больших языковых моделей (LLM). Благодаря интеграции внимания на основе Transformer и моделей состояния пространства (SSM) на основе Mamba в гибридной параллельной конфигурации Falcon-H1 достигает исключительной производительности, эффективности использования памяти и масштабируемости. Модели Falcon-H1 представлены в различных размерах (от 0,5 миллиарда … Читать далее

Знакомьтесь: SmallThinker — семейство эффективных больших языковых моделей, изначально обученных для локального использования

На рынке генеративного искусственного интеллекта доминируют массивные языковые модели, разработанные для огромных мощностей облачных дата-центров. Эти модели, несмотря на свою мощь, затрудняют или делают невозможным для обычных пользователей частное и эффективное развёртывание продвинутого ИИ на локальных устройствах, таких как ноутбуки, смартфоны или встроенные системы. Вместо того чтобы сжимать облачные модели для использования на периферии — … Читать далее

Google AI представляет Test-Time Diffusion Deep Researcher (TTD-DR): диффузионную систему для продвинутых исследовательских агентов, вдохновлённую человеческим подходом

Агенты для глубоких исследований (Deep Research, DR) быстро завоевали популярность как в научных кругах, так и в промышленности благодаря недавнему прогрессу в области больших языковых моделей (LLM). Однако большинство популярных публичных агентов DR не учитывают особенности человеческого мышления и процесса написания. Им часто не хватает структурированных шагов, которые поддерживают исследователей-людей, таких как составление черновиков, поиск … Читать далее

TransEvalnia: система оценки качества перевода на основе подсказок для языковых моделей

Системы перевода, основанные на языковых моделях (LLM), достигли такого уровня развития, что в некоторых случаях могут превзойти переводчиков-людей. По мере совершенствования LLM, особенно в сложных задачах, таких как перевод документов или литературный перевод, становится всё сложнее добиваться дальнейшего прогресса и точно оценивать этот прогресс. Традиционные автоматизированные метрики и их ограничения Традиционные автоматизированные метрики, такие как … Читать далее

Руководство по созданию интеллектуального диалогового агента ИИ с памятью агента с использованием Cognee и бесплатных моделей Hugging Face

В этом руководстве мы рассмотрим создание продвинутого ИИ-агента с памятью агента, используя модели Cognee и Hugging Face. Мы будем использовать полностью бесплатные инструменты с открытым исходным кодом, которые без проблем работают в Google Colab и других ноутбуках. Мы настроим Cognee для хранения и извлечения данных, интегрируем облегчённую модель для генерации ответов и объединим всё это … Читать далее

AgentSociety: фреймворк с открытым исходным кодом для моделирования крупномасштабных социальных взаимодействий с помощью агентов на базе больших языковых моделей

AgentSociety — это передовой фреймворк с открытым исходным кодом, предназначенный для моделирования больших популяций агентов, каждый из которых работает на базе больших языковых моделей (LLM), чтобы реалистично воспроизвести сложные взаимодействия, характерные для человеческих обществ. Используя мощные технологии распределённой обработки, особенно Ray, этот проект обеспечивает симуляции с участием десятков тысяч одновременно активных агентов, каждый из которых … Читать далее

Полное руководство по бенчмаркам и метрикам производительности для больших языковых моделей в программировании, 2025 год

Большие языковые модели (БЯМ), специализирующиеся на программировании, стали неотъемлемой частью разработки программного обеспечения. Они повышают производительность за счёт генерации кода, исправления ошибок, создания документации и рефакторинга. Острая конкуренция между коммерческими моделями и моделями с открытым исходным кодом привела к быстрому развитию, а также к появлению множества бенчмарков, предназначенных для объективной оценки производительности кодирования и полезности … Читать далее

Лучшие локальные большие языковые модели для кодирования (2025)

Большие языковые модели (LLM) для кодирования стали весьма функциональными, позволяя разработчикам работать с передовыми инструментами для генерации кода и помощи в написании кода полностью офлайн. В этой статье представлен обзор лучших локальных LLM для кодирования по состоянию на середину 2025 года, выделены ключевые особенности моделей и обсуждены инструменты, упрощающие локальное развёртывание. Почему стоит выбрать локальную … Читать далее

Знакомьтесь: AlphaEarth Foundations — «виртуальный спутник» от Google DeepMind в картографировании планеты с помощью ИИ

Введение: дилемма данных в наблюдении Земли Более пятидесяти лет прошло с момента запуска первого спутника Landsat, а планета утопает в беспрецедентном потоке данных наблюдения Земли (EO) — со спутников, радаров, климатических симуляций и натурных измерений. Однако проблема остаётся: хотя сбор данных ускоряется, высококачественные, глобально распределённые метки наземной истины редки и дороги в получении. Этот дефицит … Читать далее

Представляем Stargate Norway.

Мы запускаем Stargate Norway — первую инициативу OpenAI по созданию центра обработки данных с использованием искусственного интеллекта в Европе в рамках программы OpenAI for Countries. Stargate — это всеобъемлющая инфраструктурная платформа OpenAI, которая является важной частью нашего долгосрочного плана по предоставлению преимуществ искусственного интеллекта каждому. #Stargate Norway #OpenAI 1. Какова цель запуска Stargate Norway? Ответ: … Читать далее

Новая эра конфиденциальности: как искусственный интеллект меняет технологии безопасного просмотра и VPN (Глубокий анализ на основе данных, 2025 год)

В 2025 году искусственный интеллект (ИИ) кардинально меняет технологии безопасного просмотра и виртуальные частные сети (VPN). Взрывной рост сложных киберугроз, усиленных возможностями ИИ и квантовых вычислений, стимулирует быстрые инновации в области защиты конфиденциальности, доверия пользователей и инфраструктуры онлайн-безопасности. Тревожный звонок: нарушения конфиденциальности, связанные с ИИ Согласно отчёту Stanford’s 2025 AI Index Report, количество инцидентов, связанных … Читать далее

Tutorial: пошаговое руководство по созданию конвейера анализа текста с помощью LangGraph

Введение в LangGraph LangGraph — это мощный фреймворк от LangChain, предназначенный для создания многопользовательских приложений с LLM (Large Language Models). Он предоставляет структуру и инструменты, необходимые для создания сложных ИИ-агентов с помощью графового подхода. Представьте себе LangGraph как чертёжный стол архитектора — он даёт нам инструменты для проектирования того, как наш агент будет думать и … Читать далее

Три урока для создания устойчивого преимущества с помощью ИИ

Узнайте, как компания Intercom создала масштабируемую платформу искусственного интеллекта, используя три ключевых урока — от оценки до архитектуры — чтобы определить будущее поддержки клиентов. 1. Какие ключевые уроки компания Intercom использовала для создания масштабируемой платформы искусственного интеллекта? Ответ: компания Intercom использовала три ключевых урока: от оценки до архитектуры, чтобы определить будущее поддержки клиентов и создать … Читать далее

NVIDIA представляет ThinkAct: обоснование действий на основе зрения и языка через усиленное визуальное латентное планирование

Введение Агенты искусственного интеллекта (ИИ) всё чаще используются для интерпретации сложных мультимодальных инструкций и надёжного выполнения действий в динамических средах. ThinkAct, представленный исследователями из NVIDIA и Национального тайваньского университета, предлагает прорыв в области обоснования действий на основе зрения и языка (VLA), внедряя усиленное визуальное латентное планирование для соединения высокоуровневого мультимодального обоснования и низкоуровневого управления роботом. … Читать далее

Слишком много размышлений может нарушить работу больших языковых моделей: обратная масштабируемость при вычислениях во время тестирования

Недавние достижения в области больших языковых моделей (БЯМ) побудили к мысли, что предоставление моделям возможности «думать дольше» во время логического вывода обычно повышает их точность и надёжность. Такие практики, как пошаговые объяснения, подсказки в виде цепочки рассуждений и увеличение «вычислений во время тестирования», стали стандартными методами в этой области. Однако исследование под руководством Anthropic «Обратная … Читать далее

Руководство по созданию масштабируемой мультиагентной системы с помощью Google ADK

В этом руководстве мы рассмотрим расширенные возможности набора для разработки агентов (Agent Development Kit, ADK) от Google, создав мультиагентную систему с специализированными ролями и инструментами. Мы покажем, как создавать агентов, предназначенных для выполнения таких задач, как веб-исследования, математические вычисления, анализ данных и создание контента. Установка и импорт библиотек Для начала установим пакет google-adk и импортируем … Читать далее

Исследователи Apple представили FastVLM: достижение современного компромисса между разрешением, задержкой и точностью в моделях Vision Language Models

Модели Vision Language Models (VLMs) позволяют работать как с текстовыми данными, так и с визуальной информацией. Однако разрешение изображений имеет решающее значение для производительности VLM при обработке текста и данных с большим количеством графиков. Увеличение разрешения изображений создаёт значительные проблемы. Проблемы при увеличении разрешения изображений:* Предварительно обученные кодировщики изображений часто не справляются с изображениями высокого … Читать далее

Безопасно ли использовать Vibe Coding для стартапов? Технический аудит рисков на основе реальных примеров использования

Введение: почему стартапы обращают внимание на Vibe Coding Стартапы стремятся создавать, тестировать и внедрять продукты быстрее, чем когда-либо. Имея ограниченные технические ресурсы, многие исследуют среды разработки на основе искусственного интеллекта (ИИ), которые в совокупности называются «Vibe Coding», как способ быстрого запуска минимально жизнеспособных продуктов (MVP). Эти платформы обещают беспроблемную генерацию кода из подсказок на естественном … Читать далее

MiroMind-M1: развитие математических рассуждений в открытых источниках с помощью контекстно-зависимого многоэтапного обучения с подкреплением

Большие языковые модели (LLMs) недавно продемонстрировали значительный прогресс в многошаговом рассуждении, что позволило использовать решение математических задач в качестве строгого критерия для оценки продвинутых возможностей. Хотя проприетарные модели, такие как GPT-4o и Claude Sonnet 4, лидируют по производительности, их закрытый исходный код препятствует прозрачности и воспроизводимости. Для устранения этих пробелов компания MiroMind AI выпустила серию … Читать далее

Rubrics as Rewards (RaR): система подкрепляющего обучения для тренировки языковых моделей с помощью структурированных мультикритериальных оценочных сигналов

Reinforcement Learning with Verifiable Rewards (RLVR) позволяет языковым моделям (LLMs) решать сложные задачи, где есть чёткие и проверяемые результаты, например, в математике и программировании. Однако во многих реальных сценариях таких явных проверяемых ответов нет, что затрудняет обучение моделей без прямых сигналов вознаграждения. Существующие методы Текущие методы решают эту проблему с помощью RLHF через ранжирование предпочтений, … Читать далее

Новые алгоритмы обеспечивают эффективное машинное обучение на симметричных данных

Новые алгоритмы позволяют эффективно использовать машинное обучение с симметричными данными. Если повернуть изображение молекулярной структуры, человек поймёт, что повёрнутое изображение — это всё ещё та же молекула, но модель машинного обучения может посчитать его новой точкой данных. На языке информатики молекула является «симметричной», что означает: фундаментальная структура молекулы остаётся неизменной при определённых преобразованиях, например, при … Читать далее

«FUTURE PHASES» открывает новые горизонты в музыкальных технологиях и интерактивном исполнении

Музыкальные технологии заняли центральное место в MIT во время «FUTURE PHASES» — вечера произведений для струнного оркестра и электроники. Мероприятие было организовано MIT Music Technology and Computation Graduate Program в рамках Международной конференции по компьютерной музыке (ICMC) 2025 года. Хорошо посещаемое событие прошло в прошлом месяце в концертном зале Томаса Талла в новом Музыкальном здании … Читать далее