LuminX привлекла 5,5 миллиона долларов для создания интеллектуальных систем складирования с помощью языковых моделей обработки изображений на периферийных устройствах

LuminX — компания из Сан-Франциско, специализирующаяся на искусственном интеллекте и переопределяющая складские операции, объявила о привлечении 5,5 миллионов долларов в рамках посевного финансирования. Эти средства будут направлены на внедрение языковых моделей обработки изображений (VLM) непосредственно в складскую среду. Раунд возглавили 1Sharpe, GTMFund, 9Yards, Chingona Ventures и Bond Fund. Проблема, которую решает LuminX В основе деятельности … Читать далее

MiMo-VL-7B: мощная модель для понимания визуальной информации и мультимодального рассуждения

Модели Vision-Language (VLMs) стали основополагающими компонентами для мультимодальных систем искусственного интеллекта. Они позволяют автономным агентам понимать визуальную среду, работать с мультимодальным контентом и взаимодействовать с цифровым и физическим мирами. Исследователи из Xiaomi представляют MiMo-VL-7B — компактную, но мощную модель VLM, состоящую из трёх ключевых компонентов:* кодировщика Vision Transformer с нативным разрешением, который сохраняет мелкие визуальные … Читать далее

Как помочь студентам распознать потенциальную предвзятость в их наборах данных для ИИ

Каждый год тысячи студентов проходят курсы, на которых их обучают создавать модели искусственного интеллекта, помогающие врачам диагностировать заболевания и назначать лечение. Однако многие из этих курсов упускают ключевой элемент: обучение студентов выявлению недостатков в обучающих данных, используемых для разработки моделей. Лео Энтони Сели, старший научный сотрудник Института медицинской инженерии и науки Массачусетского технологического института (MIT), … Читать далее

Встречайте Yambda: крупнейший в мире набор данных для ускорения разработки систем рекомендаций

Яндекс недавно внёс значительный вклад в сообщество разработчиков систем рекомендаций, выпустив Yambda — крупнейший в мире общедоступный набор данных для исследований и разработок в этой области. Этот набор данных призван преодолеть разрыв между академическими исследованиями и приложениями промышленного масштаба, предлагая почти 5 миллиардов анонимных событий взаимодействия пользователей из Yandex Music — одного из флагманских стриминговых … Читать далее

NVIDIA AI представляет Fast-dLLM: фреймворк без необходимости обучения, который внедряет KV-кэширование и параллельное декодирование в диффузионные LLM

Диффузионные большие языковые модели (LLM) исследуются как многообещающая альтернатива традиционным авторегрессионным моделям, предлагая потенциал для одновременной генерации нескольких токенов. Используя механизмы двунаправленного внимания, эти модели стремятся ускорить декодирование, теоретически обеспечивая более быстрый вывод, чем авторегрессионные системы. Однако, несмотря на свой потенциал, на практике диффузионные модели часто не могут обеспечить конкурентоспособную скорость вывода, что ограничивает их … Читать далее

Обучение с подкреплением в режиме off-policy с использованием дивергенции KL обеспечивает превосходное рассуждение в больших языковых моделях

Методы градиента политики значительно продвинули возможности рассуждения больших языковых моделей (LLM), особенно через обучение с подкреплением (RL). Ключевым инструментом стабилизации этих методов является регуляризация Кульбака-Лейблера (KL), которая препятствует резким изменениям между текущей и эталонной стратегиями. Хотя такие алгоритмы, как PPO, широко используют KL-регуляризацию, всё ещё многое предстоит изучить в том, как различные варианты KL, такие … Читать далее

Реализация интеллектуального AI-ассистента с Jina Search, LangChain и Gemini для поиска информации в реальном времени

В этом руководстве мы покажем, как создать интеллектуального AI-ассистента, интегрировав инструменты LangChain, Gemini 2.0 Flash и Jina Search. Объединив возможности мощной большой языковой модели (LLM) с внешним поисковым API, мы создадим помощника, который сможет предоставлять актуальную информацию с указанием источников. Установка необходимых пакетов Мы устанавливаем необходимые пакеты Python для этого проекта. В их число входят:* … Читать далее

Руководство по использованию сервера Desktop Commander MCP

Сервер Desktop Commander MCP — это мощный инструмент, который объединяет все ваши операции по разработке в одном интерфейсе чата. Он построен на основе файлового сервера MCP и позволяет вам искать, редактировать файлы и управлять ими, выполнять команды в терминале и контролировать процессы непосредственно с вашего рабочего стола с помощью протокола Model Context Protocol (MCP). Основные … Читать далее

Юридическая ответственность за использование дипфейков, созданных с помощью ИИ, в дезинформации на выборах

Как создаются дипфейки Генеративные модели искусственного интеллекта позволяют создавать очень реалистичные поддельные медиафайлы. Большинство дипфейков сегодня создаются путём обучения глубоких нейронных сетей на реальных изображениях, видео или аудиозаписях конкретного человека. Основные архитектуры ИИ:* генеративно-состязательные сети (GANs);* автоэнкодеры. GAN состоит из сети-генератора, которая создаёт синтетические изображения, и сети-дискриминатора, которая пытается отличить подделки от реальных данных. В … Читать далее

Рецепт многоэтапного и смешанного обучения с подкреплением Enigmata обеспечивает прорывную производительность в решении головоломок большими языковыми моделями

Большие модели рассуждений (LRMs), обученные на больших языковых моделях (LLMs) с помощью обучения с подкреплением (RL), демонстрируют высокие результаты в сложных задачах, включая математику, STEM и кодирование. Однако существующие LRMs сталкиваются с трудностями при выполнении различных задач, требующих чисто логических навыков, которые легко даются людям. Текущие методы работы с головоломками сосредоточены только на разработке эталонных … Читать далее

Как агенты искусственного интеллекта трансформируют сферу образования: взгляд на Kira Learning и не только

Сегодняшние классы быстро меняются благодаря искусственному интеллекту (ИИ). Агенты ИИ стали частью процесса обучения. Они не только автоматизируют задачи, но и помогают учителям предоставлять персональную поддержку, а также дают ученикам обратную связь, соответствующую их стилю обучения. Kira Learning — платформа, которая лидирует в этих изменениях. Она использует ИИ во всех аспектах образования K-12: от планирования … Читать далее

Отчёт BOND 2025 об AI-тенденциях: экосистема ИИ растёт быстрее, чем когда-либо, благодаря стремительному росту числа пользователей и разработчиков

Краткий обзор текущего состояния и быстрой эволюции технологий искусственного интеллекта Отчёт BOND о тенденциях в сфере искусственного интеллекта (май 2025 года) представляет собой всеобъемлющий анализ текущего состояния и стремительной эволюции технологий ИИ. В отчёте выделены некоторые поразительные тенденции, подчёркивающие беспрецедентную скорость внедрения ИИ, технологического совершенствования и влияния на рынок. Стремительное внедрение крупных языковых моделей с … Читать далее

Знакомьтесь: NovelSeek — единая мультиагентная система для автономного научного исследования от генерации гипотез до экспериментальной проверки

Научные исследования в таких областях, как химия, биология и искусственный интеллект, долгое время основывались на работе экспертов-людей, которые изучали знания, генерировали идеи, разрабатывали эксперименты и уточняли результаты. Однако по мере усложнения проблем и увеличения объёма данных процесс открытия новых знаний замедляется. Хотя инструменты искусственного интеллекта, такие как языковые модели и робототехника, могут решать конкретные задачи, … Читать далее

Статья об искусственном интеллекте от Microsoft представляет WINA: систему активации без обучения для эффективной работы с большими языковыми моделями

Большие языковые модели (БЯМ) с миллиардами параметров лежат в основе многих сервисов, управляемых искусственным интеллектом, в различных отраслях. Однако их огромный размер и сложная архитектура делают вычислительные затраты во время логического вывода (inference) существенной проблемой. Оптимизация баланса между вычислительной эффективностью и качеством вывода стала важнейшей областью исследований. Основная проблема заключается в том, как БЯМ обрабатывают … Читать далее

Последний отчёт Cisco об ИИ-агентах: трансформация взаимодействия с клиентами благодаря агентскому ИИ

Сфера взаимодействия с клиентами (CX) в сфере B2B-технологий претерпевает значительные изменения благодаря развитию агентского ИИ. Недавний отчёт Cisco об агентском ИИ предоставляет тщательный анализ того, как ИИ-агенты — характеризующиеся автономным принятием решений, контекстным осознанием и адаптивным обучением — кардинально меняют CX, обеспечивая уровень персонализации, проактивности и прогнозируемости, который ранее был недостижим. Агентский ИИ: автономные агенты, … Читать далее

Обзор Homestyler: я создал эту комнату мечты за несколько минут

Вы когда-нибудь смотрели на пустую комнату и чувствовали себя ошеломлёнными от количества возможностей? Большинство из нас может представить себе пространство мечты, но воплотить это видение в реальность — непростая задача. Именно поэтому более 18 миллионов человек обратились к Homestyler — мощному инструменту для проектирования дома, который делает планирование, декорирование и визуализацию пространства увлекательным занятием. Что … Читать далее

Эта статья об искусственном интеллекте представляет модели адаптивного рассуждения ARM и Ada-GRPO

Задачи рассуждения являются фундаментальным аспектом искусственного интеллекта, охватывающим такие области, как понимание здравого смысла, решение математических задач и символическое рассуждение. Эти задачи часто включают в себя несколько шагов логического вывода, которые крупные языковые модели (LLM) пытаются имитировать с помощью структурированных подходов, таких как цепочка мыслей (CoT). Однако по мере увеличения размера и сложности LLM они … Читать далее

Руководство по кодированию для создания масштабируемых систем многоагентного взаимодействия с использованием протокола Agent Communication Protocol (ACP)

В этом руководстве мы реализуем протокол Agent Communication Protocol (ACP) путём создания гибкой системы обмена сообщениями, совместимой с ACP, на языке Python. Для обработки естественного языка мы используем API Google Gemini. Установка и настройка Для начала установим и настроим библиотеку google-generativeai. Руководство знакомит с основными абстракциями, типами сообщений, перформативами и классом данных ACPMessage, который стандартизирует … Читать далее

Microsoft Discovery: как агенты искусственного интеллекта ускоряют научные открытия

Традиционно научные исследования были медленным и тщательным процессом. Учёные тратят годы на проверку идей и проведение экспериментов. Они читают тысячи статей и пытаются связать разрозненные фрагменты знаний. Этот подход работал долгое время, но обычно занимал годы. Сегодня мир сталкивается с неотложными проблемами, такими как изменение климата и болезни, которые требуют более быстрых ответов. Microsoft считает, … Читать далее

Модели фундаментального мультимодального обучения не справляются с физическим обоснованием: тест PHYX выявляет ключевые ограничения в визуальной и символической интеграции

Современные модели показывают точность, сравнимую с человеческой, на AIME, GPQA, MATH-500 и OlympiadBench, решая задачи олимпиадного уровня. Недавние мультимодальные модели фундаментального обучения продвинули тесты на предметное знание и математическое рассуждение. Однако эти оценки упускают важнейший аспект машинного интеллекта: физическое обоснование, требующее интеграции предметных знаний, символьных операций и ограничений реального мира. Решение физических задач принципиально отличается … Читать далее

Яндекс выпустил Yambda: крупнейший в мире набор данных для ускорения разработки систем рекомендаций

Яндекс недавно внёс значительный вклад в сообщество разработчиков систем рекомендаций, выпустив Yambda — крупнейший в мире общедоступный набор данных для исследований и разработок в области систем рекомендаций. Этот набор данных призван преодолеть разрыв между академическими исследованиями и приложениями промышленного масштаба, предлагая почти 5 миллиардов анонимных событий взаимодействия пользователей с Яндекс Музыкой — одним из флагманских … Читать далее

Яндекс выпустил Yambda: крупнейший в мире набор данных для ускорения разработки систем рекомендаций

Яндекс недавно внёс значительный вклад в сообщество разработчиков систем рекомендаций, выпустив Yambda — крупнейший в мире общедоступный набор данных для исследований и разработок в этой области. Этот набор данных призван преодолеть разрыв между академическими исследованиями и приложениями промышленного масштаба, предлагая почти 5 миллиардов анонимных событий взаимодействия пользователей с Яндекс Музыкой — одним из флагманских стриминговых … Читать далее

Исследователи из Стэнфорда представили Biomni: биомедицинский ИИ-агент для автоматизации различных задач и типов данных

Биомедицинские исследования — это быстро развивающаяся область, целью которой является улучшение здоровья человека путём раскрытия механизмов, лежащих в основе заболеваний, определения новых терапевтических целей и разработки эффективных методов лечения. Эта область охватывает разнообразные направления, включая генетику, молекулярную биологию, фармакологию и клинические исследования, которые требуют специализированных инструментов и глубоких знаний. Основные проблемы в биомедицинских исследованиях Сложность … Читать далее

Мэттью Фитцпатрик, генеральный директор Invisible Technologies — серия интервью

Мэттью Фитцпатрик — опытный специалист в области операций и роста с глубоким знанием масштабирования сложных рабочих процессов и команд. Его опыт охватывает консалтинг, стратегию и операционное лидерство. В настоящее время он занимает должность генерального директора в Invisible Technologies, где фокусируется на разработке и оптимизации комплексных бизнес-решений. Мэттью стремится объединить человеческий талант с автоматизацией для повышения … Читать далее

Как раскрыть потенциал предиктивного обслуживания на сотни миллионов долларов с помощью периферийной инфраструктуры

Промышленные компании стоят на пороге революции в области предиктивного обслуживания, которая может принести сотни миллионов долларов потенциальной экономии. Однако большинство из них сталкиваются с трудностями при масштабировании успешных пилотных проектов. Препятствия масштабирования Проблема не в алгоритмах или датчиках, а в инфраструктуре, которая их объединяет. Многие организации рассматривают предиктивное обслуживание как программную проблему, приобретая решение и … Читать далее

ИИ меняет экономику создателей — потеряет ли цифровой контент человеческое прикосновение?

Ни для кого не секрет, что генеративный искусственный интеллект и автономные агенты меняют экономику создателей. Генеративный ИИ может стимулировать дивергентное мышление, бороться с экспертными предубеждениями, повышать творческий потенциал, помогать в оценке и доработке идей, а также облегчать сотрудничество между пользователями. Хотя ИИ может ускорить и упростить создание контента, может ли он сделать человеческое творчество ненужным? … Читать далее

Скорость без стресса: как ИИ переписывает DevOps

Разработка программного обеспечения требует создания и доставки новых продуктов с невероятной скоростью и без перебоев в непрерывной доставке. DevOps — это ответ на вызовы современности и основа современных команд разработчиков программного обеспечения. Однако спрос растёт, и начинают проявляться проблемы: выгорание сотрудников, инструменты для обеспечения наблюдаемости перегружают команды информационным шумом, а обещания повышения скорости разработки часто … Читать далее

Apple и Duke представили подход на основе обучения с подкреплением, который позволяет большим языковым моделям (LLM) предоставлять промежуточные ответы, повышая скорость и точность

Исследование учёных из Apple и Университета Дьюка посвящено Interleaved Reasoning — новому подходу в обучении с подкреплением (RL), который позволяет языковым моделям чередовать процессы размышления и генерации ответов при решении сложных многошаговых задач. Проблема длинных цепочек рассуждений (CoT reasoning) Длинные цепочки рассуждений улучшают производительность больших языковых моделей при выполнении сложных задач, но имеют недостатки. Типичный … Читать далее

DeepSeek выпускает R1-0528: модель искусственного интеллекта для рассуждений с открытым исходным кодом, обеспечивающая повышенную производительность в математике и кодировании при использовании одного GPU

Китайская компания DeepSeek выпустила обновлённую версию своей модели для рассуждений R1 под названием DeepSeek-R1-0528. Эта версия улучшает возможности модели в математике, программировании и логических рассуждениях в целом, позиционируя её как серьёзную альтернативу ведущим моделям с открытым исходным кодом, таким как OpenAI o3 и Google Gemini 2.5 Pro. Технические улучшения Обновление R1-0528 вносит значительные улучшения в … Читать далее

Руководство по созданию самообучающегося агента ИИ с использованием Google Gemini API

В этом руководстве мы рассмотрим, как создать сложного самообучающегося агента ИИ, используя передовой Gemini API от Google. Этот агент демонстрирует автономное решение задач, динамически оценивает производительность, учится на успехах и неудачах и итеративно улучшает свои возможности посредством рефлексивного анализа и самомодификации. Импортирование библиотек “`pythonimport google.generativeai as genaiimport jsonimport timeimport refrom typing import Dict, List, Anyfrom … Читать далее