Google AI выпускает модели MedGemma 27B и MedSigLIP для масштабируемого мультимодального медицинского анализа

В рамках развития открытых технологий в сфере медицинского ИИ компании Google DeepMind и Google Research представили две новые модели в рамках проекта MedGemma:* MedGemma 27B Multimodal — крупномасштабная модель для обработки визуальной и текстовой информации;* MedSigLIP — лёгкий кодировщик медицинских изображений и текста. Эти модели являются наиболее мощными среди открытых моделей, выпущенных на сегодняшний день … Читать далее

Perplexity представляет Comet — альтернативу традиционным браузерам на основе искусственного интеллекта

Perplexity, компания, которая уже известна тем, что меняет представление пользователей о работе с информацией с помощью поиска на основе искусственного интеллекта, объявила о запуске Comet — амбициозного веб-браузера, ориентированного на искусственный интеллект. Comet, разработанный с использованием архитектуры, ориентированной на искусственный интеллект, призван революционизировать способы навигации пользователей, поиска и взаимодействия с веб-контентом. Он сочетает в себе … Читать далее

Изменение подхода в здравоохранении

Генеративный искусственный интеллект меняет способы, которыми люди пишут, читают, говорят, думают, сопереживают и действуют в разных языках и культурах. В здравоохранении проблемы в общении между пациентами и практикующими врачами могут ухудшать результаты лечения и препятствовать улучшению практики и ухода. Language/AI Incubator — это потенциальный ответ на эти вызовы, который стал возможен благодаря финансированию со стороны … Читать далее

ИИ помогает создавать автономные подводные «глиссеры»

Учёные-океанографы давно удивляются тому, как эффективно плавают животные, такие как рыбы и тюлени, несмотря на различия в их формах. Тела этих существ оптимизированы для гидродинамического перемещения, что позволяет им затрачивать минимум энергии при преодолении больших расстояний. Автономные аппараты могут дрейфовать по океану, собирая данные об обширных подводных пространствах. Однако формы этих плавающих машин менее разнообразны, … Читать далее

Salesforce AI выпустила GTA1: агент с графическим пользовательским интерфейсом, который превосходит CUA от OpenAI

Компания Salesforce AI Research представила GTA1 — нового агента с графическим пользовательским интерфейсом (GUI), который меняет представление о передовых технологиях в области взаимодействия человека и компьютера. GTA1 предназначен для автономной работы в реальных средах операционных систем, таких как Linux. Агент решает две критические проблемы в разработке GUI-агентов: неоднозначное планирование задач и неточная привязка действий. С … Читать далее

Сэм и Джони.

Создание семейства продуктов на основе искусственного интеллекта для всех. 1. Какие основные цели преследуются при создании семейства продуктов на основе искусственного интеллекта, ориентированных на широкую аудиторию? Ответ: Основные цели включают создание продуктов, доступных для всех, что подразумевает разработку решений, учитывающих разнообразные потребности пользователей и обеспечивающих простоту использования. 2. Какие аспекты могут быть ключевыми при разработке … Читать далее

Овладейте искусством промпт-инжиниринга

В современном мире, управляемом искусственным интеллектом, промпт-инжиниринг — это не просто модное слово, а необходимый навык. Это сочетание искусства и науки выходит за рамки простых запросов, позволяя превращать расплывчатые идеи в точные и действенные результаты работы ИИ. Независимо от того, используете ли вы ChatGPT 4o, Google Gemini 2.5 flash или Claude Sonnet 4, четыре основополагающих … Читать далее

Microsoft открывает исходный код расширения GitHub Copilot Chat для Visual Studio Code — теперь оно бесплатно для всех разработчиков

Корпорация Microsoft официально открыла исходный код расширения GitHub Copilot Chat для Visual Studio Code (VS Code), сделав помощника по программированию на базе искусственного интеллекта бесплатным для разработчиков. Ранее эта функция была доступна только по платной подписке. Расширение выпущено под лицензией MIT, и теперь весь набор функций, который раньше требовал подписки, доступен каждому. Это важный шаг … Читать далее

Hugging Face выпустила SmolLM3: модель для многоязычного рассуждения с длинным контекстом на 3 миллиарда параметров

Компания Hugging Face только что выпустила SmolLM3 — новейшую версию своих языковых моделей Smol, предназначенных для обеспечения многоязычного рассуждения в длинном контексте с помощью компактной архитектуры на 3 миллиарда параметров. Большинство моделей, способных работать с длинным контекстом, обычно используют более 7 миллиардов параметров. Однако SmolLM3 предлагает современную производительность (SoTA) со значительно меньшим количеством параметров, что … Читать далее

Работа с 400 000 учителями для формирования будущего искусственного интеллекта в школах.

Компания OpenAI сотрудничает с Американской федерацией учителей, чтобы запустить пятилетнюю инициативу. В рамках этой инициативы 400 000 педагогов, работающих со школьниками от детского сада до 12 класса, получат необходимые знания и навыки для внедрения инноваций в области искусственного интеллекта в учебный процесс. 1. Какова цель инициативы компании OpenAI и Американской федерации учителей? * Цель инициативы … Читать далее

Реализация кода для проектирования интеллектуальных мультиагентных рабочих процессов с помощью BeeAI Framework

Введение в BeeAI Framework В этом руководстве мы исследуем возможности и гибкость BeeAI Framework, создавая полноценную мультиагентную систему с нуля. Мы рассмотрим основные компоненты, пользовательских агентов, инструменты, управление памятью и мониторинг событий, чтобы показать, как BeeAI упрощает разработку интеллектуальных, сотрудничающих агентов. Установка необходимых пакетов “`pythonimport subprocessimport sysimport asyncioimport jsonfrom typing import Dict, List, Any, Optionalfrom … Читать далее

Исследование может привести к созданию более совершенных больших языковых моделей (LLM) в плане сложных рассуждений

Несмотря на впечатляющие возможности, большие языковые модели (LLM) часто не справляются со сложными новыми задачами, требующими навыков комплексного мышления. Например, LLM, разработанная для бухгалтерской фирмы, может превосходно обобщать финансовые отчёты, но при этом неожиданно потерпеть неудачу, если ей поручить прогнозирование рыночных тенденций или выявление мошеннических операций. Чтобы повысить адаптивность LLM, исследователи MIT изучили, как определённая … Читать далее

Anthropic предлагает систему целенаправленной прозрачности для передовых систем искусственного интеллекта

По мере ускорения разработки масштабных систем искусственного интеллекта вопросы безопасности, надзора и управления рисками становятся всё более актуальными. В ответ на это компания Anthropic представила систему целенаправленной прозрачности, ориентированную специально на передовые модели искусственного интеллекта — те, которые обладают наибольшим потенциалом воздействия и риском. При этом в систему не включены небольшие разработчики и стартапы, чтобы … Читать далее

Google открыл исходники инструментария MCP для безопасного и эффективного взаимодействия ИИ-агентов с базами данных

Компания Google выпустила MCP Toolbox for Databases — новый модуль с открытым исходным кодом в рамках своего GenAI Toolbox. Этот модуль упрощает интеграцию SQL-баз данных в ИИ-агентов. Выпуск стал частью более широкой стратегии Google по продвижению протокола Model Context Protocol (MCP) — стандартизированного подхода, который позволяет языковым моделям взаимодействовать с внешними системами, включая инструменты, API … Читать далее

Реализация многоагентского рабочего процесса с помощью инструментов: Python, OpenAI API и PrimisAI Nexus

Цель этого продвинутого руководства — создать систему автоматизации многоагентских задач с использованием платформы PrimisAI Nexus, полностью интегрированной с OpenAI API. Наша основная задача — продемонстрировать, как иерархический надзор, интеллектуальное использование инструментов и структурированные выходные данные могут облегчить координацию нескольких ИИ-агентов для выполнения сложных задач, начиная от планирования и разработки до обеспечения качества и анализа данных. … Читать далее

Как радиальное внимание сокращает затраты при диффузии видео в 4,4 раза без ущерба качеству

Введение в модели диффузии видео и вычислительные задачи Модели диффузии достигли впечатляющих результатов в создании высококачественных связных видео, опираясь на свой успех в синтезе изображений. Однако обработка дополнительного временного измерения в видео значительно увеличивает вычислительные требования, особенно учитывая, что самовнимание плохо масштабируется с длиной последовательности. Это затрудняет эффективную тренировку или запуск этих моделей на длинных … Читать далее

Новая программа постдокторских стипендий для ускорения инноваций в здравоохранении

MIT Health and Life Sciences Collaborative (MIT HEALS) запускает программу постдокторских стипендий Biswas. Цель программы — поддержать работу выдающихся исследователей на начальном этапе карьеры в области здравоохранения и наук о жизни. Программа Biswas Postdoctoral Fellowship будет финансироваться за счёт подарка от Фонда семьи Бису (Biswas Family Foundation) и направлена на помощь в применении передовых исследований … Читать далее

Улучшение слияния кода с меньшими вычислительными ресурсами: познакомьтесь с Osmosis-Apply-1.7B от Osmosis AI

Osmosis AI представила модель Osmosis-Apply-1.7B, которая является настроенным вариантом Qwen3-1.7B. Она предназначена для выполнения высокоточных и структурированных задач по слиянию кода. Особенности модели Osmosis-Apply-1.7B оптимизирована для контекстно-зависимых правок на уровне функций. Модель использует специальные теги форматирования кода, высококачественный набор данных и интеграцию с протоколом Model Context Protocol (MCP). Модель специально обучена для выполнения задач по … Читать далее

ByteDance выпустила Trae Agent — агент для решения задач в области разработки программного обеспечения на основе больших языковых моделей

ByteDance, китайский технологический гигант, стоящий за TikTok и другими глобальными платформами, официально выпустил Trae Agent — агента общего назначения для разработки программного обеспечения, работающего на основе больших языковых моделей (LLM). Trae Agent предназначен для выполнения сложных задач программирования с помощью подсказок на естественном языке. Агент предлагает удобный и расширяемый интерфейс командной строки (CLI), меняя представление … Читать далее

Начало работы с протоколом связи агентов (ACP): создание погодного агента на Python

Протокол связи агентов (ACP) — это открытый стандарт, предназначенный для обеспечения беспрепятственного взаимодействия между агентами искусственного интеллекта (ИИ), приложениями и людьми. Поскольку системы ИИ часто разрабатываются с использованием различных платформ и инфраструктур, они могут оказаться изолированными и несовместимыми, что ограничивает их способность к совместной работе. ACP решает эту проблему, предлагая унифицированный RESTful API, который упрощает:* … Читать далее

SynPref-40M и Skywork-Reward-V2: масштабируемое согласование человека и ИИ для современных моделей вознаграждения

Понимание ограничений современных моделей вознаграждения Хотя модели вознаграждения играют решающую роль в обучении с подкреплением на основе обратной связи от человека (RLHF), многие из наиболее эффективных открытых моделей сегодня всё ещё не могут отразить весь спектр сложных человеческих предпочтений. Даже при использовании сложных методов обучения значимый прогресс ограничен. Основная причина, по-видимому, заключается в недостатках современных … Читать далее

Новый метод искусственного интеллекта от Meta и Нью-Йоркского университета улучшает согласование больших языковых моделей с помощью полу-онлайн обучения с подкреплением

Оптимизация больших языковых моделей для согласования с человеком Большие языковые модели часто требуют дополнительной фазы согласования, чтобы оптимизировать их для использования человеком. На этом этапе обучение с подкреплением играет центральную роль, позволяя моделям принимать решения на основе обратной связи от человека или корректности выполнения задач. Такая тонкая настройка позволяет моделям более точно соответствовать ожиданиям пользователей, … Читать далее

Что такое контекстная инженерия в сфере искусственного интеллекта? Методы, примеры использования и её значение

Введение: что такое контекстная инженерия? Контекстная инженерия — это дисциплина, которая занимается проектированием, организацией и управлением контекстом, подаваемым в большие языковые модели (БЯМ), для оптимизации их работы. Вместо тонкой настройки весов модели или её архитектуры контекстная инженерия фокусируется на входных данных: подсказках, системных инструкциях, извлечённых знаниях, форматировании и даже порядке представления информации. Контекстная инженерия — … Читать далее

Руководство по созданию модульных и самокорректирующихся систем ответов на вопросы с помощью DSPy

В этом руководстве мы рассмотрим, как создать интеллектуальную и самокорректирующуюся систему ответов на вопросы с помощью фреймворка DSPy, интегрированного с моделью Google Gemini 1.5 Flash. Шаг 1: Установка библиотек Для начала установим необходимые библиотеки: DSPy для декларативных AI-конвейеров и google-generativeai для доступа к моделям Google Gemini. “`python!pip install dspy-ai google-generativeai“` “`pythonimport dspyimport google.generativeai as genaiimport … Читать далее

Команда Chai Discovery выпускает Chai-2: модель искусственного интеллекта достигает 16% показателя успешности в разработке новых антител

Команда Chai Discovery представила Chai-2 — мультимодальную модель искусственного интеллекта, которая позволяет разрабатывать новые антитела без предварительного обучения на подобных задачах. Основные достижения Chai-2:* Показатель успешности в 16% при работе с 52 новыми мишенями, используя ≤20 кандидатов для каждой мишени.* Превосходство над предыдущими методами более чем в 100 раз.* Получение проверенных связывающих молекул менее чем … Читать далее

Обучение больших языковых моделей абстрактному мышлению с помощью подкрепления для повышения надёжности на тестах GSM

Недавние исследования показывают, что большие языковые модели (LLM), особенно меньшего размера, часто испытывают трудности с обоснованным рассуждением. Они хорошо справляются со знакомыми вопросами, но допускают ошибки, когда те же задачи немного изменяются, например, меняются имена или числа, или добавляется нерелевантная, но связанная информация. Эта слабость, известная как плохое обобщение вне распределения (OOD), приводит к заметному … Читать далее

Kyutai выпустила модель Text-to-Speech с 2 миллиардами параметров

Kyutai, открытая исследовательская лаборатория в области искусственного интеллекта, выпустила революционную модель потокового преобразования текста в речь (TTS) с примерно 2 миллиардами параметров. Эта модель разработана для обеспечения отклика в реальном времени и генерирует аудио с ультранизкой задержкой (220 миллисекунд), сохраняя при этом высокое качество. Она обучена на беспрецедентных 2,5 миллионах часов аудио и лицензирована под … Читать далее

Роботизированный зонд быстро измеряет ключевые свойства новых материалов

Учёные стремятся открыть новые полупроводниковые материалы, которые могли бы повысить эффективность солнечных батарей и другой электроники. Однако скорость инноваций сдерживается темпом, с которым исследователи могут вручную измерять важные свойства материалов. Разработанная учёными Массачусетского технологического института (MIT) полностью автономная роботизированная система может ускорить этот процесс. Их система использует роботизированный зонд для измерения важного электрического свойства, известного … Читать далее

Можно ли улучшить способность Llama 3 к рассуждению только за счёт посттренинга? ASTRO демонстрирует прирост показателей на +16–20%

Улучшение способности больших языковых моделей (БЯМ) к рассуждению без архитектурных изменений — ключевая задача в развитии согласованности ИИ и удобства его использования. Исследователи из Meta AI и Вашингтонского университета представили ASTRO — Autoregressive Search-Taught Reasoner (авторегрессионный поисковый механизм обучения рассуждениям). Это новая система посттренинга, разработанная для улучшения рассуждений в Llama-3.1-70B-Instruct. Особенности ASTRO ASTRO уникален тем, … Читать далее

Руководство по использованию OpenAI Codex с репозиториями GitHub для разработки с помощью ИИ

Когда мы впервые попадаем в среду Codex, это похоже на то, как если бы мы сели в кресло второго пилота для написания кода. Codex предназначен для того, чтобы взять на себя рутинные и сложные задачи в области разработки программного обеспечения, такие как анализ больших кодовых баз, составление проектов запросов на включение (PR) и поиск ошибок. … Читать далее