Sakana AI представляет Doc-to-LoRA и Text-to-LoRA: гиперсети, которые мгновенно усваивают длинные контексты и адаптируют большие языковые модели с помощью нулевого выстрела на естественном языке

Адаптация больших языковых моделей (LLM) В настоящее время адаптация LLM представляет собой значительный инженерный компромисс между гибкостью обучения в контексте (ICL) и эффективностью дистилляции контекста (CD) или супервизированного точного настройки (SFT). Компания Sakana AI из Токио предложила новый подход, позволяющий обойти эти ограничения за счёт амортизации затрат. В двух своих недавних статьях они представили Text-to-LoRA … Читать далее

OpenAI и Amazon объявляют о стратегическом партнёрстве

OpenAI и Amazon объявили о стратегическом партнёрстве. Платформа OpenAI Frontier теперь доступна на AWS, что расширяет возможности инфраструктуры искусственного интеллекта, включая пользовательские модели и корпоративных агентов ИИ. Введение среды выполнения Stateful Runtime для агентов в Amazon Bedrock Среда выполнения Stateful Runtime для агентов в Amazon Bedrock обеспечивает постоянную оркестрацию, память и безопасное выполнение многошаговых рабочих … Читать далее

Perplexity выпустила pplx-embed: новые двунаправленные модели встраивания Qwen3 для задач веб-поиска

Компания Perplexity выпустила pplx-embed — набор многоязычных моделей встраивания, оптимизированных для задач веб-поиска в больших масштабах. Эти модели предназначены для работы с шумом и сложностью данных веб-масштаба, предоставляя альтернативу проприетарным API встраивания. Архитектурные инновации: двунаправленное внимание и диффузия Большинство крупных языковых моделей (LLM) используют причинно-следственные архитектуры с декодированием. Однако для задач встраивания понимание полного контекста … Читать далее

Microsoft Research представляет CORPGEN для управления многоэтапными задачами автономных агентов искусственного интеллекта

Исследователи из Microsoft представили CORPGEN — независимую от архитектуры систему, предназначенную для управления сложностями реалистичной организационной работы с помощью автономных цифровых сотрудников. Проблема производительности в средах с многоэтапными задачами (MHTEs) Существующие тесты оценивают агентов искусственного интеллекта по изолированным, однозадачным сценариям, в то время как в реальных корпоративных средах требуется управлять десятками одновременных, чередующихся задач со … Читать далее

Google AI только что выпустила Nano-Banana 2: новая модель искусственного интеллекта с улучшенной согласованностью по темам и производительностью синтеза изображений 4K за доли секунды

В продолжающейся «гонке за более мелкие, быстрые и дешёвые» технологии искусственного интеллекта, Google представила серьёзное обновление. Технологический гигант официально представил Nano-Banana 2 (технически известный как Gemini 3.1 Flash Image). Google делает решительный поворот к периферийным вычислениям: синтез изображений высокой чёткости за доли секунды, который полностью остаётся на вашем устройстве. Технический скачок: эффективность важнее масштаба Первая … Читать далее

Национальная лаборатория Тихоокеанского северо-запада и OpenAI сотрудничают для ускорения процесса получения федеральных разрешений

Национальная лаборатория Тихоокеанского северо-запада и OpenAI представили DraftNEPABench — новый стандарт, оценивающий, как агенты искусственного интеллекта могут ускорить процесс получения федеральных разрешений. Это может сократить время разработки документации по Национальному экологическому политике (NEPA) до 15% и модернизировать процесс проверки инфраструктуры. Pacific Northwest National Laboratory and OpenAI partner to accelerate federal permitting. 📈 OpenAI and Pacific … Читать далее

OpenAI Codex и Figma запустили интеграцию для упрощения перехода от кода к дизайну

Компании OpenAI и Figma запустили новую интеграцию Codex, которая связывает код и дизайн. Это позволяет командам быстрее переключаться между реализацией и рабочей средой Figma, упрощая процесс итераций и выпуска продукта. #️⃣🔗 #️⃣🚀 1. Какие преимущества даёт интеграция Codex от OpenAI и Figma для команд разработчиков? Интеграция Codex позволяет командам быстрее переключаться между реализацией и рабочей … Читать далее

Nous Research выпускает «Агент Гермес» для решения проблемы «забывчивости» ИИ с помощью многоуровневой памяти и поддержки удалённого доступа к терминалу

В современном мире искусственного интеллекта мы привыкли к «эфемерным агентам» — блестящим, но забывчивым помощникам, которые перезагружают свои когнитивные часы с каждым новым сеансом чата. Хотя большие языковые модели стали отличными кодировщиками, им не хватает устойчивого состояния, необходимого для того, чтобы функционировать как настоящие партнёры. Команда Nous Research выпустила «Агента Гермес» — автономную систему с … Читать далее

Новый метод может повысить эффективность обучения больших языковых моделей (LLM)

Большие языковые модели (LLM) предназначены для решения сложных задач путём разбиения их на более мелкие шаги. Эти мощные модели особенно хороши в таких сложных задачах, как продвинутое программирование и многоэтапное планирование. Однако разработка моделей рассуждений требует огромных вычислительных ресурсов и энергии из-за неэффективности процесса обучения. Пока одни мощные процессоры непрерывно обрабатывают сложные запросы, другие в … Читать далее

Tailscale и LM Studio представляют «LM Link» для обеспечения зашифрованного прямого доступа к вашему частному оборудованию с GPU

Современные разработчики в сфере искусственного интеллекта часто зависят от своего физического местоположения. Вероятно, у вас есть «большая рабочая станция» (Big Rig) дома или в офисе — рабочая станция, гудящая от карт NVIDIA RTX — и «дорожная рабочая станция» (Travel Rig), изящный ноутбук, который идеально подходит для кофеен, но с трудом справляется даже с квантованным вариантом … Читать далее

Как создать эластичную векторную базу данных с согласованным хешированием, шардингом и визуализацией в реальном времени для систем RAG

В этом руководстве мы создадим симулятор эластичной векторной базы данных, который имитирует распределение вложений в современных системах RAG по узлам распределённого хранения. Мы реализуем согласованное хеширование с виртуальными узлами, чтобы обеспечить сбалансированное размещение и минимальное перетасовка данных при масштабировании системы. Мы визуализируем кольцо хеширования в режиме реального времени и интерактивно добавляем или удаляем узлы, чтобы … Читать далее

Исследование ETH Zurich: почему ваши AGENTS.md файлы делают ваших AI-агентов неэффективными

В мире искусственного интеллекта (ИИ) «контекстная инженерия» стала новым направлением для повышения производительности больших языковых моделей (LLM). Лидеры отрасли рекламируют AGENTS.md (и подобные файлы, такие как CLAUDE.md) как идеальную точку настройки для агентов кодирования — своего рода «северную звезду» на уровне репозитория, которая направляет ИИ в сложных кодовых базах. Однако недавнее исследование учёных из ETH … Читать далее

Смешивание генеративного искусственного интеллекта с физикой для создания предметов, работающих в реальном мире

Вы когда-нибудь задумывались о создании чего-то интересного, но непрактичного? Когда дело доходит до проектирования таких вещей, как декор и личные аксессуары, модели генеративного искусственного интеллекта (ИИ) могут помочь. Они могут создавать креативные и сложные 3D-проекты, но при попытке воплотить такие чертежи в реальные объекты они обычно не выдерживают повседневного использования. Основная проблема заключается в том, … Читать далее

Пресечение злонамеренного использования ИИ | Февраль 2026

В нашем последнем отчёте об угрозах рассматривается, как злоумышленники сочетают модели ИИ с веб-сайтами и социальными платформами — и что это значит для обнаружения и защиты. 1. Какие основные угрозы связаны со злонамеренным использованием ИИ, упомянутые в статье? В статье говорится, что злоумышленники используют модели ИИ в сочетании с веб-сайтами и социальными платформами для различных … Читать далее

ИИ помогает исследователям увидеть общую картину в клеточной биологии

Изучение экспрессии генов в клетках ракового больного может помочь клиническим биологам понять происхождение рака и предсказать успех различных методов лечения. Однако клетки сложны и многослойны, поэтому то, как биолог проводит измерения, влияет на получаемые данные. Например, измерение белков в клетке может дать другую информацию о влиянии рака, чем измерение экспрессии генов или морфологии клеток. Значение … Читать далее

Новая гибридная архитектура Liquid AI — LFM2-24B-A2B

Компания Liquid AI представила новую гибридную архитектуру LFM2-24B-A2B, которая сочетает внимание (Attention) и свёртки (Convolutions) для решения проблем масштабирования современных больших языковых моделей (LLMs). Архитектура «A2B»: соотношение 1:3 для повышения эффективности «A2B» в названии модели означает Attention-to-Base. В традиционном трансформере каждый слой использует Softmax Attention, который масштабируется квадратично (O(N2)) с длиной последовательности. Это приводит к … Читать далее

Усиление морской кибербезопасности с помощью технологий и политики

Страхинья (Страджо) Янъевич родился в небольшой балканской стране Черногории. Он рассказывает, что его жизнь развивалась неожиданным образом, за что он глубоко благодарен. После окончания средней школы он был отобран для представления своей страны в Соединённых Штатах, где изучал кибернетические операции и информатику в Военно-морской академии США в Аннаполисе, штат Мэриленд. С тех пор он продолжил … Читать далее

Meta AI открывает исходный код GCM для улучшения мониторинга GPU-кластеров и обеспечения высокой производительности при обучении ИИ и надёжности оборудования

Пока специалисты по технологиям увлечены последними контрольными точками Llama, в подвалах центров обработки данных идёт гораздо более напряжённая борьба. По мере того как модели ИИ масштабируются до триллионов параметров, кластеры, необходимые для их обучения, стали одними из самых сложных — и хрупких — машин на планете. Исследовательская группа Meta AI только что выпустила GCM (GPU … Читать далее

Реализация кода для моделирования практической византийской отказоустойчивости с помощью asyncio, злонамеренных узлов и анализа задержек

В этом руководстве мы реализуем комплексный симулятор практической византийской отказоустойчивости (PBFT) с использованием asyncio. Мы моделируем реалистичную распределённую сеть с асинхронной передачей сообщений, настраиваемыми задержками и византийскими узлами, которые намеренно отклоняются от протокола. Основные компоненты 1. Импорт библиотек и определение основных типов сообщений PBFT: — Мы используем dataclasses для формализации сетевых сообщений и параметров. — … Читать далее

Арвинд К.С. назначен на должность директора по работе с персоналом.

Компания OpenAI назначила Арвинда К.С. директором по работе с персоналом, чтобы помочь масштабировать компанию, укрепить её корпоративную культуру и определить направления развития работы в эпоху искусственного интеллекта. 1. Какие задачи стоят перед Арвиндом К.С. на новой должности директора по работе с персоналом в OpenAI? Ответ: Арвинду К.С. предстоит помочь масштабировать компанию, укрепить её корпоративную культуру … Читать далее

Команда Alibaba Qwen выпускает серию моделей Qwen 3.5 Medium: производственный флагман, доказывающий, что меньшие модели ИИ умнее

Развитие новых подходов в Alibaba Развитие больших языковых моделей (LLM) традиционно определялось стремлением к увеличению масштаба. Однако рост количества параметров до триллионов сначала приводил к повышению производительности, но также вводил значительные накладные расходы на инфраструктуру и уменьшающуюся предельную полезность. Выпуск серии моделей Qwen 3.5 Medium сигнализирует о сдвиге в подходе Alibaba к Qwen, где приоритет … Читать далее

Исследователи Google DeepMind применяют семантическую эволюцию для создания нестандартных вариантов VAD-CFR и SHOR-PSRO для улучшения алгоритмической сходимости

На конкурентной арене многоагентного обучения с подкреплением (MARL) прогресс долгое время сдерживался человеческой интуицией. В течение многих лет исследователи вручную совершенствовали такие алгоритмы, как минимизация контрфактического сожаления (CFR) и оракулы пространства политик (PSRO), перебирая обширное комбинаторное пространство правил обновления методом проб и ошибок. Команда исследователей Google DeepMind изменила эту парадигму с помощью AlphaEvolve — агента … Читать далее

RAG против Context Stuffing: почему выборочный поиск более эффективен и надёжен, чем вставка всех данных в запрос

Большие контекстные окна значительно увеличили объём информации, которую современные языковые модели могут обработать за один запрос. Модели, способные обрабатывать сотни тысяч или даже миллионы токенов, позволяют предположить, что Retrieval-Augmented Generation (RAG) больше не нужна. Однако ключевое различие заключается не в объёме, который может увидеть модель, а в том, какую информацию она должна увидеть. Контекстное окно … Читать далее

Composio выпускает Agent Orchestrator с открытым исходным кодом, чтобы помочь разработчикам ИИ создавать масштабируемые мультиагентные рабочие процессы за пределами традиционных циклов ReAct

В течение последнего года разработчики ИИ полагались на шаблон ReAct (Reasoning + Acting) — простой цикл, в котором языковая модель рассуждает, выбирает инструмент и выполняет задачу. Но, как знает любой программист, который пытался внедрить таких агентов в производство, простые циклы хрупкие. Они галлюцинируют, теряют из виду сложные цели и борются с «шумом инструментов», когда сталкиваются … Читать далее

Изменение игры: как WebSocket-режим от OpenAI трансформирует взаимодействие с голосовым ИИ в условиях низкой задержки

В мире генеративного ИИ задержка является главным врагом погружения. До недавнего времени создание голосового ИИ-агента было похоже на сборку машины Рубе Голдберга: вы передавали аудио в модель преобразования речи в текст (STT), отправляли расшифровку в большую языковую модель (LLM), а затем передавали текст в модель преобразования текста в речь (TTS). Каждый переход добавлял сотни миллисекунд … Читать далее

Почему мы больше не оцениваем SWE-bench Verified?

SWE-bench Verified становится всё более недостоверным и искажает представление о прогрессе в области передовых разработок в кодировании. Наш анализ показал, что тесты имеют недостатки, а также происходит утечка данных при обучении. Мы рекомендуем использовать SWE-bench Pro. 1. Какие проблемы были выявлены при анализе SWE-bench Verified? В статье указано, что тесты SWE-bench Verified имеют недостатки и … Читать далее

Компания OpenAI объявляет о создании партнёрства Frontier Alliance.

Цель партнёрства — помочь предприятиям перейти от пилотных проектов в сфере ИИ к внедрению решений в производство, обеспечивая при этом безопасное и масштабируемое развёртывание агентов. 1. Какие задачи решает партнёрство Frontier Alliance? Ответ: партнёрство Frontier Alliance помогает предприятиям перейти от пилотных проектов в сфере ИИ к внедрению решений в производство, обеспечивая безопасное и масштабируемое развёртывание … Читать далее

Таалас заменяет программируемые графические процессоры специализированными чипами для искусственного интеллекта

В мире инфраструктуры искусственного интеллекта (ИИ) существует одно основное предположение: гибкость — это главное. Мы используем универсальные графические процессоры (GPU), поскольку модели ИИ меняются каждую неделю, и нам нужен программируемый кремний, который может адаптироваться к новым научным прорывам. Но стартап из Торонто под названием Таалас считает, что именно гибкость сдерживает развитие ИИ. По мнению команды … Читать далее

VectifyAI запускает Mafin 2.5 и PageIndex: достижение точности 98,7% в финансовом RAG с новым открытым индексом на основе дерева

Создание конвейера генерации с извлечением информации (RAG) — это просто, но создать такой, который не будет выдавать ошибочные данные во время аудита по форме 10-K, практически невозможно. Для разработчиков в финансовом секторе «стандартный» подход на основе векторов — разбиение текста и надежда на лучшее — часто приводит к «супу из текста», в котором теряется жизненно … Читать далее

Руководство по кодированию для инструментирования, трассировки и оценки приложений LLM с использованием TruLens и моделей OpenAI

В этом руководстве мы сосредоточимся на создании прозрачного и измеримого механизма оценки для приложений с большими языковыми моделями (LLM) с использованием TruLens. Вместо того чтобы рассматривать LLM как чёрные ящики, мы инструментируем каждый этап приложения так, чтобы входные данные, промежуточные шаги и выходные данные фиксировались в виде структурированных трассировок. Затем мы добавляем функции обратной связи, … Читать далее