OpenAI представляет IndQA — новый стандарт для оценки систем искусственного интеллекта на индийских языках. Созданный с участием экспертов в соответствующих областях, IndQA проверяет понимание культуры и логики в 12 языках и 10 областях знаний.

1. Какие цели преследует IndQA при оценке систем искусственного интеллекта? Ответ: IndQA создан для проверки понимания культуры и логики системами искусственного интеллекта на индийских языках. Это позволяет оценить, насколько хорошо ИИ адаптирован к специфике этих языков и культур. 2. Сколько языков и областей знаний охватывает IndQA? Ответ: IndQA охватывает 12 индийских языков и 10 областей … Читать далее

Как создавать модели ИИ с учителем, когда у вас нет размеченных данных

Active learning (активное обучение) — это подход в машинном обучении, при котором алгоритм не просто пассивно потребляет данные, а активно участвует в процессе обучения. Вместо того чтобы сразу маркировать весь набор данных, модель выбирает наиболее информативные точки данных, которые нужно маркировать в первую очередь. Это позволяет быстрее обучаться, используя гораздо меньше размеченных примеров. Этапы работы … Читать далее

Помощь школам K–12 в освоении сложного мира искусственного интеллекта

Стремительное развитие генеративного искусственного интеллекта ставит перед учителями и руководителями школ непростые вопросы о том, как успешно внедрить технологии в учебный процесс и при этом обеспечить усвоение знаний учениками. Джастин Рейх, доцент программы Comparative Media Studies/Writing в MIT, надеется, что новое руководство, опубликованное MIT Teaching Systems Lab, поможет педагогам K–12 разрабатывать политики и рекомендации по … Читать далее

Как ИИ помогает нам отслеживать и поддерживать уязвимые экосистемы

Недавнее исследование из Орегонского государственного университета показало, что более 3500 видов животных находятся под угрозой исчезновения из-за таких факторов, как изменение среды обитания, чрезмерная эксплуатация природных ресурсов и изменение климата. Чтобы лучше понять эти изменения и защитить уязвимые виды диких животных, такие как студент Массачусетского технологического института (MIT) Джастин Кэй, работающий в Лаборатории компьютерных наук … Читать далее

AWS и OpenAI объявили о многолетнем стратегическом партнёрстве.

Компании AWS и OpenAI заключили многолетнее партнёрство на сумму 38 миллиардов долларов, чтобы расширить возможности работы с передовым искусственным интеллектом. AWS предоставит инфраструктуру и вычислительные мощности мирового уровня для разработки моделей следующего поколения в OpenAI. 1. Какие основные цели преследуются в рамках стратегического партнёрства между AWS и OpenAI? * В рамках стратегического партнёрства AWS и … Читать далее

Инструмент для быстрого решения задач, гарантирующий реализуемость решения

Управление энергосистемой — это как попытка решить огромную головоломку. Операторы сети должны обеспечить подачу нужного количества электроэнергии в нужные районы в нужный момент, причём сделать это так, чтобы минимизировать затраты и не перегружать физическую инфраструктуру. Более того, они должны решать эту сложную задачу многократно и как можно быстрее, чтобы соответствовать постоянно меняющемуся спросу. Чтобы помочь … Читать далее

Как спроектировать систему с постоянной памятью и персонализированным агентским ИИ с учётом затухания и самооценки?

В этом руководстве мы рассмотрим, как создать интеллектуального агента, который запоминает, учится и адаптируется к нам с течением времени. Мы реализуем систему постоянной памяти и персонализации, используя простую логику, основанную на правилах, чтобы имитировать, как современные фреймворки агентского ИИ хранят и вспоминают контекстуальную информацию. По мере продвижения мы увидим, как ответы агента развиваются с опытом, … Читать далее

Как создать API, готовые к работе с ИИ?

Недавно компания Postman выпустила подробный контрольный список и руководство для разработчиков по созданию API, готовых к работе с ИИ. В нём подчёркивается простая истина: даже самые мощные модели ИИ настолько хороши, насколько хороши данные, которые они получают, а эти данные поступают через ваши API. Если ваши конечные точки (endpoints) непоследовательны, неясны или ненадёжны, модели тратят … Читать далее

LongCat-Flash-Omni: передовая открытая омнимодальная модель с 560 миллиардами параметров

LongCat Flash Omni — это открытая омнимодальная модель с 560 миллиардами параметров, в которой активировано около 27 миллиардов параметров на токен. Она разработана командой LongCat из Meituan и предназначена для аудиовизуального взаимодействия в реальном времени. Архитектура и модальные присоединения LongCat Flash Omni сохраняет языковую модель без изменений, добавляя модули восприятия. Кодировщик LongCat ViT обрабатывает как … Читать далее

Сравнение шести лучших систем оптического распознавания символов (OCR) в 2025 году

Оптическое распознавание символов (OCR) перешло от простого извлечения текста к интеллектуальному анализу документов. Современные системы должны считывать отсканированные и цифровые PDF-файлы за один проход, сохранять структуру, обнаруживать таблицы, извлекать пары «ключ-значение» и работать с несколькими языками. В 2025 году шесть систем охватывают большинство реальных рабочих нагрузок: 1. Google Cloud Document AI, Enterprise Document OCR.2. Amazon … Читать далее

Комплексная система бенчмаркинга для оценки агентских ИИ-систем на реальных задачах корпоративного ПО

В этом руководстве мы разрабатываем комплексную систему бенчмаркинга для оценки различных типов агентских ИИ-систем при выполнении реальных задач корпоративного программного обеспечения. Мы создаём набор разнообразных задач, от преобразования данных и интеграции API до автоматизации рабочих процессов и оптимизации производительности, и оцениваем, как различные агенты, включая основанные на правилах, на базе LLM и гибридные, справляются с … Читать далее

DeepAgent: агент искусственного интеллекта для глубокого анализа, который выполняет автономное мышление, поиск инструментов и выполнение действий в рамках единого процесса рассуждения

Большинство фреймворков для агентов всё ещё используют предопределённый цикл Reason, Act, Observe, поэтому агент может использовать только те инструменты, которые внедрены в запрос. Это работает для небольших задач, но не справляется, когда набор инструментов большой, задача длинная, и агенту необходимо изменить стратегию в середине рассуждения. Команда из Renmin University of China и Xiaohongshu предлагает DeepAgent … Читать далее

Новое исследование Anthropic: модель Claude может обнаруживать внедрённые концепции, но только в контролируемых слоях

Как определить, действительно ли модель замечает своё внутреннее состояние, а не просто повторяет данные из обучающей выборки? В последнем исследовании Anthropic под названием «Emergent Introspective Awareness in Large Language Models» рассматривается вопрос о том, могут ли современные модели Claude не только говорить о своих способностях, но и замечать реальные изменения внутри своей сети. Чтобы исключить … Читать далее

Как создать полный конвейер для обработки данных и машинного обучения с помощью Apache Spark и PySpark

В этом руководстве мы рассмотрим, как использовать возможности Apache Spark с помощью PySpark непосредственно в Google Colab. Мы начнём с настройки локального сеанса Spark, затем последовательно перейдём к трансформациям, SQL-запросам, объединениям и оконным функциям. Настройка Мы создадим и оценим простую модель машинного обучения для прогнозирования типов подписки пользователей и, наконец, продемонстрируем, как сохранять и перезагружать … Читать далее

Google AI представляет обучение с подкреплением под контролем (SRL): пошаговая система с экспертными траекториями для обучения небольших языковых моделей решению сложных задач

Команда исследователей из Google Cloud AI Research и UCLA разработала систему обучения с подкреплением под контролем (Supervised Reinforcement Learning, SRL). Она позволяет небольшим моделям на самом деле учиться решать сложные математические задачи и задачи для агентов, с которыми не справляются обычные методы тонкой настройки под контролем и обучения с подкреплением, ориентированного на результат. Как небольшая … Читать далее

OpenAI представляет исследовательский предварительный просмотр gpt-oss-safeguard

Компания OpenAI выпустила исследовательский предварительный просмотр двух моделей для рассуждений о безопасности с открытым весом — gpt-oss-safeguard. Они позволяют разработчикам применять индивидуальные политики безопасности во время вывода. Модели представлены в двух размерах:* gpt-oss-safeguard-120b;* gpt-oss-safeguard-20b. Обе модели основаны на gpt-oss, лицензированы по Apache 2.0 и доступны на Hugging Face для локального использования. Почему важна политика, обусловленная … Читать далее

Как спроектировать автономную систему стратегии данных и инфраструктуры с использованием облегчённых моделей Qwen для эффективного управления конвейерами данных?

В этом руководстве мы создаём систему стратегии данных и инфраструктуры с использованием облегчённой модели Qwen2.5-0.5B-Instruct для эффективного выполнения задач. Мы начинаем с создания гибкой структуры агентов LLM, а затем разрабатываем специализированных агентов, которые обрабатывают различные уровни управления данными: от приёма и анализа качества до оптимизации инфраструктуры. Основные шаги: 1. Создание гибкой структуры агентов LLM: — … Читать далее

OpenAI расширяет присутствие Stargate в Мичигане, открыв новый кампус мощностью один гигаватт, что укрепит инфраструктуру искусственного интеллекта в Америке. Проект создаст новые рабочие места, привлечёт инвестиции и поддержит экономический рост на Среднем Западе. 🏭💰

1. Какие потенциальные преимущества принесёт открытие нового кампуса OpenAI в Мичигане для местной экономики? Открытие нового кампуса OpenAI в Мичигане создаст новые рабочие места, привлечёт инвестиции и поддержит экономический рост на Среднем Западе. 2. Какие факторы могут способствовать привлечению инвестиций в регион после открытия кампуса OpenAI? Проект по открытию нового кампуса OpenAI в Мичигане может … Читать далее

Ant Group выпускает Ling 2.0: серия языковых моделей MoE, ориентированная на рассуждения, построена на принципе, что каждая активация повышает способность к рассуждениям

Компания Ant Group выпустила Ling 2.0 — серию языковых моделей, ориентированных на рассуждения. В основе серии лежит принцип, согласно которому каждая активация должна приводить к улучшению способности к рассуждениям. Как создать языковую модель, которая растёт в мощности, но при этом сохраняет вычисления для каждого токена практически неизменными? Команда Inclusion AI из Ant Group методично продвигает … Читать далее

Представляем Aardvark: исследователь безопасности от OpenAI.

Компания OpenAI представляет Aardvark — исследователя безопасности на базе искусственного интеллекта, который автономно находит, проверяет и помогает устранять уязвимости в программном обеспечении в больших масштабах. Система находится на стадии закрытого бета-тестирования. Зарегистрируйтесь, чтобы принять участие в ранних тестированиях. 1. Какие задачи выполняет Aardvark от OpenAI? Aardvark — это исследователь безопасности на базе искусственного интеллекта, который … Читать далее

Как создать автономных агентов, соответствующих этическим нормам, с помощью ценностно-ориентированного рассуждения и самокорректирующего принятия решений на основе моделей с открытым исходным кодом

В этом руководстве мы рассмотрим, как можно создать автономного агента, который согласовывает свои действия с этическими и организационными ценностями. Мы используем модели с открытым исходным кодом Hugging Face, работающие локально в Colab, чтобы имитировать процесс принятия решений, который балансирует достижение целей с моральными рассуждениями. Подготовка среды и библиотек Мы начинаем с настройки нашей среды и … Читать далее

Команда IBM AI выпускает серию моделей Granite 4.0 Nano: компактные модели с открытым исходным кодом для ИИ на периферийных устройствах

Модели малого размера часто сталкиваются с проблемами из-за плохой настройки инструкций, слабых форматов использования инструментов и отсутствия управления. Команда IBM AI выпустила Granite 4.0 Nano — семейство небольших моделей, предназначенных для локальных и периферийных вычислений с корпоративным контролем и открытым лицензированием. Что нового в серии Granite 4.0 Nano? Семейство Granite 4.0 Nano включает 8 моделей … Читать далее

Microsoft выпускает Agent Lightning: новая платформа искусственного интеллекта для обучения на основе подкрепления

Microsoft представляет Agent Lightning — платформу с открытым исходным кодом, которая позволяет обучать любых агентов искусственного интеллекта (ИИ) на основе методов подкрепления (RL — Reinforcement Learning) без необходимости переписывать существующий стек агентов. Как Agent Lightning улучшает обучение Платформа моделирует агента как процесс принятия решений. Она формализует агента как частично наблюдаемый марковский процесс принятия решений, где … Читать далее

Технический отчёт: оценка производительности и базовых характеристик моделей GPT-OSS-Safeguard-120B и GPT-OSS-Safeguard-20B.

GPT-OSS-Safeguard-120B и GPT-OSS-Safeguard-20B — это две модели для рассуждений с открытым весом, дообученные на основе моделей GPT-OSS. Они обучены делать выводы в соответствии с предоставленной политикой и маркировать контент в соответствии с этой политикой. В этом отчёте мы описываем возможности GPT-OSS-Safeguard и предоставляем базовые оценки безопасности для моделей GPT-OSS-Safeguard, используя базовые модели GPT-OSS в качестве … Читать далее

Liquid AI представляет LFM2-ColBERT-350M: новая компактная модель для мультиязычного и кросс-язычного поиска

Компания Liquid AI выпустила LFM2-ColBERT-350M — компактную модель для мультиязычного и кросс-язычного поиска. Модель использует подход позднего взаимодействия (late interaction) для эффективного индексирования документов и поиска по ним. Может ли компактная модель позднего взаимодействия индексировать данные один раз и обеспечивать точный кросс-языковой поиск с быстрым выводом результатов? Да, Liquid AI выпустила LFM2-ColBERT-350M — компактную модель … Читать далее

Представляем gpt-oss-safeguard — модели OpenAI для обеспечения безопасности на основе рассуждений с открытым весом, которые позволяют разработчикам применять индивидуальные политики для классификации и защиты онлайн-контента.

1. Какие возможности предоставляют модели OpenAI gpt-oss-safeguard для разработчиков? Ответ: модели OpenAI gpt-oss-safeguard позволяют разработчикам применять индивидуальные политики для классификации и защиты онлайн-контента. 2. Для чего предназначены модели OpenAI gpt-oss-safeguard? Ответ: модели OpenAI gpt-oss-safeguard предназначены для обеспечения безопасности на основе рассуждений и защиты онлайн-контента. 3. Какие задачи можно решать с помощью моделей gpt-oss-safeguard? Ответ: с … Читать далее

Сохранение знаний с помощью ChatGPT.

Компания Dai Nippon Printing (DNP) внедрила ChatGPT Enterprise в десяти основных отделах для стимулирования внедрения технологии в масштабах всей компании. За три месяца были достигнуты следующие результаты:* ускорение патентных исследований на 95%;* увеличение объёма обработки в 10 раз;* 100% еженедельное активное использование;* автоматизация на 87%;* повторное использование знаний на 70%. Dai Nippon Printing (DNP) внедрила … Читать далее

Как агенты исследования, такие как Q-Learning, UCB и MCTS, совместно обучаются решению интеллектуальных задач в динамических сетчатых средах

В этом руководстве мы рассмотрим, как стратегии исследования формируют интеллектуальное принятие решений через агентное решение задач. Мы создадим и обучим трёх агентов: Q-Learning с ε-жадной стратегией исследования, Upper Confidence Bound (UCB) и Monte Carlo Tree Search (MCTS), чтобы они могли эффективно перемещаться по сетчатому миру и достигать цели, избегая препятствий. Создание агентов Мы начнём с … Читать далее

MiniMax выпускает MiniMax M2: компактная открытая модель для кодирования и агентских рабочих процессов

MiniMax выпустила MiniMax M2 — компактную модель MoE, оптимизированную для кодирования и агентских рабочих процессов. Она работает примерно в 8 раз дешевле Claude Sonnet и примерно в 2 раза быстрее. Что такое MiniMax M2? MiniMax M2 — это компактная модель MoE (Mixture of Experts), которая оптимизирована для кодирования и агентских рабочих процессов. Веса модели опубликованы … Читать далее

Zhipu AI выпускает «Glyph»: фреймворк ИИ для масштабирования длины контекста через визуально-текстовое сжатие

Команда исследователей из Zhipu AI выпустила Glyph — фреймворк искусственного интеллекта для масштабирования длины контекста с помощью визуально-текстового сжатия. Система преобразует длинные текстовые последовательности в изображения, а затем обрабатывает их с помощью моделей зрения и языка (VLM). Каждый визуальный токен кодирует множество символов, поэтому эффективная последовательность токенов сокращается, при этом семантика сохраняется. Glyph может обеспечить … Читать далее