Открытое ИИ и правительство Греции запустили проект «OpenAI для Греции»

Компания OpenAI и правительство Греции запустили проект «OpenAI для Греции». Его цель — внедрить ChatGPT Edu в средние школы и поддержать обучение ответственному использованию искусственного интеллекта. Это партнёрство направлено на повышение уровня грамотности в области ИИ, поддержку местных стартапов и стимулирование экономического роста страны. 🔍🚀 1. Какие цели преследует проект «OpenAI для Греции»? Проект «OpenAI … Читать далее

Встречайте Chatterbox Multilingual: многоязычная модель Text-to-Speech с открытым исходным кодом, нулевым обучением, контролем эмоций и водяными знаками

Оглавление 1. Что предлагает Chatterbox Multilingual?2. Как она сравнивается с коммерческими системами?3. Как реализован контроль выразительности?4. Как водяные знаки способствуют ответственному использованию ИИ?5. Какие варианты развёртывания доступны?6. Каково значение открытого релиза Chatterbox Multilingual? Что предлагает Chatterbox Multilingual? Компания Resemble AI недавно выпустила Chatterbox Multilingual — модель Text-to-Speech (TTS) с открытым исходным кодом, предназначенную для клонирования … Читать далее

Роль искусственного интеллекта в биомедицинских исследованиях

Область биомедицинского искусственного интеллекта быстро развивается, растёт спрос на агентов, способных выполнять задачи в области геномики, клинической диагностики и молекулярной биологии. Эти агенты должны не просто извлекать факты, но и решать сложные биологические задачи, интерпретировать данные пациентов и извлекать значимую информацию из обширных биомедицинских баз данных. В отличие от моделей общего назначения, биомедицинские агенты должны … Читать далее

Google выпустил EmbeddingGemma: модель встраивания на 308 миллионов параметров для использования на устройствах

Google представил новую открытую модель текстового встраивания EmbeddingGemma, оптимизированную для искусственного интеллекта на устройствах. Модель сбалансирована по эффективности и качеству поиска. Насколько компактна EmbeddingGemma по сравнению с другими моделями? Модель EmbeddingGemma состоит всего из 308 миллионов параметров, что позволяет ей работать на мобильных устройствах и в автономном режиме. Несмотря на свой размер, она демонстрирует конкурентоспособные … Читать далее

Более экологичный способ 3D-печати прочных объектов

3D-печать прошла долгий путь с момента своего изобретения в 1983 году Чаком Халом, который впервые применил стереолитографию — метод, при котором с помощью ультрафиолетовых лазеров жидкий полимер затвердевает и превращается в твёрдые объекты. За десятилетия 3D-принтеры превратились из экспериментальных устройств в инструменты, способные производить всё: от индивидуальных протезов до сложных конструкций еды, архитектурных моделей и … Читать далее

Расширение экономических возможностей с помощью искусственного интеллекта

Компания OpenAI запускает платформу для поиска работы и новые программы сертификации, чтобы помочь работникам найти работу, обучение и сертификаты. Узнайте, как мы расширяем экономические возможности и делаем навыки в области искусственного интеллекта более доступными. #OpenAI запускает платформу для поиска работы и программы сертификации# Компания OpenAI создаёт платформу для поиска работы, которая поможет работникам найти подходящие … Читать далее

Google DeepMind обнаружила фундаментальную ошибку в RAG: ограничения встраивания нарушают поиск в масштабе

Системы генерации, дополненной извлечением (Retrieval-Augmented Generation, RAG), обычно полагаются на плотные модели встраивания, которые отображают запросы и документы в векторные пространства фиксированной размерности. Хотя этот подход стал стандартом для многих приложений ИИ, недавнее исследование команды Google DeepMind объясняет фундаментальное архитектурное ограничение, которое невозможно устранить только за счёт увеличения размера моделей или улучшения обучения. Какова теоретическая … Читать далее

Что такое OLMoASR и как он сравнивается с Whisper от OpenAI в распознавании речи?

Институт искусственного интеллекта Аллена (AI2) выпустил OLMoASR — набор открытых моделей для автоматического распознавания речи (ASR), которые конкурируют с системами с закрытым исходным кодом, такими как Whisper от OpenAI. AI2 не только опубликовал веса моделей, но и сделал доступными идентификаторы обучающих данных, шаги фильтрации, рецепты обучения и скрипты для тестирования — это необычно прозрачный шаг … Читать далее

Google представляет интеграцию Gemini CLI в GitHub Actions: безопасная, бесплатная и готовая для предприятий интеграция ИИ

Разработчики могут напрямую интегрировать возможности кодирования в свои репозитории GitHub. Недавно компания Google представила Gemini CLI GitHub Actions — новый способ для разработчиков интегрировать возможности ИИ Gemini в их репозитории GitHub. Этот инструмент, созданный на основе платформы автоматизации рабочих процессов GitHub, превращает Gemini из помощника по кодированию только для терминала в командного игрока, который участвует … Читать далее

ИИ и мозг: как модели DINOv3 помогают понять обработку зрительной информации у человека

Введение Понимание того, как мозг создаёт внутренние представления об окружающем мире, — одна из самых увлекательных задач в нейронауке. За последнее десятилетие глубокое обучение изменило компьютерное зрение, создав нейронные сети, которые не только работают с точностью, сравнимой с человеческой, в задачах распознавания, но и, похоже, обрабатывают информацию так же, как наш мозг. Это неожиданное совпадение … Читать далее

Новый генеративный подход искусственного интеллекта к прогнозированию химических реакций

Многие попытки использовать возможности нового искусственного интеллекта и больших языковых моделей (LLMs) для прогнозирования результатов химических реакций не приносили значительного успеха. Это было связано с тем, что до недавнего времени они не основывались на понимании фундаментальных физических принципов, таких как закон сохранения массы. Команда исследователей из Массачусетского технологического института (MIT) разработала способ учёта этих физических … Читать далее

Tencent выпускает в открытый доступ модели многоязычного перевода Hunyuan-MT-7B и Hunyuan-MT-Chimera-7B

Введение Команда Hunyuan от Tencent выпустила модель перевода Hunyuan-MT-7B и ансамблевую модель Hunyuan-MT-Chimera-7B. Обе модели разработаны специально для многоязычного машинного перевода и были представлены в связи с участием Tencent в общем конкурсе машинного перевода WMT2025, где Hunyuan-MT-7B заняла первое место в 30 из 31 языковых пар. 📃 [Подробнее можно ознакомиться здесь](https://github.com/Tencent-Hunyuan/Hunyuan-MT/blob/main/HunyuanMTTechnical_Report.pdf) Обзор моделей Hunyuan-MT-7B * … Читать далее

Плюсы и минусы синтетических данных в искусственном интеллекте

Синтетические данные — это данные, искусственно созданные алгоритмами для имитации статистических свойств реальных данных, не содержащие информации из реальных источников. Хотя точные цифры трудно определить, некоторые оценки показывают, что более 60 процентов данных, используемых для приложений искусственного интеллекта в 2024 году, были синтетическими, и ожидается, что эта цифра будет расти в разных отраслях. Поскольку синтетические … Читать далее

Google AI представляет Stax: практичный инструмент искусственного интеллекта для оценки больших языковых моделей (LLM)

Оценка больших языковых моделей (LLM) — непростая задача. В отличие от традиционного тестирования программного обеспечения, LLM — это вероятностные системы. Это означает, что они могут генерировать разные ответы на идентичные запросы, что усложняет проверку воспроизводимости и согласованности. Чтобы решить эту проблему, Google AI выпустил Stax — экспериментальный инструмент для разработчиков, который предоставляет структурированный способ оценки … Читать далее

О «революции данных» в биологии и медицине

Вопрос: Центр Эрика и Венди Шмидта фокусируется на четырёх естественных уровнях биологической организации: белки, клетки, ткани и организмы. Что в современном ландшафте машинного обучения делает работу над этими специфическими классами задач особенно актуальной? Ответ: Биология и медицина переживают «революцию данных». Появление масштабных и разнообразных наборов данных — от геномики и мультиомики до изображений высокого разрешения … Читать далее

Виджае Раджи займёт должность технического директора по приложениям после приобретения компании Statsig.

Виджае Раджи приступит к новым обязанностям в качестве технического директора по приложениям. Он будет подчиняться генеральному директору по приложениям Фиджи Симо. Это стало возможным после приобретения компании Statsig. 1. Какие изменения в структуре управления компании Statsig могут произойти после назначения Виджае Раджи на должность технического директора по приложениям? Ответ: После назначения Виджае Раджи на должность … Читать далее

Apple выпустила FastVLM: новый гибридный энкодер изображений, который в 85 раз быстрее и в 3,4 раза компактнее аналогичных языковых моделей обработки изображений (VLM)

Оглавление 1. Введение2. Существующие архитектуры VLM3. Apple’s FastVLM4. Сравнения с бенчмарками5. Заключение Введение Языковые модели обработки изображений (VLM) позволяют работать как с текстовыми данными, так и с визуальной информацией. Однако разрешение изображений имеет решающее значение для производительности VLM при обработке текста и данных с графиками. Увеличение разрешения изображений создаёт значительные проблемы. Во-первых, предварительно обученные энкодеры … Читать далее

Как создать продвинутого агента искусственного интеллекта с суммированием краткосрочной и векторной долгосрочной памяти

В этом руководстве мы покажем вам, как создать продвинутого агента искусственного интеллекта, который не только общается, но и запоминает. Мы начнём с нуля и продемонстрируем, как объединить легковесную LLM, векторный поиск FAISS и механизм суммирования для создания как краткосрочной, так и долгосрочной памяти. Установка необходимых библиотек Мы начнём с установки основных библиотек и импорта всех … Читать далее

Создание более полезных возможностей ChatGPT для всех.

Мы сотрудничаем с экспертами, усиливаем защиту подростков с помощью родительского контроля и перенаправляем конфиденциальные беседы к моделям обоснования в ChatGPT. 1. Какие меры предпринимаются для усиления защиты подростков при использовании ChatGPT? Ответ: в статье указано, что для усиления защиты подростков используется родительский контроль. 2. Какие возможности ChatGPT могут быть полезны для широкой аудитории? Ответ: в … Читать далее

Знакомьтесь: Elysia — новая система на основе открытого исходного кода, переопределяющая агентские RAG-системы с помощью деревьев решений и более разумной обработки данных

Если вы когда-либо пытались создать работающую агентскую RAG-систему, вы знаете, как это непросто. Вы загружаете в неё документы, скрещиваете пальцы и надеетесь, что она не начнёт фантазировать, когда кто-нибудь задаст простой вопрос. В большинстве случаев вы получаете обратно нерелевантные фрагменты текста, которые едва отвечают на заданный вопрос. Elysia пытается исправить эту ситуацию, и, честно говоря, … Читать далее

Реализация OAuth 2.1 для серверов MCP с помощью Scalekit: пошаговое руководство по кодированию

В этом руководстве мы рассмотрим, как реализовать OAuth 2.1 для серверов MCP. Для наглядности мы создадим простой сервер для анализа финансовых настроений и защитим его с помощью Scalekit — инструмента, который упрощает настройку OAuth. Настройка зависимостей Alpha Vantage API Чтобы получить данные о настроениях на фондовом рынке, мы будем использовать Alpha Vantage API. Чтобы получить … Читать далее

15 наиболее актуальных принципов работы корпоративного ИИ (2025)

Корпоративный ИИ переходит от отдельных пилотных проектов к системам производственного уровня, ориентированным на агентов. Ниже перечислены наиболее распространённые требования и тенденции при масштабном внедрении, основанные исключительно на документированных отраслевых источниках. 1. Распределённые архитектуры с агентами.Современные внедрения всё чаще полагаются на сотрудничающих агентов ИИ, которые разделяют задачи вместо единой монолитной модели. 2. Открытые протоколы взаимодействия необходимы.Такие … Читать далее

StepFun AI выпускает Step-Audio 2 Mini: большую аудиоязыковую модель (LALM) для преобразования речи в речь с открытым исходным кодом, которая превосходит GPT-4o-Audio

Команда StepFun AI выпустила Step-Audio 2 Mini — большую аудиоязыковую модель (LALM) с 8 миллиардами параметров для преобразования речи в речь. Модель обеспечивает выразительное, обоснованное взаимодействие в реальном времени. Модель выпущена под лицензией Apache 2.0 и демонстрирует передовые результаты в распознавании речи, понимании аудио и проверке речевых диалогов, превосходя такие коммерческие системы, как GPT-4o-Audio. Основные … Читать далее

Пошаговое руководство по разработке AI-агента с использованием Microsoft Agent-Lightning

В этом руководстве мы рассмотрим настройку продвинутого AI-агента с использованием фреймворка Microsoft Agent-Lightning. Мы будем работать непосредственно в Google Colab, что позволит нам экспериментировать как с серверными, так и с клиентскими компонентами в одном месте. Определив небольшого агента для вопросов и ответов (QA), подключив его к локальному серверу Agent-Lightning и обучив его с помощью нескольких … Читать далее

Команда NVIDIA AI представляет Jetson Thor: передовую платформу для физического искусственного интеллекта и робототехники нового поколения

На прошлой неделе команда разработчиков робототехники NVIDIA выпустила Jetson Thor, который включает в себя Jetson AGX Thor Developer Kit и модуль Jetson T5000. Это стало важной вехой в разработке робототехники для реальных условий с использованием искусственного интеллекта. Jetson Thor создан как суперкомпьютер для физического ИИ и объединяет генеративные рассуждения и мультимодальную обработку данных датчиков для … Читать далее

Понимание работы OAuth 2.1 для серверов MCP (Model Context Protocol): этапы обнаружения, авторизации и доступа

OAuth 2.1 — это официально утверждённый стандарт авторизации в спецификациях Model Context Protocol (MCP). Согласно официальной документации, серверы авторизации должны реализовывать OAuth 2.1 с надлежащими мерами безопасности как для конфиденциальных, так и для публичных клиентов. MCP обеспечивает авторизацию на транспортном уровне, позволяя клиентам безопасно получать доступ к защищённым серверам от имени владельцев ресурсов. Выбор OAuth … Читать далее

Что такое наблюдаемость агентов искусственного интеллекта? 7 лучших практик для надёжного ИИ

Что такое наблюдаемость агентов? Наблюдаемость агентов — это дисциплина, которая включает в себя настройку инструментов, отслеживание, оценку и мониторинг агентов искусственного интеллекта на протяжении всего их жизненного цикла — от планирования и вызовов инструментов до записи в память и окончательных результатов. Это позволяет командам устранять сбои, количественно оценивать качество и безопасность, контролировать задержки и затраты, … Читать далее

Alibaba Qwen Team выпускает Mobile-Agent-v3 и GUI-Owl: мультиагентная платформа нового поколения для автоматизации графического интерфейса пользователя

Введение: рост популярности агентов GUI В современных вычислениях графические интерфейсы пользователя (GUI) доминируют на всех устройствах — мобильных, настольных и веб-приложениях. Традиционно автоматизация задач в этих средах ограничивалась скриптами-макросами или хрупкими, вручную созданными правилами. Недавние достижения в области моделей, работающих с визуальной информацией и языком, открывают заманчивую возможность создания агентов, которые могут понимать экраны, планировать … Читать далее

Как создать диалогового исследовательского ИИ-агента с помощью LangGraph: воспроизведение шагов и контрольные точки «путешествия во времени»

В этом руководстве мы рассмотрим, как LangGraph позволяет нам структурированно управлять потоками бесед, а также даёт возможность «путешествия во времени» через контрольные точки. Создание чат-бота Мы создадим чат-бота, который объединяет бесплатную модель Gemini и инструмент Wikipedia. Это позволит нам:* добавить несколько шагов в диалог;* записать каждую контрольную точку;* воспроизвести полную историю состояний;* возобновить работу с … Читать далее

Чункинг и токенизация: ключевые различия в обработке текста в ИИ

Оглавление 1. Введение2. Что такое токенизация?3. Что такое чункинг?4. Ключевые различия, которые имеют значение5. Почему это важно для реальных приложений6. Где вы будете использовать каждый подход7. Текущие лучшие практики (что на самом деле работает)8. Резюме Введение Когда вы работаете с искусственным интеллектом и обработкой естественного языка, вы быстро столкнётесь с двумя фундаментальными концепциями, которые часто … Читать далее