AmbiGraph-Eval: эталон для разрешения неоднозначности при генерации запросов к графам

Семантический синтаксический анализ преобразует естественный язык в формальные языки запросов, такие как SQL или Cypher, позволяя пользователям более интуитивно взаимодействовать с базами данных. Однако естественный язык по своей природе неоднозначен, часто допускает множество допустимых интерпретаций, в то время как языки запросов требуют точности. Хотя неоднозначность в табличных запросах изучена, графовые базы данных представляют собой сложную … Читать далее

Ускорение исследований в области наук о жизни

Узнайте, как специализированная модель искусственного интеллекта GPT-4b micro помогла компаниям OpenAI и Retro Bio разработать более эффективные белки для терапии стволовыми клетками и исследований в области долголетия. #GPT-4b micro #OpenAI #Retro Bio #белки #терапия стволовыми клетками #исследования долголетия 1. Какие задачи решает модель искусственного интеллекта GPT-4b micro в контексте научных исследований? * Модель GPT-4b micro … Читать далее

Топ-10 блогов и новостных сайтов по искусственному интеллекту для разработчиков и инженеров в 2025 году

Быть в курсе последних достижений, инструментов и изменений в отрасли крайне важно для разработчиков и инженеров в области искусственного интеллекта. Чтобы помочь вам сориентироваться, мы составили список из 10 лучших блогов и новостных платформ, посвящённых ИИ, которые предлагают высококачественный, технический и практически применимый контент для разработчиков и инженеров любого уровня. 1. Блог OpenAI Это основной … Читать далее

Zhipu AI представляет ComputerRL: фреймворк для масштабирования обучения с подкреплением для агентов использования компьютеров

В быстроразвивающейся сфере автоматизации на основе искусственного интеллекта компания Zhipu AI представила ComputerRL — инновационный фреймворк, призванный предоставить агентам возможность навигации и управления в сложных цифровых рабочих средах. Это нововведение решает основную проблему в разработке агентов искусственного интеллекта: разрыв между компьютерными агентами и разработанными человеком графическими пользовательскими интерфейсами (GUI). Парадигма API-GUI: объединение взаимодействия человека и … Читать далее

Google выпустила язык программирования Mangle для работы с дедуктивными базами данных

Google представила Mangle — новый язык программирования с открытым исходным кодом, который расширяет классический логический язык Datalog для современного программирования дедуктивных баз данных. Mangle, реализованный в виде библиотеки Go, призван упростить сложную задачу запроса данных и рассуждений о них, распределённых по различным источникам. Проблема фрагментации данных В современных программных экосистемах информация о зависимостях, уязвимостях, конфигурациях … Читать далее

Что такое разделение говорящих? Техническое руководство 2025 года: лучшие библиотеки и API для разделения говорящих в 2025 году

Оглавление 1. Как работает разделение говорящих?2. Точность, метрики и текущие проблемы.3. Технические идеи и тенденции 2025 года.4. Топ-9 библиотек и API для разделения говорящих в 2025 году.5. Часто задаваемые вопросы. Что такое разделение говорящих? Разделение говорящих — это процесс определения, «кто и когда говорил» в аудиопотоке путём разделения аудио на сегменты и последовательной маркировки каждого … Читать далее

NVIDIA выпустила систему Streaming Sortformer для мгновенной идентификации говорящих в режиме реального времени

NVIDIA представила Streaming Sortformer — прорыв в области определения говорящих в реальном времени. Система мгновенно идентифицирует и маркирует участников встреч, звонков и голосовых приложений — даже в условиях шума и нескольких говорящих. Основные возможности:* Отслеживание нескольких говорящих в реальном времени. В отличие от традиционных систем, Streaming Sortformer выполняет диаризацию на уровне кадров в реальном времени. … Читать далее

Расширение экспертных знаний в сложных, регулируемых областях.

Узнайте, как Blue J преобразует налоговые исследования с помощью инструментов на базе искусственного интеллекта, созданных на основе GPT-4.1. Сочетая экспертные знания с технологией Retrieval-Augmented Generation, Blue J предоставляет быстрые, точные и полностью оформленные налоговые ответы, которым доверяют профессионалы в США, Канаде и Великобритании. 1. Какие технологии лежат в основе инструментов Blue J для налоговых исследований? … Читать далее

Что такое DeepSeek-V3.1 и почему о нём все говорят?

Китайский стартап в области искусственного интеллекта DeepSeek выпустил свою новейшую флагманскую языковую модель — DeepSeek-V3.1. Она основана на архитектуре DeepSeek-V3, но имеет значительные улучшения в области рассуждений, использования инструментов и производительности в кодировании. Примечательно, что модели DeepSeek быстро завоевали репутацию, предоставляя производительность на уровне OpenAI и Anthropic при значительно меньших затратах. Архитектура модели и возможности … Читать далее

DeepCode: открытая агентская платформа для кодирования, которая преобразует научные статьи и технические документы в готовый к использованию код

Появление передовых инструментов для разработки искусственного интеллекта (ИИ) меняет подход исследователей и инженеров к воплощению прорывных научных идей в надёжные приложения, пригодные для использования в реальных условиях. Команда исследователей из Гонконгского университета представила DeepCode — платформу для кодирования с использованием искусственного интеллекта. DeepCode предлагает парадигму «открытого агентского кодирования», используя мультиагентные системы ИИ для автоматизации процессов … Читать далее

Встречайте лидеров в области больших языковых моделей в Южной Корее: HyperClova, AX, Solar Pro и другие

Южная Корея стремительно закрепляет за собой статус ключевого инноватора в области больших языковых моделей (LLM), благодаря стратегическим государственным инвестициям, корпоративным исследованиям и сотрудничеству в области открытых источников для создания моделей, адаптированных для обработки корейского языка и применения внутри страны. Такой подход помогает снизить зависимость от иностранных технологий искусственного интеллекта, повышает конфиденциальность данных и поддерживает такие … Читать далее

Liquid AI выпустила LFM2-VL: сверхбыстрые модели зрения и языка для устройств с низкой задержкой

Компания Liquid AI официально выпустила LFM2-VL — новое семейство базовых моделей зрения и языка, оптимизированных для работы с низкой задержкой на устройствах. В семействе есть два высокоэффективных варианта — LFM2-VL-450M и LFM2-VL-1.6B. Этот запуск знаменует собой значительный шаг вперёд в применении мультимодального искусственного интеллекта на смартфонах, ноутбуках, носимых устройствах и встраиваемых системах без ущерба для … Читать далее

Mixi переосмысливает общение с помощью ChatGPT.

Узнайте, как Mixi, лидер в области цифровых развлечений и услуг для жизни в Японии, использует ChatGPT Enterprise для повышения производительности, ускорения внедрения искусственного интеллекта в командах и создания безопасной среды для инноваций. 1. Какие цели преследует компания Mixi, внедряя ChatGPT Enterprise в свою деятельность? Ответ: компания Mixi использует ChatGPT Enterprise для повышения производительности и ускорения … Читать далее

ZenFlow: новое расширение DeepSpeed для бесперебойной разгрузки при обучении больших языковых моделей (LLM)

Команда DeepSpeed представила ZenFlow — новый механизм разгрузки, призванный преодолеть серьёзное узкое место в обучении больших языковых моделей (LLM): задержки GPU, вызванные работой CPU. Традиционные фреймворки, такие как ZeRO-Offload и ZeRO-Infinity, хоть и снижают нагрузку на память GPU за счёт переноса оптимизаторов и градиентов в память CPU, но всё равно оставляют дорогостоящие GPU большую часть … Читать далее

Сравнение фреймворков глубокого обучения: PyTorch против TensorFlow в 2025 году

Выбор между PyTorch и TensorFlow остаётся одним из самых обсуждаемых вопросов в разработке искусственного интеллекта. Оба фреймворка претерпели значительные изменения с момента своего создания, сближаясь в некоторых областях, но сохраняя свои сильные стороны. В этой статье мы рассмотрим последние тенденции, основанные на всеобъемлющем обзорном исследовании из Университета Альфаисаль, Саудовская Аравия, обобщая аспекты удобства использования, производительности, … Читать далее

Google выпустил 5 новых AI-агентов и платформ для разработчиков

Google Cloud недавно представил пять специализированных AI-агентов, призванных оптимизировать рабочие процессы разработчиков — сократить ручной труд, ускорить анализ и снизить порог входа в автоматизацию данных и кода на продвинутом уровне. Каждый агент решает определённую задачу разработчиков, от управления потоками данных до управления GitHub корпоративного уровня. BigQuery Data Agent BigQuery Data Agent автоматизирует создание и управление … Читать далее

Переход на протокол Model Context (MCP): руководство по внедрению с акцентом на адаптеры

Protocol Model Context (MCP) быстро стал универсальным стандартом для подключения моделей искусственного интеллекта (ИИ) к различным приложениям, системам и инструментам. Представьте себе MCP как «USB-C для интеграций ИИ», как это часто описывают в отрасли. Для организаций, привыкших к индивидуальным интеграциям, переход на MCP может стать настоящим преобразованием, одновременно сокращая технический долг и открывая новые возможности … Читать далее

Привет, формулы с ИИ: почему =COPILOT() — это крупнейшее обновление Excel за последние годы

Microsoft официально представила функцию COPILOT в Excel для Windows и Mac. Она позволяет использовать возможности больших языковых моделей (LLMs) прямо в электронных таблицах. Это фундаментальный сдвиг: ИИ теперь является встроенной функцией, а не просто внешней надстройкой или отдельным инструментом. Пользователи могут анализировать, обобщать и генерировать данные, используя подсказки на естественном языке прямо внутри формул Excel. … Читать далее

Оценка надёжности больших языковых моделей: сигнал и шум

Оценка больших языковых моделей (LLM) требует значительных научных и экономических затрат. Поскольку сфера стремится к созданию всё более крупных моделей, методология их оценки и сравнения становится всё более важной — не только для получения эталонных показателей, но и для обоснованных решений о разработке. Недавнее исследование Института искусственного интеллекта Аллена (Ai2) представляет надёжную систему, основанную на … Читать далее

Реализация кодирования для создания полноценного рабочего процесса LLM на собственном оборудовании с помощью Ollama, REST API и интерфейса чата Gradio

В этом руководстве мы реализуем полнофункциональную среду Ollama внутри Google Colab для воспроизведения рабочего процесса LLM на собственном оборудовании. Установка Ollama в Google Colab 1. Устанавливаем Ollama непосредственно на виртуальную машину Colab с помощью официального установщика Linux.2. Запускаем сервер Ollama в фоновом режиме, чтобы открыть HTTP API на `localhost:11434`.3. Проверяем службу.4. Загружаем лёгкие модели, такие … Читать далее

Знакомьтесь: M3-Agent — мультимодальный агент с долговременной памятью и улучшенными способностями к рассуждению

В будущем домашний робот сможет самостоятельно управлять повседневными делами и изучать закономерности в ведении хозяйства на основе полученного опыта. Например, он может подавать кофе по утрам без напоминаний, запомнив ваши привычки. Для мультимодального агента такой интеллект зависит от:* непрерывного наблюдения за миром с помощью мультимодальных датчиков;* сохранения опыта в долговременной памяти;* рассуждений на основе этой … Читать далее

NVIDIA выпустила семейство моделей искусственного интеллекта Nemotron Nano 2

Компания NVIDIA представила семейство гибридных больших языковых моделей (LLM) Nemotron Nano 2. Они не только обеспечивают высочайшую точность рассуждений, но и демонстрируют в 6 раз более высокую производительность по сравнению с моделями аналогичного размера. Основные характеристики:* Производительность: модели Nemotron Nano 2 обеспечивают в 6,3 раза более высокую скорость генерации токенов по сравнению с моделями типа … Читать далее

Memp: универсальная платформа для оптимизации процедурной памяти в агентах на базе LLM

Агенты на базе больших языковых моделей (LLM) стали достаточно мощными, чтобы справляться со сложными задачами, начиная от веб-исследований и создания отчётов и заканчивая анализом данных и многошаговыми рабочими процессами в программном обеспечении. Однако они испытывают трудности с процедурной памятью, которая сегодня часто жёстко запрограммирована, разработана вручную или «зашита» в весах моделей. Это делает их уязвимыми: … Читать далее

Новая модель предсказывает, как молекулы будут растворяться в разных растворителях

Используя машинное обучение, инженеры-химики из Массачусетского технологического института (MIT) создали вычислительную модель, которая может предсказать, насколько хорошо любая заданная молекула растворится в органическом растворителе. Это ключевой шаг в синтезе почти любого фармацевтического препарата. Предсказание растворимости Новая модель, которая предсказывает, сколько растворённого вещества растворится в конкретном растворителе, должна помочь химикам выбирать правильный растворитель для любой заданной … Читать далее

BlackRock представляет AlphaAgents: продвижение в построении портфелей акций с помощью совместной работы мультиагентных языковых моделей

Использование искусственного интеллекта (ИИ) на финансовых рынках стремительно развивается, и большие языковые модели (LLM) всё чаще применяются для анализа акций, управления портфелями и выбора ценных бумаг. Исследовательская группа BlackRock предложила AlphaAgents для инвестиционных исследований. Необходимость мультиагентных систем в исследованиях акций Управление портфелями акций традиционно опирается на аналитиков, которые синтезируют огромные объёмы разнообразных данных — финансовые … Читать далее

Мастерство кодирования с помощью больших языковых моделей: плюсы, минусы и лучшие практики для инженеров данных

Большие языковые модели (LLM) позволяют инженерам описывать цели конвейера на простом английском языке и получать сгенерированный код — такой рабочий процесс называют vibe coding. При правильном использовании это может ускорить создание прототипов и документацию. Однако при небрежном подходе можно столкнуться с незаметным повреждением данных, рисками для безопасности или кодом, который сложно поддерживать. В этой статье … Читать далее

Команда Qwen представляет Qwen-Image-Edit: версию Qwen-Image для редактирования изображений с расширенными возможностями семантического и внешнего редактирования

В области мультимодального искусственного интеллекта модели для редактирования изображений на основе инструкций преобразуют взаимодействие пользователей с визуальным контентом. Команда Alibaba’s Qwen выпустила Qwen-Image-Edit в августе 2025 года. Эта модель основана на Qwen-Image с 20 миллиардами параметров и предоставляет расширенные возможности редактирования. Архитектура и ключевые инновации Qwen-Image-Edit расширяет архитектуру мультимодального диффузионного трансформатора (MMDiT) Qwen-Image, которая включает … Читать далее

Создание информационных панелей с помощью Vizro MCP

Vizro — это инструмент Python с открытым исходным кодом от McKinsey, который упрощает создание красивых, готовых к использованию приложений для визуализации данных. С помощью всего нескольких строк конфигурации (через JSON, YAML или словари Python) можно создать многостраничные информационные панели, для которых обычно требуются тысячи строк кода. Vizro, созданный на основе Plotly, Dash и Pydantic, сочетает … Читать далее

Исследователи заглянули внутрь работы языковых моделей для белков

В последние несколько лет модели, которые могут предсказывать структуру или функцию белков, стали широко использоваться в различных биологических приложениях, таких как определение мишеней для лекарств и разработка новых терапевтических антител. Эти модели, основанные на больших языковых моделях (LLMs), могут делать очень точные прогнозы о пригодности белка для конкретного применения. Однако нет способа определить, как эти … Читать далее

Вопросы и ответы с главным директором по персоналу компании DoorDash — Марианой Гаравалья

Узнайте, как компания DoorDash расширяет использование искусственного интеллекта, чтобы дать сотрудникам возможность быстрее создавать, учиться и внедрять инновации. В этом разговоре участвует главный директор по персоналу Мариана Гаравалья. 1. Какие возможности искусственного интеллекта используются в компании DoorDash для развития сотрудников? Ответ: в компании DoorDash искусственный интеллект применяется для ускорения процессов создания, обучения и внедрения инноваций … Читать далее