StepFun AI представляет Step-DeepResearch: модель агента для глубоких исследований, построенная на основе атомарных возможностей

StepFun представила Step-DeepResearch — модель агента для глубоких исследований с 32 миллиардами параметров, которая превращает веб-поиск в настоящие исследовательские рабочие процессы с долгосрочным анализом, использованием инструментов и структурированным отчётом. Модель построена на Qwen2.5 32B-Base и обучена действовать как единый агент, который планирует, исследует источники, проверяет доказательства и пишет отчёты со ссылками, сохраняя при этом низкую … Читать далее

Автоматизация обеспечения качества LLM с помощью DeepEval, пользовательских поисковиков и метрик LLM-как-судья

Настройка высокопроизводительной среды оценки В этом руководстве мы создаём высокопроизводительную среду оценки, ориентированную на интеграцию фреймворка DeepEval для повышения точности модульного тестирования наших приложений LLM. Мы устраняем разрыв между исходным поиском и окончательным генерированием, внедряя систему, которая рассматривает выходные данные модели как тестируемый код и использует метрики LLM-как-судья для количественной оценки производительности. Импорт необходимых библиотек … Читать далее

«Ходячие акулы» откладывают яйца без особых затрат энергии

«Ходячие акулы» откладывают яйца без особого труда. Беременность и роды — это тяжёлая работа для любого вида, но акулы-эполеты (Hemiscyllium ocellatum) могут с этим не согласиться. Эти рыбы, а также ряд других видов известны как «ходящие акулы» за свою способность перемещаться как по морскому дну, так и по суше с помощью плавников. Но на данный … Читать далее

Наблюдение за альбатросами на атолле Мидуэй

Занесло снегом? Посмотрите, как альбатросы гнездятся на солнечном острове в Тихом океане. Пока в необычно большой полосе Соединённых Штатов бушует зима, для птиц, гнездящихся на атолле Мидуэй в Тихом океане, погода мягкая. До 75 000 пар альбатросов острова Лайсан (или mōlī на гавайском языке) гнездятся в заповеднике на северо-западном краю Гавайского архипелага. Теперь вы можете … Читать далее

Достигнуто ли квантовое преимущество? Часть 2: рассмотрение доказательств

Аргументы и доказательства в пользу квантового преимущества Добро пожаловать в часть 2 мини-серии о демонстрации квантового преимущества. В первой части я рассказал вам об идее случайной выборки схем (RCS) и её экспериментальной реализации. В этом посте я обсужу аргументы и доказательства, почему я убеждён, что эксперименты демонстрируют квантовое преимущество. Проверка экспериментальных утверждений о квантовом преимуществе … Читать далее

Стоит ли есть инвазивные виды? Мнение эколога

Стоит ли есть инвазивные виды? Мы спросили эколога. По определению, инвазивные виды в чём-то вредны, — говорит Джейкоб Барни, профессор экологии инвазивных растений в Технологическом университете Вирджинии. — Поэтому, когда мы их едим, мы превращаем этот вред в нечто положительное». Хотя польза от употребления инвазивных видов может быть разной. Куда бы ни отправились люди, они … Читать далее

Как остановить надоедливые спам-звонки

Как остановить надоедливые спам-звонки Спам-звонки — это проблема, которая отнимает ваше время и угрожает вашей конфиденциальности и безопасности. К сожалению, они могут быть очень эффективными и прибыльными для мошенников, поэтому такие нежелательные звонки продолжаются. Вы можете бороться со спамом с помощью технологий. Apple и Google разработали специальные антиспам-функции. Включите некоторые из этих настроек и функций, … Читать далее

Сбивающая с толку медуза с голубой пуговицей: что это такое?

Сбивающая с толку медуза с голубой пуговицей выглядит как что-то из «Властелина колец». На первый взгляд, она похожа на инопланетный глаз — великолепная голубая радужка вокруг зрачка цвета карамели, густые ресницы, расходящиеся, как солнечные лучи. Красновато-оранжевый центр немного напоминает «Глаз Саурона», но мы не в Мордоре. Мы на поверхности океана, где плавает загадочный родственник медузы, … Читать далее

Экспериментальный ИИ, который думает, что сейчас 1800-е годы

Этот ИИ думает, что сейчас 1800-е годы. Интересная особенность современных моделей искусственного интеллекта, особенно больших языковых моделей (LLM): они могут генерировать текст только на основе того, что есть в их обучающем наборе данных. Модели, включая ChatGPT и Claude, «обучены» на больших базах текстовых данных. Когда модели задают вопрос, они статистически создают ответ, пословно вычисляя наиболее … Читать далее

Как машинное обучение и семантические встраивания меняют приоритеты уязвимостей CVE, выходя за рамки статических оценок CVSS

В этом руководстве мы создаём сканер уязвимостей с помощью ИИ, который не ограничивается статическими оценками CVSS, а учится расставлять приоритеты уязвимостей, используя семантическое понимание и машинное обучение. Основные этапы работы сканера: 1. Извлечение данных: мы извлекаем описания уязвимостей из Национального института стандартов и технологий (NVD API).2. Семантическое встраивание: описания уязвимостей обрабатываются с помощью современных трансформеров … Читать далее

GitHub выпускает Copilot-SDK для встраивания агентной среды выполнения в любое приложение

GitHub открыл агентную среду выполнения, которая лежит в основе GitHub Copilot CLI, и представил её в виде программируемого SDK. GitHub Copilot-SDK, представленный пока в техническом предварительном просмотре, позволяет встраивать агентный цикл выполнения в любое приложение, чтобы агент мог планировать, вызывать инструменты, редактировать файлы и выполнять команды в рамках ваших собственных рабочих процессов. Что предоставляет GitHub … Читать далее

Как агент ИИ выбирает, что делать при ограничениях на токены, задержку и бюджет инструментальных вызовов?

В этом руководстве мы создаём агента планирования, учитывающего затраты, который осознанно балансирует качество выходных данных с реальными ограничениями, такими как использование токенов, задержка и бюджет инструментальных вызовов. Агент генерирует несколько вариантов действий, оценивает их ожидаемые затраты и выгоды, а затем выбирает план выполнения, который максимизирует ценность, оставаясь в рамках строгих бюджетов. Этапы создания агента 1. … Читать далее

Робот, вдохновлённый скатом, раскрывает тайну их плавания

Робот, вдохновлённый скатом, раскрывает тайну того, как скаты плавают. Чтобы выяснить, что делает скатов такими уникальными и необычными пловцами, команда инженеров-механиков из Калифорнийского университета в Риверсайде (UCR) создала волнистый роботизированный плавник. После погружения робота в подводные туннели, предназначенные для имитации плавания у морского дна, их испытания показывают, что у разных видов скатов могли развиться альтернативные … Читать далее

Комета Галлея: возможно, ей нужно новое, средневековое название

Комета Галлея может получить новое, средневековое название. Одной из самых узнаваемых комет в астрономии может потребоваться ребрендинг. Но даже если все продолжат называть знаменитый космический камень кометой Галлея, некоторые исследователи считают, что эксцентричный монах XI века заслуживает хотя бы некоторой признательности. Согласно обзору исторических материалов, включая знаменитый гобелен из Байё, группа учёных из Лейденского университета … Читать далее

Разворачивание цикла работы агента Codex.

Техническое погружение в цикл работы агента Codex, объясняющее, как Codex CLI управляет моделями, инструментами, запросами и производительностью с помощью API ответов. 1. Какие основные компоненты включает в себя цикл работы агента Codex и как они взаимодействуют между собой? В тексте указано, что цикл работы агента Codex включает управление моделями, инструментами, запросами и производительностью с помощью … Читать далее

Забытая средневековая книга Ричарда Ролла найдена в школьной библиотеке

Забытая, бесценная средневековая книга обнаружена в школьной библиотеке. На протяжении поколений неверно идентифицированная средневековая рукопись была спрятана в библиотеке английской школы-интерната, основанной в 1552 году. После тщательного нового анализа исследователь средневековой литературы может подтвердить, что рукопись на самом деле является старейшим и единственным известным изданием «Исправления жизни» (Emendatio vitae) Ричарда Ролла, написанным на оригинальной латыни. … Читать далее

Страх управляет принятием решений

Это не у вас в голове. Страх управляет принятием решений. Мы все грешны тем, что откладываем важные решения, потому что наш мозг не может перестать фокусироваться на потенциальных негативных исходах. Страх формирует наше принятие решений, и новое исследование, опубликованное в журнале Cognitive Science, изучает, почему обдумывание негативных сценариев влияет на нас сильнее, чем возможные положительные … Читать далее

Снижение потребления ультрапереработанных продуктов способствует здоровому старению

Снижение потребления ультрапереработанных продуктов способствует здоровому старению, показывают новые исследования. Эта статья изначально была опубликована на The Conversation. Пожилые люди могут значительно сократить количество потребляемых ультрапереработанных продуктов, сохраняя при этом привычную сбалансированную диету — и такой переход приводит к улучшению ряда ключевых показателей, связанных с регуляцией аппетита и метаболизма в организме. Это основной вывод нового … Читать далее

Рубрики Без рубрики

Социальный джетлаг: как он влияет на ваш сон и здоровье

Устали? Возможно, у вас социальный джетлаг… За несколько часов до рассвета самые ранние жаворонки начинают свой день. Рассказы о том, как Тим Кук из Apple проверяет электронную почту в 3:45 утра, как писательница Барбара Кингсолвер яростно пишет в 4 утра, а Мишель Обама начинает тренировку в спортзале в 4:30 утра, возглавляют утренние заголовки. Ранние пташки … Читать далее

Исследователи Qwen выпустили Qwen3-TTS: открытую мультилингвальную систему синтеза речи с задержкой в реальном времени и детализированным голосовым контролем

Команда Qwen из Alibaba Cloud выпустила в открытый доступ Qwen3-TTS — семейство мультилингвальных моделей синтеза речи, предназначенных для решения трёх основных задач в одном стеке: клонирования голоса, голосового дизайна и генерации высококачественной речи. Семейство моделей и возможности Qwen3-TTS использует 12 Гц-ный токенизатор речи и две модели языка размером 0,6B и 1,7B, объединённые в три основные … Читать далее

Краудсорсинговый сборник констант для оптимизации?

Сайт Томаса Блума с задачами Эрдаша в последнее время стал настоящим центром активности, особенно после того, как некоторые из наиболее простых нерешённых задач оказались поддающимися различным подходам с использованием искусственного интеллекта. Сейчас там существует активное сообщество, в котором представлены, обсуждаются и в некоторых случаях одобряются для обновления сайта вклады людей, ИИ и гибридные вклады. Это … Читать далее

Microsoft выпустила VibeVoice-ASR: унифицированную модель преобразования речи в текст для работы с аудиозаписями длительностью до 60 минут

Компания Microsoft выпустила модель VibeVoice-ASR в рамках семейства моделей голосового искусственного интеллекта с открытым исходным кодом VibeVoice. VibeVoice-ASR представляет собой унифицированную модель преобразования речи в текст, которая может обрабатывать аудиозаписи длительностью до 60 минут за один проход и выдавать структурированные транскрипции, кодирующие информацию о том, кто, когда и что сказал, с поддержкой настраиваемых ключевых слов. … Читать далее

550-фунтовые кенгуру ледникового периода всё ещё могли прыгать

550-фунтовые кенгуру ледникового периода всё ещё могли прыгать. Кенгуру, вероятно, прыгали по планете гораздо дольше, чем считали эксперты ранее. Мало того, предки современных сумчатых совершали прыжки, будучи гораздо крупнее своих потомков. На протяжении тысячелетий самым крупным прыгучим животным планеты оставался австралийский рыжий кенгуру (Osphranter rufus). Рост самца «Большого рыжего» легко превышает пять футов, он весит … Читать далее

Прибрежные куницы восстанавливают численность в Калифорнии

Милые куницы размером с хорька восстанавливают численность в Калифорнии. Вполне понятно, если вы никогда не слышали о прибрежной кунице. Эти скрытные, но милые плотоядные обитатели лесов чуть не вымерли. К счастью, эти млекопитающие размером с хорька медленно восстанавливают численность в лесах Тихоокеанского Северо-Запада. Прибрежные куницы (Martes caurina humboldtensis или куница Гумбольдта) относятся к таким животным, … Читать далее

Масштабирование PostgreSQL для обслуживания 800 миллионов пользователей ChatGPT.

Подробное рассмотрение того, как OpenAI масштабировала PostgreSQL до миллионов запросов в секунду, используя реплики, кэширование, ограничение скорости и изоляцию рабочих нагрузок. 1. Какие методы масштабирования PostgreSQL использовала компания OpenAI для обслуживания миллионов пользователей ChatGPT? Ответ: OpenAI использовала несколько методов масштабирования PostgreSQL, включая использование реплик, кэширование, ограничение скорости и изоляцию рабочих нагрузок. 2. Какие преимущества даёт … Читать далее

Размер пениса: почему это имеет большее значение для мужчин

Размер пениса может иметь большее значение для мужчин, чем для женщин. История человечества полна юношеских шуток, странных стереотипов и откровенно вредной дезинформации о размере мужского пениса. Но суть реальной науки, стоящей за этим вопросом, говорит о том, что мужчины сами, скорее, чем женщины, будут волноваться по этому поводу. Согласно исследованию, опубликованному сегодня в журнале PLOS … Читать далее

Космический телескоп Джеймса Уэбба раскрывает тайну кометных кристаллов

Космический телескоп Джеймса Уэбба раскрывает тайну кометных кристаллов. Некоторые из наиболее удалённых комет Солнечной системы могут вызывать недоумение. Многие из них содержат кристаллические силикаты, которые образуются только после воздействия высоких температур, что не имеет особого смысла для астрономов. Эти кометы большую часть времени проводят в чрезвычайно холодном Облаке Оорта и поясе Койпера, при температурах, в … Читать далее

Как мы проверяем и одобряем игры на Coolmath Games

Этапы проверки игр 1. Техническая проверка: — Оценка соответствия игры техническим требованиям платформы. — Проверка на наличие ошибок и сбоев. 2. Образовательная ценность: — Анализ обучающего потенциала игры. — Соответствие образовательным стандартам и целям. 3. Возрастная адекватность: — Проверка на соответствие возрастной категории. — Отсутствие контента, не предназначенного для детей. 4. Безопасность: — Анализ на … Читать далее

Снег на самом деле не белый

Снег на самом деле не белый. Когда кто-то говорит «белый как снег», легко представить, о чём идёт речь. Мы часто думаем о снеге как о ослепительно белом, точно так же, как мы сразу вызываем в воображении цвет, когда кто-то говорит «кроваво-красный» или «лазурно-синий». Но вот в чём дело: на самом деле снег не белый. Это … Читать далее