Google выпустила модель C2S-Scale 27B для перевода сложных данных экспрессии генов одиночных клеток в «клеточные предложения», понятные языковым моделям

Команда исследователей из Google Research, Google DeepMind и Йельского университета выпустила C2S-Scale 27B — модель фундаментального уровня с 27 миллиардами параметров для анализа одиночных клеток, построенную на Gemma-2. Модель формализует профили экспрессии одиночных клеток РНК (scRNA-seq) в виде «клеточных предложений» — упорядоченных списков символов генов — чтобы языковая модель могла изначально анализировать и рассуждать о клеточных состояниях.

Помимо улучшения показателей в бенчмарках, исследовательская группа сообщает об экспериментально подтверждённом, зависимом от контекста пути: ингибирование CK2 (силмитасертиб/CX-4945) в сочетании с низкими дозами интерферона усиливает презентацию антигенов, что может сделать «холодные» опухоли более чувствительными к иммунотерапии. В результате наблюдается увеличение презентации антигенов примерно на 50% in vitro в условиях комбинированного воздействия.

Понимание модели

C2S-Scale преобразует многомерный вектор экспрессии в текст путём ранжирования генов и выдачи топ-K символов в виде последовательности имён генов. Это представление приводит данные одиночных клеток в соответствие со стандартными инструментами LLM и позволяет формулировать такие задачи, как прогнозирование типа клеток, классификация тканей, создание заголовков кластеров, предсказание возмущений и биологический контроль качества, в виде текстовых подсказок и завершений.

Данные для обучения, стек и выпуск

C2S-Scale-Gemma-2-27B построена на Gemma-2 27B (только декодер Transformer), обучена на Google TPU v5 и выпущена под лицензией CC-BY-4.0. Обучающий корпус объединяет более 800 общедоступных наборов данных scRNA-seq, охватывающих более 57 миллионов клеток (человека и мыши) с соответствующими метаданными и текстовым контекстом; предварительное обучение объединяет транскриптомные токены и биологический текст в единый мультимодальный корпус.

Ключевой результат: интерфероновый усилитель

Исследовательская группа создала виртуальный экран с двумя контекстами для более чем 4000 препаратов, чтобы найти соединения, которые усиливают презентацию антигенов (программа MHC-I) только в условиях положительного иммунного контекста — то есть в первичных образцах пациентов с низким уровнем интерферона — при этом не оказывая существенного эффекта в данных клеточных линий с нейтральным иммунным контекстом.

Модель предсказала поразительное разделение контекстов для силмитасертиба (ингибитор CK2): сильная активация MHC-I при низких дозах интерферона, практически полное отсутствие — без интерферона. Исследовательская группа сообщает о проверке в лаборатории на моделях нейроэндокринных клеток человека, не участвовавших в обучении, где комбинация (силмитасертиб + низкие дозы интерферона) привела к заметному синергетическому увеличению презентации антигенов (≈50% в их анализах).

Усилители и ключевые выводы

C2S-Scale 27B (Gemma-2) кодирует профили scRNA-seq в виде текстовых «клеточных предложений», что позволяет LLM выполнять нативный анализ одиночных клеток. В виртуальном экране с двумя контекстами (более 4000 соединений) модель предсказала интерфероновый усилитель: ингибирование CK2 (силмитасертиб) усиливает презентацию антигенов MHC-I только в сочетании с низкими дозами IFN.

Лабораторные тесты на моделях нейроэндокринных клеток человека подтвердили предсказание, с увеличением презентации антигенов примерно на 50% для силмитасертиб+IFN по сравнению с каждым из них по отдельности; это остаётся доклиническим/ in vitro.

Qualifire AI выпускает Rogue: комплексная система тестирования агентов ИИ

Qualifire AI выпустила Rogue — комплексную систему тестирования агентов ИИ, предназначенную для оценки производительности агентов ИИ. Rogue преобразует бизнес-политики в исполняемые сценарии, управляет многоходовыми взаимодействиями с целевым агентом и выводит детерминированные отчёты, подходящие для CI/CD и проверок соответствия.

Краткое руководство

Предварительные требования

* uvx — если не установлен, следуйте руководству по установке uvx.
* Python 3.10+.
* API-ключ для поставщика LLM (например, OpenAI, Google, Anthropic).

Установка

Вариант 1: быстрая установка (рекомендуется)

Используйте наш автоматизированный скрипт установки, чтобы быстро приступить к работе:

TUI

uvx rogue-ai

Web UI

uvx rogue-ai ui

CLI / CI/CD

uvx rogue-ai cli

Вариант 2: ручная установка

(a) Клонируйте репозиторий:

git clone https://github.com/qualifire-dev/rogue.git
cd rogue

(b) Установите зависимости:

Если вы используете uv:
uv sync

Или, если вы используете pip:
pip install -e .

(c) ОПЦИОНАЛЬНО: настройте переменные среды: создайте файл .env в корневом каталоге и добавьте свои API-ключи. Rogue использует LiteLLM, поэтому вы можете установить ключи для различных поставщиков.

OPENAIAPIKEY=»sk-…»
ANTHROPICAPIKEY=»sk-…»
GOOGLEAPIKEY=»…»

Запуск Rogue

Rogue работает по архитектуре «клиент-сервер», где основная логика оценки выполняется на бэкенд-сервере, а различные клиенты подключаются к нему для разных интерфейсов.

Доступные режимы

* Default (Server + TUI): uvx rogue-ai — запускает сервер в фоновом режиме + клиент TUI.
* Server: uvx rogue-ai server — запускает только бэкенд-сервер.
* TUI: uvx rogue-ai tui — запускает только клиент TUI (требуется работающий сервер).
* Web UI: uvx rogue-ai ui — запускает только клиент веб-интерфейса Gradio (требуется работающий сервер).
* CLI: uvx rogue-ai cli — запускает неинтерактивную оценку в командной строке (требуется работающий сервер, идеально подходит для CI/CD).

Rogue помогает командам разработчиков тестировать поведение агентов так, как оно фактически работает в производственной среде. Он превращает письменные политики в конкретные сценарии, отрабатывает эти сценарии в рамках A2A и записывает, что произошло, с помощью транскриптов, которые можно проверить. В результате получается чёткий, повторяемый сигнал, который можно использовать в CI/CD для выявления нарушений политики и регрессий до их отправки.

1. Какие возможности предоставляет модель C2S-Scale 27B и как она может быть использована в научных исследованиях?

Модель C2S-Scale 27B преобразует многомерный вектор экспрессии в текст путём ранжирования генов и выдачи топ-K символов в виде последовательности имён генов. Это представление приводит данные одиночных клеток в соответствие со стандартными инструментами LLM и позволяет формулировать такие задачи, как прогнозирование типа клеток, классификация тканей, создание заголовков кластеров, предсказание возмущений и биологический контроль качества, в виде текстовых подсказок и завершений.

2. Какие данные использовались для обучения модели C2S-Scale 27B и какие результаты были получены?

C2S-Scale-Gemma-2-27B построена на Gemma-2 27B (только декодер Transformer), обучена на Google TPU v5 и выпущена под лицензией CC-BY-4.0. Обучающий корпус объединяет более 800 общедоступных наборов данных scRNA-seq, охватывающих более 57 миллионов клеток (человека и мыши) с соответствующими метаданными и текстовым контекстом.

3. Какие ключевые результаты были получены исследовательской группой при использовании модели C2S-Scale 27B?

Исследовательская группа создала виртуальный экран с двумя контекстами для более чем 4000 препаратов, чтобы найти соединения, которые усиливают презентацию антигенов (программа MHC-I) только в условиях положительного иммунного контекста — то есть в первичных образцах пациентов с низким уровнем интерферона — при этом не оказывая существенного эффекта в данных клеточных линий с нейтральным иммунным контекстом. Модель предсказала поразительное разделение контекстов для силмитасертиба (ингибитор CK2): сильная активация MHC-I при низких дозах интерферона, практически полное отсутствие — без интерферона.

4. Какие преимущества предоставляет система тестирования агентов ИИ Rogue, разработанная Qualifire AI?

Rogue преобразует бизнес-политики в исполняемые сценарии, управляет многоходовыми взаимодействиями с целевым агентом и выводит детерминированные отчёты, подходящие для CI/CD и проверок соответствия. Rogue помогает командам разработчиков тестировать поведение агентов так, как оно фактически работает в производственной среде. Он превращает письменные политики в конкретные сценарии, отрабатывает эти сценарии в рамках A2A и записывает, что произошло, с помощью транскриптов, которые можно проверить. В результате получается чёткий, повторяемый сигнал, который можно использовать в CI/CD для выявления нарушений политики и регрессий до их отправки.

5. Какие предварительные требования необходимы для установки системы Rogue?

Для установки системы Rogue необходимы следующие предварительные требования:
* uvx — если не установлен, следуйте руководству по установке uvx.
* Python 3.10+.
* API-ключ для поставщика LLM (например, OpenAI, Google, Anthropic).

Источник