🔍 Исследования Сары Алнегеймиш лежат на стыке машинного обучения и системной инженерии. Её цель? ♻️ Сделать ML-системы доступнее, прозрачнее и надёжнее для всех!
👩💻 Сара — PhD-студентка в группе Data-to-AI Лаборатории информационных систем MIT (LIDS), где работает под руководством Каляна Вирамачанени. Здесь она посвящает силы разработке Orion — 🔓 open-source фреймворка с библиотекой для анализа временных рядов. Проект позволяет находить аномалии в данных без контроля человека, даже в сложных промышленных системах.
—
🌱 Ранние влияния
Дочь профессора и педагога, Сара с детства знала: знания должны быть доступны всем. 🏡 «Образование в нашей семье ценилось высоко — поэтому я хочу, чтобы инструменты машинного обучения стали проще», — говорит она. Собственный опыт с открытыми ресурсами (вроде MIT OpenCourseWare) убедил её: 📢 «Доступность — ключ к внедрению инноваций. Без неё технологии не смогут менять мир».
🎓 Окончив Университет Короля Сауда (первый выпуск программы CS!), она присоединилась к национальной лаборатории KACST. Через коллаборацию с MIT начала исследования под началом Вирамачанени — и позже выбрала его команду для аспирантуры.
—
🛠️ Создание Orion
В магистратуре Сара сосредоточилась на обнаружении аномалий во временных рядах — например, в сетевом трафике (киберугрозы 🛡️), показаниях датчиков (предупреждение поломок ⚙️) или данных пациентов (здоровье 🩺). Так родился Orion:
- 📊 Библиотека объединяет статистические и ML-модели с открытым кодом.
- 👩🚀 Не требует экспертизы в ML: пользователи анализируют данные, сравнивают методы, исследуют аномалии.
- 🔍 Прозрачность: каждый шаг модели объяснён. «Мы показываем, как всё работает. Это укрепляет доверие», — подчёркивает Сара.
🌟 Сегодня Orion скачали 120 000+ раз, а тысячи пользователей добавили его в избранное на GitHub. «Раньше успех измеряли цитированиями, а теперь — реальным влиянием через open-source!»
—
💡 Инновации в PhD
Сейчас Сара исследует, как использовать предобученные модели для поиска аномалий. 🧠 «Раньше модели обучали с нуля, но это дорого. Сейчас мы перепрофилируем готовые решения с помощью prompt-инжиниринга», — объясняет она. Пока точность ниже кастомных моделей, но прогресс неизбежен!
—
📚 Доступность как философия
«Раньше я думала, что главное — улучшить модель. Но осознала: важны системы, которые делают её доступной», — говорит Сара. Её команда создала универсальные абстракции для моделей:
- 🧩 Стандартизированные входы/выходы, гибкая «середина».
- 🤖 Даже LLM-агенты (вроде ChatGPT) могут подключаться к Orion через простые команды: Fit (обучение) и Detect (поиск аномалий).
💬 «Цель — чтобы ИИ стал ближе к людям. Orion доказал: открытый код — самый быстрый путь к изменениям!»