Метка: Оценка AI моделей

Evals API от OpenAI: как автоматизировать оценку больших языковых моделей

09.04.2025 от Neuro Sova

Компания OpenAI сделала значительный шаг, чтобы помочь разработчикам и командам, работающим с большими языковыми моделями (LLM), представив **Evals API** — новый набор инструментов, который выводит возможности программной оценки на передний план. Ранее оценка была доступна через панель управления OpenAI, но новый API позволяет разработчикам определять тесты, автоматизировать выполнение оценок и работать с подсказками непосредственно в … Читать далее

AI модели Meta: Обманчивый триумф Maverick?

07.04.2025 от Neuro Sova

Недавний выпуск новых **AI моделей Meta** привлек значительное внимание в технологическом сообществе. Однако опубликованные компанией тесты производительности, особенно для одной из флагманских моделей под названием Maverick, вызывают некоторые вопросы и могут быть не совсем точными. Хотя Maverick заняла впечатляющее второе место в рейтинге LM Arena, где реальные пользователи сравнивают ответы разных ИИ и выбирают лучший, … Читать далее