Метка: Оценка AI моделей

  • Evals API от OpenAI: как автоматизировать оценку больших языковых моделей

    Компания OpenAI сделала значительный шаг, чтобы помочь разработчикам и командам, работающим с большими языковыми моделями (LLM), представив **Evals API** — новый набор инструментов, который выводит возможности программной оценки на передний план. Ранее оценка была доступна через панель управления OpenAI, но новый API позволяет разработчикам определять тесты, автоматизировать выполнение оценок и работать с подсказками непосредственно в…

  • AI модели Meta: Обманчивый триумф Maverick?

    Недавний выпуск новых **AI моделей Meta** привлек значительное внимание в технологическом сообществе. Однако опубликованные компанией тесты производительности, особенно для одной из флагманских моделей под названием Maverick, вызывают некоторые вопросы и могут быть не совсем точными. Хотя Maverick заняла впечатляющее второе место в рейтинге LM Arena, где реальные пользователи сравнивают ответы разных ИИ и выбирают лучший,…