Метка: LLM

  • Расширение контекста в больших языковых моделях: инновационный подход к обработке сверхдлинных последовательностей

    Большие языковые модели (LLM) продемонстрировали впечатляющие результаты в решении разнообразных текстовых и мультимодальных задач. Однако многие приложения, такие как понимание документов и видео, обучение в контексте и масштабирование в процессе вывода, требуют способности обрабатывать и анализировать длинные последовательности токенов. Ограниченный контекстный окно LLM создаёт значительные трудности в этих ситуациях, поскольку важная информация, распределённая по обширным…

  • OLMoTrace: новый инструмент для повышения прозрачности больших языковых моделей

    ### Понимание пределов прозрачности больших языковых моделей По мере того как большие языковые модели (LLM) становятся основой для всё большего числа приложений — от поддержки принятия решений в бизнесе до образования и научных исследований — возрастает необходимость понимания их внутреннего механизма принятия решений. Основная проблема остаётся прежней: как определить, откуда берётся ответ модели? Большинство LLM…

  • NVIDIA Llama-3.1-Nemotron-Ultra-253B-v1: революция в эффективности искусственного интеллекта

    С ростом использования искусственного интеллекта в цифровой инфраструктуре предприятия и разработчики сталкиваются с возрастающим давлением, необходимостью балансировать вычислительные затраты с производительностью, масштабируемостью и адаптивностью. Быстрый прогресс в области больших языковых моделей (LLM) открыл новые горизонты в понимании естественного языка, рассуждении и диалоговом искусственном интеллекте. Однако их размер и сложность часто приводят к неэффективности, которая препятствует…

  • RoR-Bench: как новый тест выявляет ограничения больших языковых моделей в логическом мышлении

    В последние годы стремительный прогресс больших языковых моделей (LLM) создаёт впечатление, что мы близки к созданию искусственного общего интеллекта (ИОИ). Модели кажутся способными решать всё более сложные задачи. Однако остаётся фундаментальный вопрос: действительно ли LLM рассуждают как люди или просто повторяют шаблоны, выученные во время обучения? С момента выпуска таких моделей, как GPT-3 и ChatGPT,…

  • Evals API от OpenAI: как автоматизировать оценку больших языковых моделей

    Компания OpenAI сделала значительный шаг, чтобы помочь разработчикам и командам, работающим с большими языковыми моделями (LLM), представив **Evals API** — новый набор инструментов, который выводит возможности программной оценки на передний план. Ранее оценка была доступна через панель управления OpenAI, но новый API позволяет разработчикам определять тесты, автоматизировать выполнение оценок и работать с подсказками непосредственно в…