Институт Аллена для искусственного интеллекта (AI2) представляет Olmo 3: семейство больших языковых моделей с 7 и 32 миллиардами параметров
Институт Аллена для искусственного интеллекта (AI2) выпускает Olmo 3 в качестве полностью открытой модели, которая раскрывает весь «поток модели» — от необработанных данных и кода до промежуточных контрольных точек и вариантов, готовых к развёртыванию. Olmo 3 — это набор плотных трансформеров с моделями на 7 миллиардов и 32 миллиарда параметров. В семейство входят Olmo 3-Base, … Читать далее