Обзор ландшафта больших языковых моделей в Австралии: техническая оценка

Ключевые моменты

В Австралии пока не появилась собственная большая языковая модель (LLM), которая могла бы конкурировать на глобальном уровне. Австралийские исследования и бизнес в основном полагаются на международные модели LLM, которые имеют ограничения при работе с австралийским английским и культурным контекстом.

Kangaroo LLM: проект по созданию локальной модели

Kangaroo LLM — это единственный крупный проект по созданию открытой модели LLM в Австралии. При поддержке консорциума Katonic AI, RackCorp, NEXTDC, Hitachi Vantara и Hewlett Packard Enterprise он направлен на создание модели, специально адаптированной для австралийского английского. Однако проект всё ещё находится на ранних этапах сбора данных и управления, и пока не опубликованы параметры модели, эталонные показатели или информация о её внедрении в производство (по состоянию на август 2025 года).

Международные модели в Австралии

Международные модели (Claude 3.5 Sonnet, GPT-4, LLaMA 2) широко доступны в Австралии и используются в исследованиях, правительстве и промышленности. Их внедрение в австралийских условиях часто сталкивается с проблемами суверенитета данных, законов о конфиденциальности и тонкой настройки моделей.

Вклад австралийских академических исследований

Австралийские академические институты активно участвуют в исследованиях LLM, но их фокус — на оценке, справедливости, адаптации к доменам и применении, а не на создании новых масштабных фундаментальных моделей.

* UNSW’s BESSTIE Benchmark: систематическая система оценки настроений и сарказма в австралийском, британском и индийском английском. Она показывает, что глобальные модели LLM постоянно демонстрируют более низкие результаты при работе с австралийским английским, особенно в обнаружении сарказма (F-score 0,59 на Reddit по сравнению с 0,81 для настроений).
* Исследователи из Macquarie University: они настроили варианты BERT (BioBERT, ALBERT) для ответов на медицинские вопросы, достигнув высоких результатов на международных соревнованиях. Это демонстрирует силу Австралии в адаптации существующих моделей к специализированным областям, но не в разработке новых архитектур.
* CSIRO Data61: публикует влиятельные исследования по агентским системам с использованием LLM, конфиденциальному ИИ и управлению рисками моделей. Их работа практична и ориентирована на политику, а не на разработку фундаментальных моделей.
* Партнёрство Университета Аделаиды и CommBank: Центр фундаментального ИИ от CommBank, созданный в конце 2024 года, направлен на развитие машинного обучения для финансовых услуг, включая обнаружение мошенничества и персонализированное банковское обслуживание. Это значительные инвестиции в отрасль, но фокус снова на применении и тонкой настройке, а не на создании новой крупномасштабной LLM.

Политика, инвестиции и экосистема

Государственная политика:

* Австралийское правительство разработало рамочную программу политики в области ИИ, основанную на оценке рисков, с обязательной прозрачностью, тестированием и подотчётностью для приложений с высоким уровнем риска.
* Реформы законодательства о конфиденциальности в 2024 году ввели новые требования к прозрачности ИИ, что повлияло на выбор и развёртывание моделей.

Инвестиции:

* Венчурный капитал в австралийских стартапах в сфере ИИ достиг 1,3 миллиарда австралийских долларов в 2024 году, причём на ИИ приходилось почти 30% всех венчурных сделок в начале 2025 года. Однако большая часть этих инвестиций приходится на компании, работающие на уровне приложений, а не на разработку фундаментальных моделей.

Внедрение в отрасли:

* Опрос 2024 года показал, что 71% сотрудников австралийских университетов используют инструменты генеративного ИИ, в основном ChatGPT и Claude. Внедрение в корпоративном секторе растёт, но часто ограничивается требованиями суверенитета данных, соблюдением конфиденциальности и отсутствием моделей, адаптированных к местным условиям.

Вычислительная инфраструктура:

* В Австралии нет крупномасштабной суверенной вычислительной инфраструктуры для обучения LLM. Большинство крупномасштабных моделей обучения и вывода зависят от международных облачных провайдеров, хотя регион AWS в Сиднее теперь поддерживает Claude 3.5 Sonnet в масштабе.

Резюме

Ландшафт LLM в Австралии характеризуется сильными прикладными исследованиями, растущим внедрением на предприятиях и активной разработкой политики, но без суверенной крупномасштабной фундаментальной модели. Kangaroo LLM — один из немногих значительных местных проектов, но он всё ещё находится на ранних стадиях и сталкивается с серьёзными техническими и ресурсными проблемами.

Австралия — это искушённый пользователь и адаптер LLM, но пока не создатель их. Наиболее важные элементы ясны: Kangaroo LLM — это значимый шаг, но ещё не решение; глобальные модели доминируют, но имеют локальные ограничения; а австралийские исследования и политика являются мировыми лидерами в области оценки и применения, а не фундаментальных инноваций.

1. Какие проблемы существуют при использовании международных моделей LLM в Австралии?

При использовании международных моделей LLM в Австралии возникают проблемы, связанные с суверенитетом данных, законами о конфиденциальности и необходимостью тонкой настройки моделей под австралийский английский и культурный контекст.

2. Какие австралийские академические институты активно участвуют в исследованиях LLM?

Австралийские академические институты, активно участвующие в исследованиях LLM, включают UNSW (UNSW’s BESSTIE Benchmark), Macquarie University (настройка вариантов BERT для ответов на медицинские вопросы) и CSIRO Data61 (исследования по агентским системам с использованием LLM, конфиденциальному ИИ и управлению рисками моделей).

3. Какие государственные меры были предприняты в Австралии для регулирования использования ИИ?

Австралийское правительство разработало рамочную программу политики в области ИИ, основанную на оценке рисков, с обязательной прозрачностью, тестированием и подотчётностью для приложений с высоким уровнем риска. Реформы законодательства о конфиденциальности в 2024 году ввели новые требования к прозрачности ИИ.

4. Каков текущий статус проекта Kangaroo LLM в Австралии?

Проект Kangaroo LLM направлен на создание открытой модели LLM, адаптированной для австралийского английского. Однако проект всё ещё находится на ранних этапах сбора данных и управления, и пока не опубликованы параметры модели, эталонные показатели или информация о её внедрении в производство (по состоянию на август 2025 года).

5. Какие тенденции наблюдаются в сфере инвестиций в ИИ в Австралии?

Венчурный капитал в австралийских стартапах в сфере ИИ достиг 1,3 миллиарда австралийских долларов в 2024 году, причём на ИИ приходилось почти 30% всех венчурных сделок в начале 2025 года. Однако большая часть этих инвестиций приходится на компании, работающие на уровне приложений, а не на разработку фундаментальных моделей.

Источник