Фотонный процессор может упростить обработку беспроводных сигналов 6G

С ростом числа подключённых устройств, которым требуется всё больше пропускной способности для таких задач, как телеработа и облачные вычисления, становится чрезвычайно сложно управлять ограниченным объёмом беспроводного спектра, доступного для всех пользователей.

Инженеры используют искусственный интеллект для динамического управления доступным беспроводным спектром, чтобы сократить задержки и повысить производительность. Однако большинство методов искусственного интеллекта для классификации и обработки беспроводных сигналов требуют много энергии и не могут работать в режиме реального времени.

Теперь исследователи MIT разработали новый аппаратный ускоритель искусственного интеллекта, специально предназначенный для обработки беспроводных сигналов. Их оптический процессор выполняет вычисления машинного обучения со скоростью света, классифицируя беспроводные сигналы за наносекунды.

Фотонный чип примерно в 100 раз быстрее, чем лучшая цифровая альтернатива, при этом достигая точности классификации сигналов около 95%. Новый аппаратный ускоритель также масштабируем и гибок, поэтому его можно использовать для различных высокопроизводительных вычислительных приложений. В то же время он меньше, легче, дешевле и энергоэффективнее, чем цифровые аппаратные ускорители искусственного интеллекта.

Устройство может быть особенно полезно в будущих приложениях беспроводной связи 6G, таких как когнитивные радио, которые оптимизируют скорость передачи данных, адаптируя форматы беспроводной модуляции к изменяющейся беспроводной среде.

Позволяя периферийным устройствам выполнять вычисления глубокого обучения в режиме реального времени, этот новый аппаратный ускоритель может обеспечить значительное ускорение во многих приложениях, помимо обработки сигналов. Например, он может помочь автономным транспортным средствам мгновенно реагировать на изменения окружающей среды или позволить интеллектуальным кардиостимуляторам непрерывно контролировать состояние сердца пациента.

«Существует множество приложений, для которых потребуются периферийные устройства, способные анализировать беспроводные сигналы. То, что мы представили в нашей статье, может открыть множество возможностей для реального времени и надёжного вывода искусственного интеллекта. Эта работа — начало чего-то, что может иметь большое значение», — говорит Дирк Энглунд, профессор кафедры электротехники и компьютерных наук MIT, главный исследователь в группе квантовой фотоники и искусственного интеллекта и в Исследовательской лаборатории электроники (RLE), а также старший автор статьи.

Светоскоростная обработка

Современные цифровые ускорители искусственного интеллекта для обработки беспроводных сигналов преобразуют сигнал в изображение и пропускают его через модель глубокого обучения для классификации. Хотя этот подход отличается высокой точностью, вычислительно ёмкие глубокие нейронные сети делают его непригодным для многих приложений, чувствительных ко времени.

Оптические системы могут ускорить работу глубоких нейронных сетей, кодируя и обрабатывая данные с помощью света, что также менее энергозатратно, чем цифровые вычисления. Но исследователи пытались максимизировать производительность оптических нейронных сетей общего назначения при использовании для обработки сигналов, обеспечивая при этом масштабируемость оптического устройства.

Разработав архитектуру оптической нейронной сети специально для обработки сигналов, которую они называют мультипликативной аналоговой частотной трансформацией оптической нейронной сети (MAFT-ONN), исследователи решили эту проблему.

MAFT-ONN решает проблему масштабируемости, кодируя все данные сигнала и выполняя все операции машинного обучения в так называемой частотной области — до того, как беспроводные сигналы будут оцифрованы.

Исследователи разработали свою оптическую нейронную сеть для выполнения всех линейных и нелинейных операций последовательно. Оба типа операций необходимы для глубокого обучения.

Благодаря такой инновационной конструкции им нужно всего одно устройство MAFT-ONN на слой для всей оптической нейронной сети, в отличие от других методов, которым требуется одно устройство для каждой отдельной вычислительной единицы или «нейрона».

«Мы можем разместить 10 000 нейронов на одном устройстве и выполнить необходимые умножения за один раз», — говорит Дэвис.

Исследователи достигают этого с помощью техники, называемой фотоэлектрическим умножением, которая значительно повышает эффективность. Это также позволяет им создать оптическую нейронную сеть, которую можно легко масштабировать с помощью дополнительных слоёв без дополнительных затрат.

Результаты за наносекунды

MAFT-ONN принимает беспроводной сигнал на входе, обрабатывает данные сигнала и передаёт информацию для последующих операций, которые выполняет периферийное устройство. Например, классифицируя модуляцию сигнала, MAFT-ONN позволит устройству автоматически определять тип сигнала для извлечения данных, которые он несёт.

Одной из самых больших проблем, с которыми столкнулись исследователи при разработке MAFT-ONN, было определение того, как сопоставить вычисления машинного обучения с оптическим оборудованием.

«Мы не могли просто взять обычный фреймворк машинного обучения с полки и использовать его. Нам пришлось настроить его под оборудование и выяснить, как использовать физику, чтобы он выполнял нужные нам вычисления», — говорит Дэвис.

Когда они протестировали свою архитектуру на классификации сигналов в симуляциях, оптическая нейронная сеть достигла 85% точности за один проход, которая может быстро сходиться к более чем 99% точности при использовании нескольких измерений. MAFT-ONN потребовалось всего около 120 наносекунд для выполнения всего процесса.

«Чем дольше вы измеряете, тем выше будет точность. Поскольку MAFT-ONN выполняет вычисления за наносекунды, вы не теряете много скорости, чтобы получить больше точности», — добавляет Дэвис.

В то время как современные цифровые радиочастотные устройства могут выполнять машинное обучение за микросекунды, оптика может делать это за наносекунды или даже пикосекунды.

В дальнейшем исследователи хотят использовать так называемые схемы мультиплексирования, чтобы выполнять больше вычислений и масштабировать MAFT-ONN. Они также хотят распространить свою работу на более сложные архитектуры глубокого обучения, которые могут запускать модели-трансформеры или LLM.

Эта работа была частично профинансирована Исследовательской лабораторией Армии США, ВВС США, MIT Lincoln Laboratory, Nippon Telegraph and Telephone и Национальным научным фондом.

Источник

Оставьте комментарий