Революция нейронных сетей в машинном обучении для классических компьютеров
Нейронные сети произвели переворот в машинном обучении для классических компьютеров: стали возможными беспилотные автомобили, языковой перевод и даже программное обеспечение для искусственного интеллекта. Поэтому неудивительно, что исследователи захотели перенести эту мощь на квантовые компьютеры — но все попытки приводили к непредвиденным проблемам.
Новый путь для квантовых компьютеров
Недавно команда из Национальной лаборатории Лос-Аламос разработала новый способ применения математических концепций в квантовых компьютерах, используя так называемый гауссовский процесс.
«Наша цель в этом проекте — доказать существование настоящих квантовых гауссовских процессов», — сказал Марко Серезо, ведущий учёный команды из Лос-Аламос. «Такой результат станет стимулом для инноваций и новых форм квантового машинного обучения».
Прорыв в машинном обучении
Один из фундаментальных прорывов в области машинного обучения произошёл после осознания того, что большие нейронные сети сходятся к гауссовским процессам. Нейронная сеть может содержать миллионы «нейронов», по сути, математических узлов, которые делают обоснованные предположения на основе предоставленной информации.
Хотя по отдельности эти предположения случайны и непредвзяты, после миллионов предположений информация, обрабатываемая нейронами, соответствует гауссовской кривой, также называемой колоколообразной кривой, что позволяет исследователям экстраполировать среднее значение.
Применение гауссовских процессов в квантовых вычислениях
По сути, команда смогла доказать, что та же гауссовская кривая применима к некоторым процессам квантовых вычислений — разработка, которая обещает значительно изменить возможности квантовых вычислений.
Команда из Лос-Аламос описывает свои выводы в новой статье, опубликованной в журнале Nature Physics.
Проблемы параметрических моделей в квантовых вычислениях
Нейронные сети относятся к семейству «параметрических моделей», которые работают с вариационными параметрами, которые можно настроить, чтобы «научиться» самостоятельно. После успеха в классических вычислениях учёные захотели использовать нейронные сети для квантовых вычислений, что обещало повысить мощность этих машин при выполнении задач, слишком сложных для классических компьютеров.
Но после многих лет исследований команда лаборатории обнаружила, что параметрические модели в условиях квантовых вычислений создают непредвиденные проблемы, такие как бесплодные плато, которые приводят к математическим тупикам.
«Проблема с квантовыми нейронными сетями заключается в том, что мы копировали и вставляли классические нейронные сети и помещали их в квантовый компьютер», — сказал Мартин Ларокка, учёный из лаборатории, специализирующийся на квантовых алгоритмах и квантовом машинном обучении. «Это оказалось не так просто, как можно было надеяться. Поэтому мы хотели вернуться к основам и найти более простые, более ограниченные способы обучения, которые могли бы работать и иметь определённые гарантии».
Гауссовские процессы как решение
В отличие от нейронных сетей, гауссовские процессы не являются параметрическими и поэтому обходят многие из вышеупомянутых проблем. Но гауссовские процессы — это не универсальный инструмент: если распределение не соответствует колоколообразной кривой, результирующий прогноз может быть неточным. Поэтому команда использовала передовые математические инструменты, которые позволили им проверить свои расчёты, подтвердив, что новый метод является гауссовским и подходящим, точным средством обработки наборов квантовых данных на квантовых компьютерах.
«Это Святой Грааль байесовского обучения», — сказал Диего Гарсия-Мартин, первый автор статьи. «Наш результат имеет не только математическую любопытность, но и конкретные практические последствия. Скажем, вам нужно предсказать цены на жильё. Вы начинаете с первоначального предположения, что цены следуют простой колоколообразной кривой — гауссовской. Так что, если вы дадите мне наблюдение, например, дом и его цену, мы можем использовать этот гауссовский процесс для обновления колоколообразной кривой и найти новое и лучшее распределение цен на жильё».
«Чем больше у нас данных, тем точнее прогноз — метод, известный как байесовский вывод с помощью гауссовской регрессии. Наш результат подразумевает, что тот же принцип теперь можно применить в квантовых вычислениях».
Перспективы квантового машинного обучения
Репликация мощности нейронных сетей на квантовых компьютерах была давней целью в этой области, и эта статья знаменует собой годы работы команды и первое математическое доказательство этой возможности.
Поскольку квантовые компьютеры всё ещё находятся в стадии становления, эта работа — и большая часть исследований, проводимых в области моделей квантового машинного обучения — носит теоретический характер. Это необходимо для того, чтобы, когда мощные квантовые компьютеры будут наконец разработаны, у исследователей были столь же мощные модели машинного обучения для решения некоторых из наиболее сложных, в противном случае неразрешимых проблем в мире.
В рамках более масштабной работы эта статья указывает на новое направление, которое команда хотела бы видеть в квантовом сообществе — что, по сути, исследователи должны перестать пытаться заставить модели, разработанные для классических вычислений, вписаться в сферу квантового машинного обучения.
«Это то, к чему мы стремились», — сказал Серезо. «Нам нужно найти новые способы квантового машинного обучения, а не продолжать, как говорится, бить дохлую лошадь, переработав старые методы».
Предоставлено Национальной лабораторией Лос-Аламос.