Революция нейронных сетей в машинном обучении для классических компьютеров
Нейронные сети произвели революцию в машинном обучении для классических компьютеров: стали возможны беспилотные автомобили, языковой перевод и даже программное обеспечение для искусственного интеллекта. Поэтому неудивительно, что исследователи захотели перенести эту мощь на квантовые компьютеры — но все попытки сделать это приводили к непредвиденным проблемам.
Новый подход в Лос-Аламосской национальной лаборатории
Недавно группа учёных из Лос-Аламосской национальной лаборатории разработала новый способ применения математических концепций в квантовых компьютерах, используя так называемый гауссовский процесс.
«Наша цель в этом проекте — доказать, что существуют настоящие квантовые гауссовские процессы», — сказал Марко Серезо, ведущий учёный команды из Лос-Аламоса. «Такой результат станет толчком для инноваций и новых форм квантового машинного обучения».
Прорыв в машинном обучении
Одним из самых фундаментальных прорывов в области машинного обучения стало осознание того, что большие нейронные сети сходятся к гауссовским процессам. Нейронная сеть может содержать миллионы «нейронов», по сути, математических узлов, которые делают обоснованные предположения на основе заданной информации.
По отдельности случайные и непредвзятые, после миллионов предположений информация, обрабатываемая этими нейронами, соответствует гауссовской кривой, также называемой колоколообразной кривой, что позволяет исследователям экстраполировать среднее значение.
Применение гауссовских процессов в квантовых вычислениях
Группа из Лос-Аламоса смогла доказать, что та же гауссовская кривая применима к некоторым процессам квантовых вычислений — разработка, которая обещает значительно изменить возможности квантовых вычислений.
Команда из Лос-Аламоса описывает свои выводы в новой статье, опубликованной в журнале Nature Physics.
Проблемы параметрических моделей в квантовых вычислениях
Нейронные сети относятся к семейству «параметрических моделей», которые работают с использованием вариационных параметров, которые можно настраивать, чтобы «обучаться» самостоятельно. После успеха в классических вычислениях учёные захотели использовать нейронные сети для квантовых вычислений, что обещало повысить мощность этих машин при выполнении задач, слишком сложных для классических компьютеров.
Но после многих лет исследований команда лаборатории обнаружила, что параметрические модели в условиях квантовых вычислений создают непредвиденные проблемы, такие как бесплодные плато, которые приводят к математическим тупикам.
«Проблема с квантовыми нейронными сетями заключается в том, что мы копировали и вставляли классические нейронные сети и помещали их в квантовый компьютер», — сказал Мартин Ларокка, учёный из лаборатории, специализирующийся на квантовых алгоритмах и квантовом машинном обучении. «Это оказалось не так просто, как можно было надеяться. Поэтому мы хотели вернуться к основам и найти более простые, более ограниченные способы обучения, которые могли бы работать и имели бы определённые гарантии».
Гауссовские процессы как решение
В отличие от нейронных сетей, гауссовские процессы не являются параметрическими, и поэтому обходят многие из вышеупомянутых проблем. Но гауссовские процессы — это не универсальный инструмент: если распределение не соответствует колоколообразной кривой, прогноз может быть неточным.
Так команда использовала передовые математические инструменты, которые позволили им проверить свои расчёты, подтвердив, что новый метод является гауссовским и точным средством обработки наборов квантовых данных на квантовых компьютерах.
«Это Святой Грааль байесовского обучения», — сказал Диего Гарсия-Мартин, первый автор статьи. «Наш результат имеет конкретные практические последствия. Скажем, вам нужно предсказать цены на жильё. Вы начинаете с первоначального предположения, что цены следуют простой колоколообразной кривой — гауссовской. Так, если вы дадите мне наблюдение, например, дом и его цену, мы можем использовать этот гауссовский процесс, чтобы обновить колоколообразную кривую и найти новое и лучшее распределение цен на жильё».
«Чем больше у нас данных, тем точнее прогноз — метод, известный как байесовский вывод с помощью регрессии гауссовского процесса. Наш результат означает, что тот же принцип теперь можно применить в квантовых вычислениях», — говорится в статье.