Системы автоматизированного проектирования (САПР) — проверенные инструменты, которые используются для проектирования многих физических объектов, которыми мы пользуемся каждый день. Однако для освоения САПР требуется обширный опыт, а многие инструменты включают такой высокий уровень детализации, что не подходят для мозгового штурма или быстрого создания прототипов.
Роботы-сборщики по словесному описанию
Чтобы ускорить и упростить проектирование для неспециалистов, исследователи из Массачусетского технологического института (MIT) и других организаций разработали роботизированную систему сборки на основе искусственного интеллекта (ИИ), которая позволяет людям создавать физические объекты, просто описывая их словами.
Их система использует генеративную модель ИИ для создания трёхмерного представления геометрии объекта на основе запроса пользователя. Затем вторая генеративная модель ИИ анализирует желаемый объект и определяет, где должны располагаться различные компоненты, в зависимости от функции и геометрии объекта.
Система может автоматически собирать объект из набора готовых деталей с помощью роботизированной сборки. Она также может вносить изменения в проект на основе обратной связи от пользователя.
Исследователи использовали эту систему «от начала до конца» для изготовления мебели, включая стулья и полки, из двух типов готовых компонентов. Компоненты можно разбирать и собирать заново по желанию, что сокращает количество отходов, образующихся в процессе изготовления.
Они оценили эти проекты с помощью пользовательского исследования и обнаружили, что более 90 процентов участников предпочли объекты, созданные с помощью их системы на основе ИИ, по сравнению с другими подходами.
Генерация многокомпонентного дизайна
Хотя генеративные модели ИИ хорошо справляются с созданием трёхмерных представлений (мешей) по текстовым запросам, большинство из них не создают единообразных представлений геометрии объекта, которые имеют детали на уровне компонентов, необходимые для роботизированной сборки.
Разделение этих мешей на компоненты является сложной задачей для модели, поскольку назначение компонентов зависит от геометрии и функциональности объекта и его частей.
Исследователи решили эти задачи с помощью модели зрения и языка (VLM) — мощной генеративной модели ИИ, которая была предварительно обучена для понимания изображений и текста. Они поручили VLM определить, как два типа готовых деталей — структурные компоненты и панельные компоненты — должны соединяться друг с другом, чтобы сформировать объект.
Пользователь даёт системе текстовый запрос, например, «сделай мне стул», и получает сгенерированное ИИ изображение стула. Затем VLM анализирует стул и определяет, где панельные компоненты должны располагаться поверх структурных компонентов, основываясь на функциональности многих примеров объектов, которые он видел ранее.
Например, модель может определить, что сиденье и спинка должны иметь панели, чтобы у сидящего на стуле человека были поверхности для опоры.
Совместное проектирование человека и ИИ
Пользователь остаётся в курсе всего процесса и может уточнить проект, дав модели новый запрос, например: «Используй панели только на спинке, а не на сиденье».
«Пространство проектирования очень велико, поэтому мы сужаем его с помощью обратной связи пользователей. Мы считаем, что это лучший способ, потому что у людей разные предпочтения, и создать идеализированную модель для всех было бы невозможно», — говорит Алекс Кьяу, ведущий автор исследования.
«Процесс с участием человека позволяет пользователям управлять проектами, созданными ИИ, и чувствовать себя причастными к конечному результату», — добавляет Рича Гупта.
Как только трёхмерная сетка будет завершена, роботизированная сборочная система создаёт объект, используя готовые детали. Эти детали можно разбирать и собирать заново в различных конфигурациях.
Исследователи сравнили результаты своего метода с алгоритмом, который размещает панели на всех горизонтальных поверхностях, обращённых вверх, и алгоритмом, который размещает панели случайным образом. В ходе пользовательского исследования более 90 процентов участников предпочли проекты, созданные с помощью их системы.
В будущем исследователи хотят усовершенствовать свою систему для обработки более сложных и детальных запросов пользователей, таких как стол из стекла и металла. Кроме того, они хотят включить дополнительные готовые компоненты, такие как шестерни, шарниры или другие движущиеся части, чтобы объекты могли иметь больше функций.
«Мы надеемся значительно снизить барьер доступа к инструментам проектирования. Мы показали, что можем использовать генеративный ИИ и робототехнику, чтобы превращать идеи в физические объекты быстро, доступно и устойчиво», — говорит Рэндалл Дэвис, старший автор исследования.
1. Какие проблемы решает система автоматизированного проектирования на основе ИИ, представленная в статье?
В статье говорится, что система автоматизированного проектирования на основе ИИ решает проблему сложности освоения традиционных САПР и высокого уровня детализации, который не всегда необходим для быстрого создания прототипов. Она позволяет неспециалистам проектировать физические объекты, просто описывая их словами.
2. Какие технологии используются в системе для создания трёхмерных представлений объектов?
В системе используются генеративные модели ИИ. Первая модель создаёт трёхмерное представление геометрии объекта на основе запроса пользователя. Вторая модель анализирует желаемый объект и определяет, где должны располагаться различные компоненты.
3. Какие преимущества имеет система автоматизированного проектирования на основе ИИ по сравнению с традиционными методами?
Система автоматизированного проектирования на основе ИИ имеет несколько преимуществ по сравнению с традиционными методами. Во-первых, она упрощает процесс проектирования для неспециалистов. Во-вторых, она позволяет быстро создавать прототипы. В-третьих, она может вносить изменения в проект на основе обратной связи от пользователя. В-четвёртых, использование системы сокращает количество отходов, образующихся в процессе изготовления.
4. Какие задачи стоят перед исследователями в будущем?
Исследователи планируют усовершенствовать свою систему для обработки более сложных и детальных запросов пользователей, таких как стол из стекла и металла. Кроме того, они хотят включить дополнительные готовые компоненты, такие как шестерни, шарниры или другие движущиеся части, чтобы объекты могли иметь больше функций.
5. Какие выводы можно сделать из результатов пользовательского исследования, описанного в статье?
Из результатов пользовательского исследования можно сделать вывод, что более 90 процентов участников предпочли объекты, созданные с помощью системы на основе ИИ, по сравнению с другими подходами. Это свидетельствует о том, что система является эффективной и удобной для пользователей.