В MIT представили модель GenCAD, которая умеет строить CAD-модели всего по одной фотографии. Нейросеть формирует полный скрипт построения детали — его можно открыть в редакторе, подкорректировать и сразу использовать для производства.
В отличие от аналогов, которые работают с облаками точек или вокселями, GenCAD генерирует не только 3D-модель, но и всю параметрическую историю команд. Это полноценная CAD-модель в выходном файле, как если бы ее создавал инженер вручную.
Алгоритм работает так:
изображение кодируется, формируется CAD-модель,
диффузионная модель восстанавливает команды,
финальный декодер превращает их в понятный для редактора скрипт.
Исходный код, датасет и предобученные модели разработчики выложили на GitHub.