GenCAD:画像からCADプログラム生成するAIモデル発表

原題: GenCAD

なぜ重要か

画像から編集可能なCADプログラムを直接生成できる初のAIモデルで、設計自動化と製造業のワークフロー効率化に革命的影響を与える可能性

MIT研究者が画像を入力として完全なCADコマンドシーケンスを生成するGenCADを開発。従来の3Dメッシュ生成と異なり、パラメータ化されたCADプログラム全体を出力し、エンジニアリング設計での編集可能性を実現。トランスフォーマーベースの対照学習と拡散モデルを組み合わせた4段階アーキテクチャを採用。

MIT(マサチューセッツ工科大学)の研究者Md Ferdous AlamとFaez Ahmedが、画像を条件とするCAD(Computer-Aided Design)生成モデル「GenCAD」を発表した。従来のAI生成3Dモデルは主にメッシュ、ボクセル、点群などの表現を使用していたが、これらはエンジニアリング作業や製造に重要なCADモデルの精度と編集可能性を犠牲にしていた。GenCADは境界表現(B-rep)などの複雑なCADデータ構造を直接扱い、3D立体モデルだけでなく、パラメータ化されたCADコマンドシーケンス全体を生成する。

GenCADアーキテクチャは4つの重要なステップで構成される:1)CADコマンドシーケンスの潜在表現学習のための自動回帰トランスフォーマーエンコーダー、2)CADコマンドシーケンスとCAD画像間の結合表現学習のための対照学習ベースモデル、3)CAD画像を条件とするCADコマンドシーケンスの潜在表現を生成する潜在拡散モデル、4)CAD潜在表現をパラメトリックCADコマンドシーケンスに変換するデコーダーモデル。

実証実験では、約7000のCADプログラムのコレクションから画像条件付きCAD検索機能も実現し、同一画像入力に対する複数のCADサンプル生成の多様性も示された。研究論文はarXivで公開されており、コードとデータも提供予定となっている。

出典

gencad.github.io — 元記事を読む →