Стабильный быстрый 3D (SF3D) это быстрый инструмент генерации 3D-активов, который преобразует одно 2D-изображение в подробный 3D-актив примерно за 0,5 секунды. Он подчеркивает скорость и качество для 3D-реконструкции, обеспечивая высококачественные сетки и параметры материала из одного входного изображения. SF3D подходит для игр, виртуальной реальности, электронной коммерции и архитектурной визуализации и построен на архитектурных улучшениях в рамках TripoSR. Лицензирование следует за лицензией сообщества Stability AI, позволяющей некоммерческое использование и коммерческое использование до 1 миллиона долларов годового дохода для физических лиц или организаций. Для крупных предприятий, лицензии предприятия доступны по запросу.
Что такое быстрый 3D?
- Преобразует одно изображение в текстурированный 3D-актив менее чем за секунду (0,5 секунды на GPU с 7 ГБ VRAM).
- Производит УФ-развернутые сетки с точными параметрами материала.
- Предназначен для быстрых рабочих процессов в играх, VR, электронной коммерции и архитектурной визуализации.
- Построен на архитектуре TripoSR со значительными улучшениями скорости и качества.
Как использовать стабильный 3D
- Загрузите изображение (JPEG, PNG или WebP) для создания 3D-актива.
- Система возвращает двоичный шарик в стиле GLB / GLTF, содержащий актив glTF с JSON, буферами и текстурами.
- Используйте созданный 3D-актив в ваших приложениях.
API и его использование
- API Access: Интегрируйте стабильный 3D в приложения через API.
- Как использовать быстрый 3D API
- Сделайте запрос POST на конечную точку API.
- Включите ключ API в заголовк авторизации.
- Настройка Content-Type на multipart/form-data.
- В орган запроса включают:
- изображение (обязательно): входное изображение (JPEG, PNG, WebP)
- texture resolution (необязательно): 512, 1024 (по умолчанию) или 2048
- foreground ratio (необязательно): от 0 до 1 (по умолчанию: 0,85)
- Требования к входному изображению:
- Минимальная длина стороны: 64 пикселя
- Общее количество пикселей: от 4 096 до 4 194 304
- Выход: двоичный пузырь, содержащий актив glTF (формат GLB).
- Каждое успешное поколение стоит 2 кредита; неудавшиеся поколения бесплатны.
Пример вызова API:
curl -X POST 'https://api.stability.ai/v1/generation/stable-fast-3d'
-H 'Content-Type: multipart/form-data'
-H 'Authorization: Bearer YOUR_API_KEY'
-F 'image=@path/to/your/image.jpg'
-F 'texture_resolution=1024'
-F 'foreground_ratio=0.85'
Лицензирование и доступность
- Модель выпущена под лицензией сообщества Stability AI.
- Разрешенное использование:
- Некоммерческое использование
- Коммерческое использование для физических лиц или организаций с годовым доходом до 1 миллиона долларов США
- Для предприятий с доходом выше 1 миллиона долларов свяжитесь с AI для корпоративных лицензий.
- Методы доступа:
- API
- Демо и пробелы Hugging Face
- Модельный код на GitHub и весы на обнимающем лице
Альтернативы
- Google DreamFusion: альтернатива генерации текста в 3D.
- GET3D от NVIDIA: текстурированные 3D сетки из изображений.
- OpenAI Point-E: 3D облака точек из текстовых описаний.
- Magic3D от NVIDIA: Text-to-3D модель для высококачественных результатов.
Stable Fast 3D подчеркивает скорость и качество вывода отдельных изображений, что делает его конкурентоспособным для быстрого создания 3D-активов.
Как это работает
- Введите изображение; система генерирует 3D-актив с помощью УФ-развернутой сетки и материалов.
- Выход представляет собой GLB/GLTF-совместимый двоичный пузырь, содержащий 3D-актив.
- Основное внимание уделяется быстрой обработке (0,5 секунды на актив) высококачественными текстурами и материалами.
Безопасность и правовые соображения
- Обеспечить надлежащее лицензирование любых активов, используемых в качестве входных данных, и соблюдать права использования генерируемого контента.
Основные характеристики
- Ультрабыстрая генерация 3D-активов: ~0,5 секунды на GPU
- Однофокусный ввод изображения → подробные УФ-развернутые 3D сетки с параметрами материала
- Формат вывода: GLB/GLTF-совместимый двоичный blob
- Варианты разрешения текстуры: 512, 1024 (по умолчанию), 2048
- Контроль отношения переднего плана для прокладки вокруг объекта (по умолчанию 0,85)
- API-доступ для интеграции в приложения и конвейеры
- Лицензия сообщества с четкими коммерческими / некоммерческими условиями
- Доступность через API, демо-пространства и каналы с открытым исходным кодом / сообществом