Genmo Mochi 1 — это модель с открытым исходным кодом, описанная как лучшая в мире модель с открытым видео. Он фокусируется на обеспечении реалистичного, физически последовательного движения, точного быстрого соблюдения и инструментария открытого доступа для исследователей и разработчиков.
Обзор
Mochi 1 представлен в качестве предварительного просмотра исследования, направленного на решение фундаментальных задач ИИ-видео. Он подчеркивает высокое качество движения, детальный контроль с помощью текстовых подсказок и способность генерировать текучее человеческое действие и выражение, которые избегают сверхъестественной долины.
Ключевые способности
- Непревзойденное качество движения: реалистичное, уважающее физику движение с мелкозернистыми деталями.
- Превосходное быстрое соблюдение: подробный контроль над персонажами, настройками и действиями, согласованными с текстовыми подсказками.
- Пересекает сверхъестественную долину: генерирует последовательные, текучие человеческие действия и выражения.
- Mochi 1 доступен на GitHub и HuggingFace для совместной работы и экспериментов.
Как пользоваться (игровая площадка)
- Доступ к игровой площадке Mochi 1 для экспериментов с генерацией видео.
- Пример подсказки: «Трейлер фильма, в котором показаны приключения 30-летнего космонавта, носящего красный шерстяной вязаный мотоциклетный шлем, голубое небо, соленая пустыня, кинематографический стиль, снятый на 35-миллиметровую пленку, яркие цвета»
- Используйте игровую площадку для уточнения подсказок, наблюдения за качеством движения и повторения на сценах.
Доступ и ресурсы
- Репозитории с открытым исходным кодом: Mochi 1 на GitHub, Mochi 1 на HuggingFace
- Playground: интерактивная среда для тестирования и создания видео
- Цены и условия: доступны через страницы продукта и условия использования
- Политика конфиденциальности: детали обработки данных для инструментов с открытым исходным кодом
Карьера
- В число ролей входят старший инженер Frontend, старший инженер по производительности ИИ, научный сотрудник (после обучения), старший инженер полного стека, дизайнер поиска продуктов и многое другое. Проверьте сайт на наличие открытых ролей.
Как это работает
- Пользователи предоставляют подсказки, описывающие символы, настройки и действия.
- Модель генерирует видеоконтент, который придерживается подсказки с высококачественным движением и визуальными эффектами.
- Природа с открытым исходным кодом позволяет исследователям проверять, изменять и улучшать базовые модели.
Вопросы безопасности и использования
- Как и в случае с любым инструментом генерации видео, пользователи должны следовать этическим принципам и уважать конфиденциальность и согласие при создании или совместном использовании созданного контента.
Краткое описание
- Модель генерации видео с открытым исходным кодом (Mochi 1) с доступом к GitHub и HuggingFace
- Высококачественные, реалистичные движения, которые уважают физику
- Быстрое соблюдение точного контроля над сценами и действиями
- Последовательное, свободное человеческое действие и выражения (направленные на то, чтобы избежать сверхъестественной долины)
- Игровая площадка для интерактивного оперативного видео генерации
- Быстрое генерирование, позволяющее гибко описывать сцены
- Общинные и карьерные ресурсы, включая постоянное развитие и роли