GENAI APP ENGINE от ClearML является Ultimate Engine для быстрого развертывания проекта GenAI. Он предоставляет плоскость управления инфраструктурой для управления доступом к вычислениям, использованием, мониторингом производительности и безопасностью, позволяя разработчикам развертывать LLM поверх масштабируемой платформы. Пользователи могут запускать готовые LLM или предлагать свои собственные настроенные модели, ускорять тестирование и быстрее развертывать приложения GenAI в производстве.
Обзор
- Одна платформа для запуска приложений GenAI с оптимизированными инструментами и оркестровкой
- Поддержка подключения пользовательских или тонко настроенных моделей (например, от Hugging Face)
- Интегрирует LLM, обслуживающий такие двигатели, как vLLM, Llama.cpp, Triton и другие
- Обеспечивает безопасные конечные точки API с RBAC и сетевым управлением
- Динамическое распределение ресурсов и маршрутизация трафика для оптимизации производительности и стоимости
- Создано для предприятий: управление, безопасность и масштабируемое развертывание в командах
Как это работает
- Развертывать LLM с одним кликом
- Подключите пользовательскую или настроенную модель и запустите приложение GenAI через UI или CLI
- Выберите из поддерживаемых обслуживающих двигателей (vLLM, Llama.cpp, Triton и т. Д.)
- Управление ресурсами и доступом
- Выделение ресурсов для моделей, команд и бизнес-подразделений
- Управление доступом на основе ролей (RBAC) и безопасные сети
- Мониторинг производительности и использования
- Конечный контроль трафика, задержки, памяти, CPU/GPU, I/O и сети
- Наблюдение для всех конечных точек AI API
- Оптимизируйте доступность и стоимость
- Горизонтальное масштабирование вывода для обработки пикового спроса
- Унифицированный подход к памяти для минимизации использования GPU и сохранения приложений «всегда включенными»
- Запуск пользовательских приложений GenAI
- Создание мастеров и настройка пользовательских интерфейсов для внутренних пользователей
- Быстрое развертывание приложений GenAI для конечных пользователей
- Получить видимость на агентах ИИ
- Создание и отслеживание агентов ИИ; мониторинг использования и производительности
Случаи использования
- Развертывание и управление приложениями Enterprise GenAI
- Быстрое тестирование и итерация LLM и подсказок
- Безопасные, масштабируемые услуги GenAI в разных отделах
- Масштабирование по требованию для удовлетворения меняющихся рабочих нагрузок
Как это работает (технические детали)
- План управления инфраструктурой обрабатывает аутентификацию, маршрутизацию трафика и управление ресурсами
- Развертывание конечных точек или приложений, которые могут содержать общие или доменные модели GenAI
- RBAC и аутентификация защищают данные, модели и API
- Динамические конвейеры и приложения позволяют принимать данные, очищать, обучать и векторные базы данных для точной настройки
Безопасность и управление
- Централизованный самолет управления с защищенным доступом и мониторингом
- Предназначен для корпоративных сред с учетом безопасности и соответствия
Основные характеристики
- Развертывание LLM одним щелчком мыши (обычные или тонко настроенные модели)
- Поддержка нескольких LLM-двигателей (vLLM, Llama.cpp, Triton и др.)
- Безопасные конечные точки API с контролем доступа на основе ролей (RBAC)
- Динамическое распределение ресурсов между моделями, командами и бизнес-единицами
- Горизонтальное масштабирование для вывода для поддержания доступности во время пикового использования
- Сквозной мониторинг конечных точек: запросы, задержка, память, CPU/GPU, I/O, сеть
- Экономически эффективный вывод через унифицированную память и использование ресурсов по требованию
- Создание и развертывание приложений GenAI с пользовательскими интерфейсами (UI) и мастерами
- Видимость и управление агентами ИИ для оптимизации задач
- Готовое управление, безопасность и сотрудничество между командами