General Reasoning | Where Machines Get Reward — это исследовательская инициатива ИИ, направленная на создание безопасных и способных моделей рассуждений посредством обучения с подкреплением. Команда, базирующаяся в Лондоне, стремится расширить границы машинного мышления, разрабатывая масштабируемые, открытые подходы к интеллектуальному поведению и управлению.
Обзор
General Reasoning подчеркивает продвижение обучения, основанного на обучении, для создания надежных и безопасных систем ИИ. Программа исследований включает в себя разработку новых архитектур рассуждений, масштабируемые учебные рабочие процессы и практические развертывания, которые соответствуют человеческим намерениям. Ключевые элементы инициативы включают открытые данные, сотрудничество с сообществами и прозрачные методы исследований.
Публикации и артефакты
- GeneralThought-430K: крупномасштабный набор данных (объявлен 14 марта 2025 года) для поддержки исследований, ориентированных на рассуждения.
- Блог: освещение идей по масштабированию обучения с подкреплением для задач рассуждения.
- Open Data Hub (запущен 21 февраля 2025 года): платформа для обмена наборами данных, экспериментов и результатов исследований для содействия открытой науке.
Сотрудничество и команда
General Reasoning стремится создать свою команду на первом этапе развития компании. Команда базируется в Лондоне, но приветствует удаленное сотрудничество и вклад различных исследователей и инженеров. Заинтересованные кандидаты могут представить свое резюме, чтобы присоединиться к команде.
Политика и управление
- Условия обслуживания
- Политика конфиденциальности
- Контент-политика
Как участвовать
- Изучите блог для обновления исследований и лидерства мысли.
- Доступ к Open Data Hub для просмотра или внесения наборов данных и артефактов.
- Просмотрите текущие вакансии и подайте заявку с резюме, если вы заинтересованы в присоединении к команде.
Основные характеристики
- Усиление обучающих моделей рассуждений для повышения безопасности и возможностей ИИ
- Открытые наборы данных мышления (например, GeneralThought-430K) для продвижения исследований в области рассуждений
- Open Data Hub для обмена наборами данных, экспериментами и результатами исследований
- Публичный блог с идеями о масштабировании RL для рассуждений
- Лондонская организация открыта для глобального сотрудничества
- Четкое управление и политическая документация (Условия, Политика конфиденциальности, Политика в отношении контента)