Гудлук это умная функция для пользователей электронных таблиц. Это предварительно обученная модель, которая обладает интуицией GPT-3 и возможностями объединения нечеткого сопоставления, предназначенного для ускорения кластеризации тем и семантического сопоставления в Google Sheets. Он действует как улучшенный инструмент поиска, который понимает текст за пределами точных строковых совпадений, что позволяет более похожим на человека данным соединяться между наборами данных.
Ключевая идея и преимущества
- Комбинирует традиционное нечеткое соответствие с семантическим пониманием, чтобы соответствовать текстовым строкам, основанным на значении, синонимах и культурных / контекстных сходствах.
- Помогает решить текстовые записи, связывающие проблемы между несколькими источниками данных с непоследовательными соглашениями об именах.
- Расширяет возможности операций с данными в электронных таблицах, предлагая совпадения, которые согласуются семантически, а не только лексически.
Как начать работу
- Подпишитесь. Вы должны быть подписаны на использование Goodlookup (годовая подписка: 15 долларов США в год).
- Установите Goodlookup. Установка с Google Workspace Marketplace.
- Использование в листах. Откройте Google Sheet и получите доступ к функции через меню листа Расширения > Управление надстройками > Goodlookup. Используйте приведенные примеры и функции в своем листе.
Как это работает
- Регулярное нечеткое сопоставление сравнивает струны в основном по форме поверхности. Goodlookup дополняет это семантическим пониманием, чтобы распознавать такие отношения, как синонимы и более широкие понятия.
- Он может связывать данные между строками, которые относятся к одной и той же идее или человеку, даже если они не совпадают (например, сопоставление сокращений, псевдонимов или культурно-вариантных терминов).
- Оценка отражает интенсивность сходства в векторном пространстве; более длинные точные совпадения дают более высокие баллы.
Случаи использования
- Семантическая связь между данными о клиентах, каталогами продуктов или списками организаций.
- Тематические задачи кластеризации в анализе данных, где соглашения имен различаются.
- Нормализация данных из нескольких источников в единое представление.
Безопасность и конфиденциальность
- В описании не подробно описывается специфика обработки данных. Рассмотрим стандартные методы управления данными при использовании облачных дополнений.
Основные характеристики
- Семантический текст в Google Sheets
- Подписка и платный план (год 15 долларов США)
- Интеграция Google Workspace Marketplace
- Доступность функций в листе через расширения > Управление дополнениями
- Сопоставляет синонимы, культурные / семантические отношения и связанные термины
- Оценки, указывающие на интенсивность семантического сходства
- Поддержка кластеризации тем и процессов нормализации данных