Термин глоссария

Graph Neural Network

Graph Neural Network (графовая нейросеть) — модель, которая обрабатывает данные в виде графа, обновляя представления узлов через связи и структуру графа.

Определение

Graph Neural Network (GNN) — это класс моделей, работающих с данными, представленными графами: узлами и рёбрами. Графы отражают реальные структуры: социальные сети, транспортные сети, молекулы, организационные связи, зависимые компоненты кода.

GNN обновляет представления узлов путём агрегации информации от соседей и собственной истории. Итоговое состояние узла формирует его контекст в структуре графа, что делает модель способной выявлять зависимости, которые не представлены линейной последовательностью.

Как работает

Основной механизм GNN — message passing: обмен сообщениями между узлами. Каждый узел получает информацию от своих соседей и обновляет своё представление в несколько шагов.

инициализация: каждому узлу назначается начальный вектор признаков;
агрегация: каждый узел собирает признаки соседей;
обновление: применяется функция, объединяющая собственное состояние и агрегированную информацию;
итерации: процесс повторяется несколько кругов, пока представления не стабилизируются;
pooling: модель формирует финальное представление графа или конкретных узлов.

Существуют разные типы GNN в зависимости от способа агрегации и обновления:

GCN — агрегирование через нормализованную сумму соседей;
GAT — использование механизма внимания для взвешивания соседей;
GraphSAGE — выборка и агрегация соседей динамическими функциями;
MPNN — универсальные схемы message passing с обучаемыми функциями.

Где применяется

Социальные сети: анализ связей, выявление групп, рекомендации.
Химические структуры: моделирование молекул, прогноз реакций.
Кодовые базы: анализ зависимостей между файлами и функциями.
Инфраструктура: сети устройств, маршруты, оптимизация топологий.
Рекомендации: графы взаимодействий пользователей и объектов.
Безопасность: обнаружение аномалий в сетевой активности.
Финансы: графы транзакций, фрод-мониторинг.
IR-системы: уточнение структурных связей между документами.

Практические примеры использования

В анализе социальных сетей GNN обрабатывают структуру друзей, подписок и взаимодействий, предсказывая интересы пользователей и находя скрытые сообщества.

В биоинформатике графовые модели прогнозируют свойства молекул: каждый атом — узел, связи — рёбра. GNN изучает химическую структуру и выводит молекулярные свойства.

В разработке ПО GNN помогает анализировать графы вызовов функций и импортов. Это упрощает рефакторинг и обнаружение критически связанных участков кода.

В фрод-мониторинге графы транзакций позволяют выявлять подозрительные цепочки: GNN переносит информацию через связи и выявляет нетипичные паттерны.

В рекомендательных системах GNN анализирует графы взаимодействий между пользователями и объектами, улучшая точность персонализации.

Преимущества и ограничения

Плюс: способность учитывать структуру связей, а не только признаки.
Плюс: высокая выразительность для сложных структур.
Плюс: подходит для широкого диапазона задач — от химии до анализа сетей.
Плюс: расширяемость за счёт разных типов агрегации.
Минус: чувствительность к качеству графа.
Минус: высокая стоимость обработки при большом числе рёбер.
Минус: сложность обучения на динамических графах.
Минус: риск oversmoothing при большом числе итераций обновления.

Связанные термины

Graph embeddings
Message passing
GAT
GCN
GraphSAGE
Реlational learning
Vector search

Категория термина

Архитектуры моделей

Экосистемы