поведенческая модель графа взаимодействий

 это не “один официальный документ, где написано Gmail строит граф общения”. Но **в академических исследованиях и в индустриальных системах фильтрации есть довольно чёткие доказательства**, что **структура коммуникаций (кто с кем общается)** используется как сигнал.


Покажу несколько источников и объясню логику.


---


# 1. Исследования прямо используют граф email-взаимодействий


Есть исследования, где спам фильтруется **не по тексту, а по структуре связей между отправителями и получателями**.


Например:


* в работе по защите email от спама строится **граф писем**, объединяющий


  * отправителей

  * домены

  * URL

  * вложения


и затем модель делает выводы по этому графу. ([arXiv][1])


То есть письмо **не оценивается изолированно** — анализируется сеть связей вокруг него.


---


# 2. Идея “социального графа общения”


В других работах email-данные прямо превращают в **social graph**.


Узлы:


```

люди

```


Рёбра:


```

кто кому пишет

```


И по этому графу определяют:


* нормальные коммуникации

* подозрительные сообщения

* спам.


В одном исследовании email-система **строит социальный граф пользователей и их коммуникаций**, чтобы обнаруживать аномалии и группировать контакты. ([arXiv][2])


---


# 3. Почему это вообще работает


Если представить почту как сеть:


```

A → B

A → C

B → C

```


получается **граф коммуникаций**.


И у нормальных пользователей он выглядит примерно так:


```

кластер контактов

повторяющиеся связи

регулярность

```


А у спамеров:


```

один → тысячи

нет ответов

нет повторных коммуникаций

```


Это очень сильный сигнал.


---


# 4. Поведенческие сигналы реально используются


Даже в обычных фильтрах вроде Gmail система смотрит на **поведение пользователей**:


* открывают ли письма

* отвечают ли

* удаляют ли


Если письма часто игнорируются, **репутация домена ухудшается**, и будущие письма фильтруются сильнее. ([cerkl.com][3])


Это уже фактически **поведенческая модель графа взаимодействий**.


---


# 5. Почему индустрия идёт в сторону графов


Есть фундаментальная причина.


Контент-фильтрация (ключевые слова, текст):


```

легко обойти

```


Спамеры могут:


* переписать текст

* использовать AI

* менять слова


А вот **структуру коммуникации** подделать гораздо сложнее.


Например:


```

CEO → CFO

```


обычно пишут друг другу регулярно.


Если вдруг приходит:


```

новый домен → CFO

```


и просит перевести деньги —

это сразу аномалия в графе.


---


# 6. Это особенно активно используется против phishing


Современные системы безопасности (BEC detection) анализируют:


```

normal communication patterns

```


и ловят:


```

deviation from pattern

```


Потому что даже идеальное фишинговое письмо **не вписывается в граф коммуникаций**.


---


# Важный момент


Я не утверждаю, что:


```

Gmail = чистая graph model

```


Скорее это **один из множества сигналов**.


Типичная модель сейчас использует:


```

content signals

+

domain reputation

+

behavior signals

+

communication graph signals

```


---


💡 Кстати, если копнуть глубже, появляется очень интересная вещь.


**Cold outreach ломается именно на уровне графа.**


Потому что структура такая:


```

один отправитель

→ тысячи новых людей

```


Это почти **идеальная сигнатура спама**.


И именно поэтому deliverability — такой ад.



Comments

Popular posts from this blog

Переход от automation to agentic systems

современные outreach-системы