Нас очень часто просят просят внедрить нечто вроде черного списка покупателей, определяя их по номерам телефона. Например, если покупатель, с одним номером телефона не выкупил посылку несколько раз у разных наших клиентов, то стоит предупреждать других клиентов о том, что заказ с таким номером телефона скорее всего фродовый.

Эту идею нам постоянно озвучивают просто везде: скайп, тикеты, онлайн-консультант. Ну что ж, давайте попробуем посмотреть какие данные можно вытянуть из более чем 1,3 миллиона заказов

Вот топ 30 самых популярных (последние 9 цифр) номеров телефонов (справа их количество). Как можно видеть, все данные явно спамовые или тестовые. Мы лишь несколько номеров закрыли звездочками, т.к. то могут быть реальные данные, просто продублированные по ошибке несколько раз

[111111111] => 2389
[000000000] => 943
[888888888] => 936
[777777777] => 797
[999999999] => 747
[222222222] => 675
[555555555] => 434
[234567890] => 360
[280000000] => 344
[123123123] => 308
[333333333] => 274
[123456789] => 267
[289280000] => 261
[666666666] => 256
[444444444] => 240
[215768484] => 240
[930229158] => 232
[888888880] => 206
[991234567] => 175
[288272253] => 130
[226978483] => 127
[234234234] => 126
[2882*0100] => 125
[362362362] => 120
[928777777] => 104
[456457564] => 100
[976543134] => 93
[345345345] => 92
[888888885] => 89
[5191*2423] => 87

Далее, топ 30 телефонов, с указанием дублей среди разных клиентов (не офферов, а аккаунтов наших пользователей)

[111111111] => 22
[280000000] => 9
[289280000] => 9
[888888888] => 8
[000000000] => 6
[999999999] => 6
[666666666] => 4
[888888880] => 4
[991234567] => 4
[211211111] => 4
[234567890] => 4
[288*60100] => 4
[123123123] => 4
[222222222] => 3
[555555555] => 3
[123456789] => 3
[283*79632] => 3
[777777777] => 3
[05400*220] => 2
[120*50212] => 2
[231111111] => 2
[345345345] => 2
[345678910] => 2
[234234324] => 2
[161111111] => 2
[333333333] => 2
[235235235] => 2
[2936*8680] => 2
[432432432] => 2
[112223344] => 2

И самое интересное: номера телефонов со всей базы всех клиентов, где заказы находятся в статусах с группой «Возврат». Да, здесь реальные номера телефонов. Но посмотрите на их количество. Максимум — 5 штук. При этом мы проверили что это за заказы. Оказалось, что это просто дубли, которые были выгружены через внутреннюю интеграцию.

[959*46310] => 5
[012*63112] => 4
[879*19884] => 4
[241*04132] => 4
[785*31212] => 4
[011*11412] => 4
[783*95501] => 4
[625*21021] => 3
[114*59467] => 3
[077*07627] => 3
[886*01910] => 3
[381*60460] => 3
[781*43113] => 3
[111*11111] => 3
[751*50099] => 3
[017*70504] => 3
[119*26259] => 3
[479*14180] => 3
[058*04548] => 3
[507*23642] => 3
[056*59503] => 3
[291*65589] => 3
[775*65222] => 3
[013*40472] => 3
[103*55102] => 3
[015*11432] => 3
[056*53600] => 3
[077*38462] => 3
[780*00508] => 3
[026*19092] => 3

Иными словами, никакой пользы от этих данных нет вообще. Мы считаем, что «плохой» номер телефона тот, который встречается более 5 раз у разных клиентов. Но у нас в базе из более чем 1,3 заказов нет ни одного такого номера.