Структура данных
Структура данных
Таблица просмотров контента – content_watch
Один просмотр контента - одна запись
| watch_id | show_date | show_duration | platform | user_id | utm_medium | content_id |
|---|---|---|---|---|---|---|
| 10971121570 | 07.01.2018 14:37 | 1340 | 583 | 1553139 | organic | 314472 |
| 4458319751 | 12.01.2018 15:00 | 12432 | 353 | 1554866 | organic | 314472 |
| 31382550 | 08.02.2018 14:39 | 1800 | 10 | 5255577 | organic | 314472 |
| 11254336994 | 07.07.2017 17:56 | 210 | 11 | 1554866 | organic | 314472 |
| 1231646730 | 01.01.2016 12:48 | 4685 | 11 | 1554866 | organic | 132271 |
| 4212172051 | 12.08.2018 10:52 | 472 | 11 | 1554866 | organic | 314480 |
| 8909218338 | 09.05.2017 0:55 | 297 | 583 | 9462609 | direct | 127399 |
| 1904761857 | 24.09.2018 19:31 | 1635 | 9 | 320756 | organic | 127399 |
| 17947987 | 30.10.2018 4:45 | 854 | 353 | 1547421 | referral | 184673 |
| 6077839073 | 07.12.2017 23:58 | 4571 | 353 | 4066590 | organic | 222161 |
Таблица контента – content
| content_id | compilation_id | episode | paid_type |
|---|---|---|---|
| 314472 | 9570 | 1 | AVOD |
| 132271 | NULL | NULL | SVOD |
| 314480 | 9570 | 2 | AVOD |
| 127399 | 9570 | 6 | TVOD |
| 184673 | 7608 | 16 | AVOD |
| 222161 | NULL | NULL | AVOD |
Задание 1
Составьте SQL-запросы. Укажите, какой диалект SQL вы используетеНа каждый день количество просмотров отдельно по монетизациям SVOD и AVOD на платформах 10 и 11 за последние 30 дней.
-
Ежемесячный ТОП-5 сериалов и ТОП-5 единичного контента по количеству смотрящих людей
-
Список пользователей, у которых вчера был сначала просмотр с organic, а сразу следом за ним - просмотр с referral
Задание 2
Составьте SQL-запросы. Придумайте, как оценить показатели, и напишите запросы для расчёта придуманных метрик. Представьте, что в вашем распоряжении есть все ресурсы по сбору статистики. Если вам необходимы дополнительный данные, то опишите, чего не хватает в тестовой базе, чтобы посчитать нужные метрики.
-
"Цепляемость" и "крутость" сериала. Нужна какая-то метрика, которая при наличии трёх-четырёх серий сериала позволит сравнить этот сериал по "крутости" с другими сериалами.
-
Ретеншн всех пользователей сервиса. Нужно просегментировать аудиторию, рассчитать её ретеншн по сегментам и дать рекомендации по тому, как увеличить ретеншн каждого из сегментов