Федеральное государственное автономное образовательное


Регрессионный анализ загрузок на примере российского рынка



страница5/13
Дата07.11.2016
Размер1.36 Mb.
Просмотров3060
Скачиваний0
1   2   3   4   5   6   7   8   9   ...   13

2.2. Регрессионный анализ загрузок на примере российского рынка

2.2.1.Описательные статистики


При описательном анализе следует проверить данные и полученные переменные на ошибки, проверить нормальность распределения остатков, посмотреть на распределение зависимой переменной, по необходимости провести преобразование переменных и анализ на выбросы, которые могут искажать дальнейшие результаты.

В первую очередь, приведем общую описательную таблицу всех переменных. Как видно из Таблица Описательные статистики переменных в сегменте российского рынка общее количество наблюдений, в среднем, составляет 112 (за исключением, переменной featured, которая показывает рейтинг приложения в iTunes), поскольку не у всех приложений были заполнены рейтинги (у новых приложений отсутствует общий рейтинг, а у некоторых приложений, которые давно не выпускали обновления, соответственно, отсутствует рейтинг последней версии). Следует обратить внимание на зависимую переменную downloads_this_month, среднее которой составляет более 20 тысяч скачиваний, примерно около той же величины составляет стандартное отклонение данной величины (20096,91), при этом минимальное количество загрузок составляет 8400, а максимальное 116500, следовательно, размах количества скачиваний приложений будет более 100 тысяч.

Таблица Описательные статистики переменных в сегменте российского рынка

. summarize apps_published - rated9


Variable | Obs Mean Std. Dev. Min Max

-------------+--------------------------------------------------------

apps_publi~d | 112 61.94643 112.2243 1 482

monetizati~e | 112 .4285714 .4970958 0 1

price_in_eur | 112 1.674464 1.440705 .82 5.66

had_free_p~d | 112 .1785714 .3847144 0 1

is_local | 112 .125 .3322053 0 1

-------------+--------------------------------------------------------

downloads_~h | 112 20263.39 20096.91 8400 116500

percent | 112 .0089286 .0088552 .0037013 .0513329

price_usd | 112 2.088214 1.734441 .99 6.99

iphoneonly | 112 .0089286 .0944911 0 1

iphoneipod~h | 112 .2946429 .457931 0 1

-------------+--------------------------------------------------------

universal | 112 .6964286 .4618663 0 1

gameloft | 112 .0714286 .2586969 0 1

disney | 112 .0446429 .2074466 0 1

other_publ~r | 112 .8839286 .3217502 0 1

featured | 38 64.05263 93.1752 1 456

-------------+--------------------------------------------------------

itunes_pla~s | 106 625.934 675.6434 2 3388

curr5 | 107 540.1121 967.6938 0 6706

curr4 | 107 60.18692 103.3843 0 552

curr3 | 107 22.33645 39.1369 0 249

curr2 | 107 11.99065 20.59011 0 142

-------------+--------------------------------------------------------

curr1 | 107 26.83178 47.9944 0 284

allversion~n | 109 4.490826 .5181058 1 5

allversion~r | 109 2875.394 4440.936 3.902 24099

all5 | 109 2370.734 3790.669 0 21535

all4 | 109 247 325.811 0 1808

-------------+--------------------------------------------------------

all3 | 109 106.0917 161.428 0 1150

all2 | 109 61.42202 94.02111 0 589

all1 | 109 125.8807 187.6442 0 1146

books | 112 .0089286 .0944911 0 1

business | 112 .0267857 .1621823 0 1

-------------+--------------------------------------------------------

education | 112 .0267857 .1621823 0 1

entertainm~t | 112 .0535714 .226182 0 1

finance | 112 .0357143 .1864109 0 1

games | 112 .5446429 .5002413 0 1

healthandf~s | 112 .0178571 .1330273 0 1

-------------+--------------------------------------------------------

lifestyle | 112 .0089286 .0944911 0 1

music | 112 .0446429 .2074466 0 1

photoandvi~o | 112 .0267857 .1621823 0 1

productivity | 112 .0357143 .1864109 0 1

reference | 112 .0089286 .0944911 0 1

-------------+--------------------------------------------------------

socialnetw~g | 112 .0089286 .0944911 0 1

utilities | 112 .1160714 .3217502 0 1

weather | 112 .0357143 .1864109 0 1

size_mb | 112 162.6659 349.0984 .4666 1600

number_lang | 112 6.946429 6.82845 1 32

-------------+--------------------------------------------------------

rated12 | 112 .0982143 .2989417 0 1

rated17 | 112 .1160714 .3217502 0 1

rated4 | 112 .6428571 .481311 0 1

rated9 | 112 .1428571 .3514998 0 1


Рассмотрим описательные статистики переменной Downloads_This_Month, которая отражает количество скачиваний приложений за последний месяц, и при проведении регрессионного анализа данная переменная будет являться зависимой. График распределения переменной и график нормального распределения представлен ниже (Рисунок Распределение переменной downloads_this_month).

Рисунок Распределение переменной downloads_this_month (Россия)

Как видно из графика распределение далеко от нормального, в доказательство приведем тест на нормальность распределения. Нулевая гипотеза гласит, что распределение нормально. Поскольку значимость (probability, далее prob)<0.05, то гипотеза о нормальности распределения загрузок отвергается. Следовательно, высока вероятность, что и остатки в регрессии не будут распределены нормально. Следует отметить, что распределение цены сильно несимметрично (асимметрия, отличаются от нуля, эксцесс – от трех, и медиана отлична от среднего). Подобный разброс количества скачиваний может быть связан с различными характеристиками приложений.

Таблица Тест Франция на нормальность распределение величины downloads_this_month (Россия)

. sfrancia downloads_this_month


Shapiro-Francia W' test for normal data
Variable | Obs W' V' z Prob>z

-------------+--------------------------------------------------

downloads_~h | 112 0.56101 43.532 7.056 0.00001
Попробуем преобразовать переменную downloads_this_month в логарифм. Получим lndownloads. Распределение представлено ниже. Графически оно уже ближе к нормальному, чем первоначальное.



Рисунок Распределение переменной lndownloads (Россия)

В результате по тесту (Таблица Тест Франция на нормальность распределение величины lndownloads (Россия)) снова следует, что распределение данной переменной далеко от нормального (prob<0.05). Следует отметить, что исходная величина не подразумевает наличие отрицательных значений и представляет собой целочисленные значения, поэтому логарифмирование не дает значимых результатов, поэтому исходя из графика распределения, можно предположить, что зависимая переменная может иметь пуассоновское распределение, однако к этому вопросу мы обратимся в параграфе 2.2.4. Регрессионный анализ, часть 3 «Пуассоновская регрессия».

Таблица Тест Франция на нормальность распределение величины lndownloads (Россия)

. sfrancia lndownloads


Shapiro-Francia W' test for normal data
Variable | Obs W' V' z Prob>z

-------------+--------------------------------------------------

lndownloads | 105 0.84783 14.311 5.092 0.00001
При рассмотрении диаграммы по цене, следует отметить, что цены на рынке - сложившаяся категория, которая имеет несколько градаций (Таблица Категории цен на мобильные приложения, выраженные в доллары и рубли):

Таблица Категории цен на мобильные приложения, выраженные в доллары и рубли (Россия)



Евро

Доллар

Рубль

0,82

1,09

32,8

1,63

2,17

65,2

2,45

3,27

98

3,19

4,25

127,6

4,18

5,57

167,2

4,92

6,56

196,8

5,66

7,55

226,4

Как видно из Таблица более 60% - это минимальная цена, что говорит, что большинство приложений – средняя категория, в которой могут представлены как известные «бренды», как и малоизвестные платные приложения. Кроме того, по 10% от выборки занимают цены второй и третьей ступени (1,63 евро и 2,45 евро, соответственно).

Таблица Распределение категориальной переменной price_in_eur (Россия)



Tabulation of PRICE_IN_EUR







Sample: 1 112










Included observations: 112







Number of categories: 7














































Cumulative

Cumulative

Value

Count

Percent

Count

Percent

 0.82

72

64.29

72

64.29

 1.63

11

9.82

83

74.11

 2.45

11

9.82

94

83.93

 3.19

2

1.79

96

85.71

 4.18

8

7.14

104

92.86

 4.92

2

1.79

106

94.64

 5.66

6

5.36

112

100.00

Total

112

100.00

112

100.00






























Далее рассмотрим категориальные переменные. По категориям приложений (Таблица Распределение категориальной переменной Category (Россия)) следует отметить преимущество игр (Category – Games) более 50%, следующая по количеству – Утилиты (около 12%), далее – Entertainment (5%) и остальные.



Таблица Распределение категориальной переменной Category (Россия)

Tabulation of CATEGORY







Sample: 1 112










Included observations: 112







Number of categories: 15














































Cumulative

Cumulative

Value

Count

Percent

Count

Percent

Books

1

0.89

1

0.89

Business

3

2.68

4

3.57

Education

3

2.68

7

6.25

Entertainment

6

5.36

13

11.61

Finance

4

3.57

17

15.18

Games

61

54.46

78

69.64

Health and Fitness

2

1.79

80

71.43

Lifestyle

1

0.89

81

72.32

Music

5

4.46

86

76.79

Photo and Video

3

2.68

89

79.46

Productivity

4

3.57

93

83.04

Reference

1

0.89

94

83.93

Social Networking

1

0.89

95

84.82

Utilities

13

11.61

108

96.43

Weather

4

3.57

112

100.00

Total

112

100.00

112

100.00































Оценивая совместимость устройств и приложений, универсальные приложения занимают весомую долю на рынке, т.е. большинство приложений существует как на iPhone market, так же и на Android и других рынках мобильных приложений.

Таблица Распределение категориальной переменной Compatibility (Россия)



Tabulation of COMPATIBILITY







Sample: 1 112










Included observations: 112







Number of categories: 3














































Cumulative

Cumulative

Value

Count

Percent

Count

Percent

iPhone Only

1

0.89

1

0.89

iPhone, iPod touch

33

29.46

34

30.36

Universal

78

69.64

112

100.00

Total

112

100.00

112

100.00































По издателям приложений – большее количество выпустил крупный игрок на рынке – Gameloft (8 приложений), Disney (5 приложений), Apalon (3 приложения), Rovio Entertainment Ltd (3 приложения) (ссылка на приложение).

Ограничения на приложения распределяются таким образом: большинство приложений подходят и для маленьких детей 4+ (64%), 9+ (14%), но 13 приложений (12%) занимают приложения для уже взрослых.



Таблица Распределение категориальной переменной Rated (Россия)

Tabulation of RATED







Sample: 1 112










Included observations: 112







Number of categories: 4














































Cumulative

Cumulative

Value

Count

Percent

Count

Percent

Rated 12+:

11

9.82

11

9.82

Rated 17+:

13

11.61

24

21.43

Rated 4+:

72

64.29

96

85.71

Rated 9+:

16

14.29

112

100.00

Total

112

100.00

112

100.00






























Масштабное скачивание приложения в пределах одной страны (т.е. локальные приложения) присутствуют только в 12,5% случаев из 100%. Остальные приложения скачиваются на мировом рынке, что показывает глобализацию рынка.



Таблица Распределение категориальной переменной Is_local (Россия)

Tabulation of IS_LOCAL







Sample: 1 112










Included observations: 112







Number of categories: 2














































Cumulative

Cumulative

Value

Count

Percent

Count

Percent

no

98

87.50

98

87.50

yes

14

12.50

112

100.00

Total

112

100.00

112

100.00






























82% приложений не имеют ознакомительного периода (бесплатного) действия, что может говорить, либо об устоявшей форме монетизации некоторых приложений либо о популярности качественных платных приложений.



Таблица Распределение категориальной переменной Free_period (Россия)

Tabulation of HAD_FREE_PERIOD




Sample: 1 112










Included observations: 112







Number of categories: 2














































Cumulative

Cumulative

Value

Count

Percent

Count

Percent

no

92

82.14

92

82.14

yes

20

17.86

112

100.00

Total

112

100.00

112

100.00































Приведенным описательным анализом уже можно сделать начальную оценку данного сегмента. В самом популярном сегменте рынка 64% - это дешевые приложения (0,82 евро =32,8 руб.), что показывает, мотивацию разработчиков попасть в лидеры по скачиванию (прямая зависимость прибыли с количеством загрузок). Так же большинство приложений создаются для мирового потребителя, без привязки к какой-либо стране. Кроме того, эти приложения направлены непосредственно на зарабатывание, поскольку у 98 приложений из 112 нет ознакомительного периода.


Каталог: data -> 2013
2013 -> Федеральное государственное автономное образовательное
2013 -> «Визуальный образ персонажей массового кинематогрфа в историческом контексте»
2013 -> 2 раздел анализ предметной области 5
2013 -> Магистерская диссертация
2013 -> Влияние вовлеченности на готовность платить за коллекционные товары
2013 -> Выражение гендерных характеристик в англоязычном "глянцевом" дискурсе
2013 -> Продакт Плейсмент и перспективы его развития в сети Интернет
2013 -> 1Лекции первого полугодия
2013 -> «Правовое рассмотрение компьютерного мошенничества», Ницца, 22 октября 1992 года, грамота «весьма достойно»


Поделитесь с Вашими друзьями:
1   2   3   4   5   6   7   8   9   ...   13


База данных защищена авторским правом ©nethash.ru 2019
обратиться к администрации

войти | регистрация
    Главная страница


загрузить материал