где Y=1/(1+2316419*ABS(Z))
и ABSQ = функция абсолютного значения;
ЕХР() = экспоненциальная функция.
При расчете вероятности мы всегда будем преобразовывать данные в стандартные единицы. То есть вместо функции N(X) мы будем использовать функцию
N(Z), где:
(3.16) Z=(X-U)/S,
где U = среднее значение данных;
S = стандартное отклонение данных;
Х = наблюдаемая точка данных.
Теперь обратимся к уравнению (3.21). Допустим, нам надо знать, какова вероятность события, не превышающего +2 стандартных единицы (Z = +2).
Y= 1/(1 +2316419*ABS(+2)) =1/1,4632838 =0,68339443311
(3.15a) N'(Z) = 0,398942 * ЕХР(-(+2^2/2))
= 0,398942 *ЕХР (-2)=0,398942*0,1353353=0,05399093525
Заметьте, мы можем найти высоту кривой при +2 стандартных единицах. Подставляя полученные значения вместо Y и N'(Z) в уравнение (3.21), мы можем получить вероятность события, не превышающего +2 стандартных единицы:
N(Z) = 1 - N'(Z) * ((1,330274429 * Y^ 5) -
- (1,821255978 * Y^4) + (1,781477937 * Y^ 3) -
- (0,356563782 * Y ^ 2) + (0,31938153 * Y))
= 1-0,05399093525* ((1,330274429* 0,68339443311^5)-
- (1,821255978 * 0,68339443311 ^ 4 + 1,781477937 * 0,68339443311^ 3) - - (0,356563782 * 0,68339443311 ^2) + 0,31938153 * 0,68339443311))
= 1 - 0,05399093525 * (1,330274429 * 0,1490587) -
- (1,821255978 * 0,2181151 + (1,781477937 * 0,3191643)-
- (0,356563782 * 0,467028 + 0,31938153 - 0,68339443311))
1- 0,05399093525 * (0,198288977 - 0,3972434298 + 0,5685841587 -
-0,16652527+0,2182635596)
= 1 - 0,05399093525 * 0,4213679955 = 1 - 0,02275005216= 0,9772499478
Таким образом, можно ожидать, что 97,72% результатов в нормально распределенном случайном процессе не попадают за +2 стандартные единицы. Это изображено на рисунке 3-8.
Чтобы узнать, какова вероятность события, равного или превышающего заданное число стандартных единиц (в нашем случае +2), надо просто изменить уравнение (3.21) и не использовать условие «Если Z < 0, то N(Z) = 1 - N(Z)». Поэтому вторая с конца строка в последнем расчете изменится с
= 1 - 0,02275005216 на 0,02275005216
Таким образом, с вероятностью 2,275% событие в нормально распределенном случайном процессе будет равно или превышать +2 стандартные единицы. Это показано на рисунке 3-9.
Рисунок 3-8 Уравнение (3.21) для вероятности Z=+2
Рисунок 3-9 Устранение оговорки «Если Z < 0, то N(Z) = 1 - N(Z)» в уравнении (3.21)
До сих пор мы рассматривали площади под кривой 1-хвостых распределений вероятности. То есть до настоящего момента мы отвечали на вопрос: «Какова вероятность события, которое меньше (больше) заданного количества стандартных единиц от среднего?» Предположим, теперь нам надо ответить на такой вопрос: «Какова вероятность события, которое находится в интервале между определенным количеством стандартных единиц от среднего?» Другими словами, мы хотим знать, как подсчитать 2-хвостые вероятности. Посмотрим на рисунок 3-10. Он представляет вероятности события в интервале двух стандартных единиц от среднего. В отличие от рисунка 3-8 этот расчет вероятности не включает крайнюю область левого хвоста, область меньше -2 стандартных единиц. Для расчета вероятности нахождения в диапазоне Z стандартных единиц от среднего вы должны сначала рассчитать 1-хвостую вероятность абсолютного значения Z с помощью уравнения (3.21), а затем полученное значение подставить в уравнение (3.22), которое дает 2-хвостые вероятности (то есть вероятности нахождения в диапазоне ABS(Z) стандартных единиц от среднего):
(3.22) 2-хвостая вероятность =1-((1- N(ABS(Z))) * 2)
Если мы рассматриваем вероятности наступления события в диапазоне 2 стандартных отклонений (Z = 2), то из уравнения (3.21) найдем, что N(2) = 0,9772499478 и можно использовать полученное значение для уравнения (3.22):
2-хвостая вероятность =1-((1- 0,9772499478) * 2) =1-(0,02275005216*2) = 1 - 0,04550010432 = 0,9544998957
Таким образом, из этого уравнения следует, что при нормально распределенном случайном процессе вероятность события, попадающего в интервал 2 стандартных единиц от среднего, составляет примерно 95,45%.
Как и в случае с уравнением (3.21), можно убрать первую единицу в уравнении (3.22), чтобы получить (1 - N(ABS(Z))) * 2, что представляет вероятности события вне ABS(Z) стандартных единиц от среднего. Это отображено на рисунке 3-11. Для нашего примера, где Z = 2, вероятность события при нормально распределенном случайном процессе вне 2 стандартных единиц составляет:
2-хвостая вероятность (вне) = (1 - 0,9772499478) * 2 =0,02275005216*2 =0,04550010432
Наконец, мы рассмотрим случай, когда надо найти вероятности (площадь под кривой N'(Z)) для двух различных значений Z.
Рисунок 3-10 2-хвостая вероятность события между +2 и -2 сигма
Рисунок 3-11 2-хвостая вероятность события, находящегося вне 2 сигма
Допустим, нам надо найти площадь под кривой N'(Z) между -1 стандартной единицей и +2 стандартными единицами. Есть два способа расчета. Мы можем рассчитать вероятность, не превышающую +2 стандартные единицы, при помощи уравнения (3.21) и вычесть вероятность, не превышающую -1 стандартную единицу (см. рисунок 3-12). Это даст нам:
0,9772499478 - 0,1586552595 = 0,8185946883
Рисунок 3-12 Площадь между -1 и +2 стандартными единицами
Другой способ: из единицы, представляющей всю площадь под кривой, надо вычесть вероятность, не превышающую -1 стандартную единицу, и вероятность, превышающую 2 стандартные единицы:
= 1 - (0,022750052 + 0,1586552595) = 1 -0,1814053117 =0,8185946883
С помощью рассмотренных в этой главе математических подходов вы сможете рассчитывать любые вероятности событий для случайных процессов, имеющих нормальное распределение.
Последующие производные нормального распределения
Иногда требуется знать вторую производную функции N(Z). Так как функция N(Z) дает нам значение площади под кривой при Z, а функция N'(Z) дает нам высоту самой кривой при значении Z, тогда функция N"(Z) дает нам мгновенный наклон (instantaneous slope) кривой при данном значении Z:
где ЕХР() = экспоненциальная функция.
Найдем наклон кривой N'(Z) при +2 стандартных отклонениях:
N"(Z) = -2 I 2,506628274 * ЕХР(-(+2^ 2) / 2) = -2 / 2,506628274 * ЕХР(-2) = -2 / 2,506628274 * 0,1353353 =-0,1079968336
Теперь мы знаем, что мгновенная скорость изменения функции N'(Z) при Z = +2 равна-0,1079968336. Это означает повышение/понижение за период, поэтому, когда Z = +2, кривая N'(Z) повышается на -0,1079968336. Эта ситуация показана на рисунке 3-13.
Последующие производные даются далее для справки. Они не будут использоваться в оставшейся части книги и представлены для полноты освещения темы:
В качестве последнего дополнения к сказанному о нормальном распределении стоит заметить, что на самом деле это распределение не такое остроконечное, как на графиках, представленных в данной главе. Реальная форма нормального распределения показана на рисунке 3-14. Отметьте, что здесь масштабы двух осей одинаковы, в то время как в других графических примерах они отличаются для придания более вытянутой формы.
Логарифмически нормальное распределение
Для торговли многие приложения требуют небольшой, но важной модификации нормального распределения.
Рисунок 3-13 N"(Z) дает наклон касательной к N'(Z) при Z = +2
Рисунок 3-14 Реальная форма нормального распределения
С помощью этой модификации нормальное распределение преобразуется в логарифмически нормальное распределение. Цена любого свободно котируемого инструмента имеет нулевое значение в качестве нижнего предела[13]. Поэтому когда цена этого инструмента падает и приближается к нулю, то, теоретически, цене инструмента должно быть все труднее понизиться. Рассмотрим некую акцию стоимостью 10 долларов. Если бы акция упала на 5 долларов до 5 долларов за акцию (50% понижение), то в соответствии с нормальным распределением она может также легко упасть с 5 долларов до 0 долларов. Однако при логарифмически нормальном распределении подобное падение на 50% с цены в 5 долларов за акцию до цены 2,50 долларов за акцию будет примерно таким же вероятным, как и падение с 10 долларов до 5 долларов за акцию.
Рисунок 3-15 Нормальное и логарифмически нормальное распределения
Логарифмически нормальное распределение, рисунок 3-15, работает точно так же, как и нормальное распределение, за тем исключением, что при логарифмически нормальном распределении мы имеем дело с процентными изменениями, а не абсолютными. Теперь рассмотрим движение вверх. В соответствии с логарифмически нормальным распределением движение с 10 долларов за акцию до 20 долларов за акцию аналогично движению с 5 долларов до 10 долларов за акцию, так как оба эти движения представляют повышение на 100%. Это не означает, что мы не будем использовать нормальное распределение. Мы просто познакомимся с логарифмически нормальным распределением, покажем его отличие от нормального (логарифмически нормальное распределение использует процентные, а не абсолютные изменения цены) и увидим, что обычно именно оно используется при обсуждении ценовых движений или в том случае, когда нормальное распределение ограничено снизу нулем. Для использования логарифмически нормального распределения необходимо преобразовывать данные, с которыми вы работаете, в натуральные логарифмы[14].
Преобразованные данные будут нормально распределяться, если необработанные данные распределялись логарифмически нормально. Если мы рассматриваем распределение изменений цены и оно логарифмически нормальное, то можно использовать нормальное распределение. Сначала мы должны разделить каждую цену закрытия на предыдущую цену закрытия. Допустим, мы рассматриваем распределение ежемесячных цен закрытия (можно использовать любой временной период: часовой, дневной, годовой и т.д.). Предположим, цены закрытия последних пяти месяцев — 10 долларов, 5 долларов, 10 долларов, 10 долларов и 20 долларов. Это соответствует понижению на 50% во втором месяце, повышению на 100% в третьем месяце, повышению на 0% в четвертом месяце и повышению на 100% в пятом месяце. Соответственно мы получим частные 0,5; 2; 1 и 2 по ежемесячным изменениям цен со второго по пятый месяцы. Это то же, что и HPR нашей последовательности. Теперь мы должны преобразовать их в натуральные логарифмы, чтобы изучить полученное распределение на основе математического аппарата нормального распределения. Таким образом, натуральный логарифм 0,5 равен -0,6931473, ln(2) =0,6931471 и ln(1) = 0. Теперь к распределению этих преобразованных данных мы можем применять математические методы, относящиеся к нормальному распределению.
Параметрическое оптимальное f
Мы немного познакомились с математикой нормального и логарифмически нормального распределения и теперь посмотрим, как находить оптимальное f по нормально распределенным результатам. Формула Келли является примером параметрического оптимального f, где f является функцией двух параметров. В формуле Келли вводные параметры — это процент выигрышных ставок и отношение выигрыша к проигрышу. Однако формула Келли даст вам оптимальное f только тогда, когда возможные результаты имеют бернуллиево распределение. Другими словами, формула Келли даст правильное оптимальное f, когда есть только два возможных результата, в противном случае, как, например, в нормально распределенных результатах, формула Келли не даст вам правильное оптимальное f[15].
Параметрические методы гораздо мощнее эмпирических. Рассмотрим ситуацию, которую можно полностью описать бернуллиевым распределением. Мы можем рассчитать оптимальное f либо из формулы Келли, либо с помощью эмпирического метода. Допустим, мы выигрываем 60% времени. Предположим, мы бросаем несимметричную монету, и при долгой последовательности 60% бросков будут приходиться на лицевую сторону. Поэтому мы каждый раз ставим на то, что монета будет выпадать на лицевую сторону, и выигрыш составляет 1:1. Из формулы Келли следует, что надо ставить 0,2 нашего счета. Также допустим, что из прошлых 20 бросков 11 выпали лицевой стороной, а 9 обратной. Если бы мы использовали эти 20 сделок в качестве вводных данных для эмпирического метода расчета f, результатом было бы то, что следует рисковать 0,1 нашего счета при каждой следующей ставке. Какое значение правильно, 0,2, полученное параметрическим методом (формула Келли с бернуллиевым распределением), или 0,1, найденное эмпирически на основе 20 последних бросков? Правильным ответом является значение 0,2, найденное с помощью параметрического метода. Причина в том, что каждый последующий бросок имеет 60% вероятность выпасть лицевой стороной, а не 55% вероятность, что следует из результатов 20 последних бросков. Хотя мы рассматриваем только 5% отклонение в вероятности, то есть 1 бросок из 20, результаты после применения разных значений f будут сильно отличаться. Вообще параметрические методы внутренне более точны, чем эмпирические (при условии, что мы знаем распределение результатов). Это первое преимущество параметрического метода. Самый большой недостаток параметрических методов состоит в том, что мы должны знать, каким распределение результатов будет в течение длительного времени. Второе преимущество состоит в том, что для эмпирического метода требуются исторические данные, в то время как для параметрического в этом нет необходимости. Кроме того, эта история должна быть довольно протяженной. В только
что рассмотренном примере можно предположить, что, если бы у нас была история 50 бросков, мы бы получили эмпирическое оптимальное f ближе к 0,2. При истории 1000 бросков оно было бы еще ближе. Тот факт, что эмпирические методы требуют довольно большого объема исторических данных, свел все их использование к механическим торговым системам. Тот, кто в торговле использует что-либо отличное от механических торговых систем, будь то волны Эллиотта или фундаментальные данные, практически не имеет возможности использовать метод оптимального f. С параметрическими методами дело обстоит иначе. Например, тот, кто желает слепо следовать какому-нибудь рыночному гуру, имеет теперь возможность использовать оптимальное f. В этом состоит третье преимущество параметрического метода — он может использоваться любым трейдером на любом рынке. В том случае, когда не используется механическая торговая система, следует помнить о важном допущении. Оно состоит в том, что будущее распределение прибылей и убытков будет напоминать распределение в прошлом (поэтому мы и рассчитываем оптимальное f), это может оказаться менее вероятным, чем в случае использования механической системы.
Все вышесказанное заставляет по-иному взглянуть на ожидаемую работу любого не полностью механического метода. Даже профессионалы («фундамента-листы», последователи Ганна или Эллиотта и т.п.), использующие такие методы, обречены на неудачу, если они находятся далеко справа от пика кривой f. Если они слишком далеко слева от пика, то получат геометрически более низкие прибыли, чем их опыт и навыки в этой области позволяют. Более того, практики не полностью механических методов должны понимать, что все сказанное об оптимальном f и чисто механических методах будет иметь прямое отношение и к их системам. Это надо учитывать при использовании подобных методов. Помните, что проигрыши могут быть значительными, но это не означает, что метод не следует применять.
Четвертое и, возможно, наибольшее преимущество параметрического метода определения оптимального f состоит в том, что параметрический метод позволяет создавать модели «что если». Например, вы решили торговать по рыночной системе, которая работала достаточно успешно, но хотите подготовиться к ситуации, когда эта рыночная система прекратит хорошо работать. Параметрические методы позволяют варьировать ваши вводные параметры для отражения возможных изменений, и благодаря этому показать, когда рыночная система прекратит хорошо работать. Еще раз повторюсь: параметрические методы намного мощнее эмпирических.
Зачем вообще использовать эмпирические методы? Они интуитивно более очевидны, чем параметрические. Следовательно, эмпирические методы необходимо изучать до перехода к параметрическим. Мы уже достаточно подробно рассмотрели эмпирический подход и поэтому готовы изучать параметрические методы.
Распределение торговых прибылей и убытков (P&L)
Рассмотрим следующую последовательность 232 торговых прибылей и убытков в пунктах. Не имеет значения, к какому товару или системе относится этот поток данных — это может быть любая система на любом рынке.
№ сделки P&L № сделки P&L № сделки P&L № сделки P&L 1. 0,18 25. 0,15 49. 0,17 73. 0,22 2. -1,11 26. 0,15 50. -1,53 74. 0,92 3. 0,42 27. -1,14 51. 0,15 75. 0,32 4. -0,83 28. 1,12 52. -0,93 76. 0,17 5. 1,42 29. -1,88 53. 0,42 77. 0,57 6. 0,42 30. 0,17 54. 2,77 78. 0,17 7. -0,99 31. 0,57 55. 8,52 79. 1,18 8. 0,87 32. 0,47 56. 2,47 80. 0,17 9. 0,92 33. -1,88 57. -2,08 81. 0,72 10. -0,4 34. 0,17 58. -1,88 82. -3,33 11. -1,48 35. -1,93 59. -1,88 83. -4,13 12. 1,87 36. 0,92 60. 1,67 84. -1,63 13. 1,37 37. 1,45 61. -1,88 85. -1,23 14. -1,48 38. 0,17 62. 3,72 86. 1,62 15. -0,21 39. 1,87 63. 2,87 87. 0,27 16. 1,82 40. 0,52 64. 2,17 88. 1,97 17. 0,15 41. 0,67 65. 1,37 89. -1,72 18. 0,32 42. -1,58 66. 1,62 90. 1,47 19. -1,18 43. -0,5 67. 0,17 91. -1,88 20. -0,43 44. 0,17 68. 0,62 92. 1,72 21. 0,42 45. 0,17 69. 0,92 93. 1,02 22. 0,57 46. -0,65 70. 0,17 94. 0,67 23. 4,72 47. 0,96 71. 1,52 95. 0,67 24. 12,42 48. -0,88 72. -1,78 96. -1,18
Продолжение № сделки P&L № сделки P&L № сделки P&L № сделки P&L 97. 3,22 126. -1,83 155. 0,37 184. 0,57 98. -4,83 127. 0,32 156. 0,87 185. 0,35 99. 8,42 128. 1,62 157. 1,32 186. 1,57 100. -1,58 158. 0,16 187. -1,73 101. -1,88 130. 1,02 159. 0,18 188. -0,83 102. 1,23 131. -0,81 160. 0,52 189. -1,18 103. 1,72 132. -0,74 161. -2,33 190. -0,65 104. 1,12 133. 1,09 162. 1,07 191. -0,78 105. -0,97 134. -1,13 163. 1,32 192. -1,28 106. -1,88 135. 0,52 164. 1,42 193. 0,32 107. -1,88 136. 0,18 165. 2,72 194. 1,24 108. 1,27 137. 0,18 166. 1,37 195. 2,05 109. 0,16 138. 1,47 167. -1,93 196. 0,75 110. 1,22 139. -1,07 168. 2,12 197. 0,17 111. -0,99 140. -0,98 169. 0,62 198. 0,67 112. 1,37 141. 1,07 170. 0,57 199. -0,56 113. 0,18 142. -0,88 171. 0,42 200. -0,98 114. 0,18 143. -0,51 172. 1,58 201. 0,17 115. 2,07 144. 0,57 173. 0,17 202. -0,96 116. 1,47 145. 2,07 174. 0,62 203. 0,35 117. 4,87 146. 0,55 175. 0,77 204. 0,52 118. -1,08 147. 0,42 176. 0,37 205. 0,77 119. 1,27 148. 1,42 177. -1,33 206. 1,10 120. 0,62 149. 0,97 178. -1,18 207. -1,88 121. -1,03 150. 0,62 179. 0,97 208. 0,35 122. 1,82 151. 0,32 180. 0,70 209. 0,92 123. 0,42 152. 0,67 181. 1,64 210. 1,55 124. -2,63 153. 0,77 182. 0,57 211. 1,17 125. -0,73 154. 0,67 183. 0,24 212. 0,67
Продолжение № сделки P&L № сделки P&L № сделки P&L № сделки P&L 213. 0,82 218. 0,25 223. -1,30 228. 1,80 214. -0,98 219. 0,14 224. 0,37 229. 2,12 215. -0,85 220. 0,79 225. -0,51 230. 0,77 216. 0,22 221. -0,55 226. 0,34 231. -1,33 217. -1,08 222. 0,32 227. -1,28 232. 1,52
Если мы хотим определить приведенное параметрическое оптимальное f, нам придется преобразовать эти торговые прибыли и убытки в процентные повышения и понижения (основываясь на уравнениях с (2.10а) по (2.10в)). Затем мы преобразуем эти процентные прибыли и убытки, умножив их на текущую цену базового инструмента. Например, P&L № 1 составляет 0,18. Допустим, что цена входа в эту сделку была 100,50. Таким образом, процентное повышение по этой сделке будет 0,18/100,50 = 0,001791044776. Теперь предположим, что текущая цена базового инструмента составляет 112,00. Умножив 0,001791044776 на 112,00, мы получаем приведенное P&L = 0,2005970149. Чтобы получить полные приведенные данные, необходимо проделать эту процедуру для всех 232 торговых прибылей и убытков.