Это заготовка статьи. Вы можете помочь проекту, дополнив её. Это примечание по возможности следует заменить более точным. |
Задача о разорении игрока — задача из области теории вероятностей.
Формулировка
За столом сидят два игрока. У первого в распоряжении находится −A{displaystyle -A} (A<0{displaystyle A<0}) рублей, у другого — B{displaystyle B} рублей. Перед ними на столе лежит асимметричная монета (вероятность, что выпадет аверс, может равняться любому числу от 0 до 1 включительно). Если на монете выпадает аверс, то рубль выигрывает первый игрок (второй игрок выплачивает первому 1 рубль), а если выпадает реверс, то первый игрок платит второму один рубль. Требуется найти вероятность того, что один из игроков проиграется в ноль за n{displaystyle n} шагов, и вероятность проигрыша каждого азартного игрока. Также необходимо вычислить среднюю длину игры.
Данная ситуация может быть смоделирована подобным образом: имеется блуждающая частица и коридор [A;B]{displaystyle [A;B]}. Рассматривается вероятность того, что частица выйдет из коридора за n{displaystyle n} шагов (проскочит через верхнюю или нижнюю стенку).
Схема Бернулли
Рассмотрим схему Бернулли с n{displaystyle n} испытаниями. Пусть (Ω,A,P){displaystyle (Omega ,{mathcal {A}},mathbb {P} )} — вероятностное пространство, где Ω={ω:ω=(x1;…;xn), xi=±1}{displaystyle Omega ={bigl {}omega colon omega =(x_{1};ldots ;x_{n}), x_{i}=pm 1{bigr }}}. A={Ai⊆Ω}{displaystyle {mathcal {A}}={A_{i}subseteq Omega }} — алгебра подмножеств вероятностного пространства. Вероятность задана следующим образом: P({ω})=pν(ω)⋅qn−ν(ω){displaystyle mathbb {P} {bigl (}{omega }{bigr )}=p^{nu (omega )}cdot q^{n-nu (omega )}}, где ν(ω){displaystyle nu (omega )} — количество выпавших в данной последовательность единиц: ν(ω)=∑i=1nxi+n2{displaystyle nu (omega )={frac {sum limits _{i=1}^{n}x_{i}+n}{2}}}. Данная формула позволяет считать количество единиц: ν(ω){displaystyle nu (omega )} превращает соответственно полученные значения (+1;−1){displaystyle (+1;-1)} в (1;0){displaystyle (1;0)} и затем уже считает полученные единицы. Введём последовательность бернуллиевских случайных величин ξi(ω):i=1;n¯;P({ξi=1})=p;P({ξi=−1})=q;p+q=1.{displaystyle xi _{i}(omega )colon i={overline {1;n}};quad mathbb {P} {bigl (}{xi _{i}=1}{bigr )}=p;quad mathbb {P} {bigl (}{xi _{i}=-1}{bigr )}=q;quad p+q=1.}
Подзадача о нормированности вероятности
Доказать, что ∑ω∈ΩP({ω})=1.{displaystyle sum limits _{omega in Omega }mathbb {P} {bigl (}{omega }{bigr )}=1.}
Решение. ∑ω∈ΩP({ω})=∑ω∈Ωp∑i=1nxi+n2⋅qn−∑i=1nxi+n2=∑k=0n∑ω∈Akp∑i=1n(xi+1)2⋅q∑i=1n(1−xi)2=∑k=0nCnkpkqn−k.{displaystyle sum limits _{omega in Omega }mathbb {P} {bigl (}{omega }{bigr )}=sum limits _{omega in Omega }p^{frac {sum limits _{i=1}^{n}x_{i}+n}{2}}cdot q^{n-{frac {sum limits _{i=1}^{n}x_{i}+n}{2}}}=sum limits _{k=0}^{n}sum limits _{omega in A_{k}}p^{frac {sum limits _{i=1}^{n}(x_{i}+1)}{2}}cdot q^{frac {sum limits _{i=1}^{n}(1-x_{i})}{2}}=sum limits _{k=0}^{n}C_{n}^{k}p^{k}q^{n-k}.} Это справедливо в силу того, что xi+12∈{0;1}.{displaystyle {frac {x_{i}+1}{2}}in {0;1}.} ∑k=0nCnkpkqn−k=(p+q)n=1{displaystyle sum limits _{k=0}^{n}C_{n}^{k}p^{k}q^{n-k}=(p+q)^{n}=1}, поскольку по условию p+q=1{displaystyle p+q=1}. ◼{displaystyle blacksquare }
Подзадача о независимости случайных величин ξi{displaystyle xi _{i}}
Доказать, что ξ1{displaystyle xi _{1}} и ξ2{displaystyle xi _{2}} независимы.
Решение. Достаточно доказать, что P({ξ1=1}∩{ξ2=1})=P({ξ1=1})P({ξ2=1}).{displaystyle mathbb {P} {bigl (}{xi _{1}=1}cap {xi _{2}=1}{bigr )}=mathbb {P} {bigl (}{xi _{1}=1}{bigr )}mathbb {P} {bigl (}{xi _{2}=1}{bigr )}.}
P({ξ1=1}∩{ξ2=1})=P({ω:ω=(x1;…;xn), x1=1, x2=1})={displaystyle mathbb {P} {bigl (}{xi _{1}=1}cap {xi _{2}=1}{bigr )}=mathbb {P} {bigl (}{omega colon omega =(x_{1};ldots ;x_{n}), x_{1}=1, x_{2}=1}{bigr )}=} |
=∑x3=±1…xn=±1p2+∑i=3nxi+n2⋅qn−2+∑i=3nxi+n2=p2∑x3=±1…xn=±1p∑i=3nxi+(n−2)2⋅q(n−2)−∑i=3nxi+(n−2)2=p2⋅1.{displaystyle =sum limits _{begin{smallmatrix}x_{3}=pm 1\ldots {}\x_{n}=pm 1end{smallmatrix}}p^{frac {2+sum limits _{i=3}^{n}x_{i}+n}{2}}cdot q^{n-{frac {2+sum limits _{i=3}^{n}x_{i}+n}{2}}}=p^{2}sum limits _{begin{smallmatrix}x_{3}=pm 1\ldots {}\x_{n}=pm 1end{smallmatrix}}p^{frac {sum limits _{i=3}^{n}x_{i}+(n-2)}{2}}cdot q^{(n-2)-{frac {sum limits _{i=3}^{n}x_{i}+(n-2)}{2}}}=p^{2}cdot 1.} ◼{displaystyle blacksquare } |
Случайное блуждание
Введём новое обозначение: S0=0{displaystyle S_{0}=0}, Sk=ξ1+…+ξk,1⩽k⩽n{displaystyle S_{k}=xi _{1}+ldots {}+xi _{k},quad 1leqslant kleqslant n}. n{displaystyle n} — длина игры, а последовательность (Sk)k⩽n{displaystyle (S_{k})_{kleqslant n}} можно рассматривать как траекторию случайного блуждания некоторой частицы, выходящей из нуля. При этом Sk+1=Sk+ξk+1{displaystyle S_{k+1}=S_{k}+xi _{k+1}}. Пусть A{displaystyle A}, B{displaystyle B} — два целых числа, A⩽0{displaystyle Aleqslant 0}, B⩾0{displaystyle Bgeqslant 0}. Требуется найти, с какой вероятностью за n{displaystyle n} шагов будет осуществлён выход частицы из коридора, ограниченного A{displaystyle A} и B{displaystyle B}. Если ξi=+1{displaystyle xi _{i}=+1}, то второй игрок платит первому. Если ξi=−1{displaystyle xi _{i}=-1}, то первый игрок платит второму. Поэтому Sk{displaystyle S_{k}} может рассматриваться в качестве выигрыша первого игрока у второго (который, естественно, может быть отрицательным). Далее, пусть x{displaystyle x} — целое число, x∈Z∩[A;B]{displaystyle xin mathbb {Z} cap [A;B]}. Пусть также для 0⩽k⩽n{displaystyle 0leqslant kleqslant n} верно, что Skx=x+Sk{displaystyle S_{k}^{x}=x+S_{k}} (что означает, что игроки начинали играть с ненулевым капиталом в распоряжении). Пусть τkx=min{l:0⩽l⩽k,Slx={A or B}}{displaystyle tau _{k}^{x}=min {bigl {}lcolon 0leqslant lleqslant k,S_{l}^{x}={Amathrm {~or~} B}{bigr }}}. Условимся считать, что τkx=k{displaystyle tau _{k}^{x}=k}, если A<Slx<B∀l:0⩽l⩽k{displaystyle A<S_{l}^{x}<Bquad forall lcolon 0leqslant lleqslant k}. Если частица так и не пересекла границы, то xk{displaystyle x_{k}} не определён.
Для каждого 0⩽k⩽n{displaystyle 0leqslant kleqslant n} и x∈[A;B]∩Z{displaystyle xin [A;B]cap mathbb {Z} } момент τkx{displaystyle tau _{k}^{x}} называется моментом остановки, который является случайной величиной, определённой на пространстве элементарных событий Ω{displaystyle Omega }. ∀l<k{ω:τkx=l}{displaystyle forall l<kquad {omega colon tau _{k}^{x}=l}} — это событие, состоящее в том, что случайное блуждание {Six:0⩽i⩽k}{displaystyle {S_{i}^{x}colon 0leqslant ileqslant k}}, начинающееся в точке x{displaystyle x}, выйдет из интервала [A;B]{displaystyle [A;B]} в момент l{displaystyle l}. Введём новые обозначения: Akx=∐0⩽l⩽k{ω:τkx=l, Slx=A}{displaystyle {mathcal {A}}_{k}^{x}=coprod limits _{0leqslant lleqslant k}{omega colon tau _{k}^{x}=l, S_{l}^{x}=A}}, Bkx=∐0⩽l⩽k{ω:τkx=l, Slx=B}{displaystyle {mathcal {B}}_{k}^{x}=coprod limits _{0leqslant lleqslant k}{omega colon tau _{k}^{x}=l, S_{l}^{x}=B}} для 0⩽k⩽n{displaystyle 0leqslant kleqslant n}. Пусть αk(x)=P(Akx){displaystyle alpha _{k}(x)=mathbb {P} ({mathcal {A}}_{k}^{x})}, βk(x)=P(Bkx){displaystyle beta _{k}(x)=mathbb {P} ({mathcal {B}}_{k}^{x})} — вероятности выхода частицы за время [0;k]{displaystyle [0;k]} из интервала [A;B]{displaystyle [A
;B]} соответственно в точках A{displaystyle A} и B{displaystyle B}.
Пусть A<x<B{displaystyle A<x<B}; очевидно, что α0(x)=β0(x)=0{displaystyle alpha _{0}(x)=beta _{0}(x)=0} (пока игра не началась, частица находится внутри интервала с вероятностью 1). Пусть теперь 0⩽k⩽n{displaystyle 0leqslant kleqslant n}. Тогда по формуле полной вероятности βk(x)=P(Bkx)=P(Bkx∣S1x=x+1)⋅P({ξ1=1})+P(Bkx∣S1x=x−1)⋅P({ξ1=−1}).{displaystyle beta _{k}(x)=mathbb {P} ({mathcal {B}}_{k}^{x})=mathbb {P} ({mathcal {B}}_{k}^{x}mid S_{1}^{x}=x+1)cdot mathbb {P} {bigl (}{xi _{1}=1}{bigr )}+mathbb {P} ({mathcal {B}}_{k}^{x}mid S_{1}^{x}=x-1)cdot mathbb {P} {bigl (}{xi _{1}=-1}{bigr )}.}
Подзадача о рекуррентности
Доказать, что (1) P(Bkx∣S1x=x+1)=P(Bk−1x+1){displaystyle mathbb {P} ({mathcal {B}}_{k}^{x}mid S_{1}^{x}=x+1)=mathbb {P} ({mathcal {B}}_{k-1}^{x+1})} и (2) P(Bkx∣S1x=x−1)=P(Bk−1x−1){displaystyle mathbb {P} ({mathcal {B}}_{k}^{x}mid S_{1}^{x}=x-1)=mathbb {P} ({mathcal {B}}_{k-1}^{x-1})}.
Доказательство.
(1) Докажем, что P(Bkx∣S1x=x+1)=P(Bk−1x+1){displaystyle mathbb {P} ({mathcal {B}}_{k}^{x}mid S_{1}^{x}=x+1)=mathbb {P} ({mathcal {B}}_{k-1}^{x+1})}. Bkx={ω:(x;x+ξ1;…;x+ξ1+…+ξk)∈Bkx}{displaystyle {mathcal {B}}_{k}^{x}={bigl {}omega colon (x;x+xi _{1};ldots {};x+xi _{1}+ldots {}+xi _{k})in B_{k}^{x}{bigr }}}, где Bkx{displaystyle B_{k}^{x}} — множество траекторий вида (x;x+x1;…;x+x1+…+xk),xi=±1{displaystyle (x;x+x_{1};ldots {};x+x_{1}+ldots {}+x_{k}),quad x_{i}=pm 1}, которые за время [0;k]{displaystyle [0;k]} впервые выходят из интервала (A;B){displaystyle (A;B)} в точке B{displaystyle B} (показано на рисунке). Если случайный вектор попадает в подходящую траекторию, то он попадает в множество B{displaystyle {mathcal {B}}}. Представим множество Bkx{displaystyle B_{k}^{x}} как Bkx;x+1⊔Bkx;x−1{displaystyle B_{k}^{x;x+1}sqcup B_{k}^{x;x-1}}. Дизъюнктное объединение правомерно по причине того, что у любой частицы, проходящей по траектории, x1=±1{displaystyle x_{1}=pm 1}. Bkx;x+1{displaystyle B_{k}^{x;x+1}} — те траектории из Bkx{displaystyle B_{k}^{x}}, для которых x1=1{displaystyle x_{1}=1}. Bkx;x−1{displaystyle B_{k}^{x;x-1}} — те траектории из Bkx{displaystyle B_{k}^{x}}, для которых x1=−1{displaystyle x_{1}=-1}. Заметим, что каждая траектория (x;x+1;x+1+x2;…;x+1+x2+…+xk){displaystyle (x;x+1;x+1+x_{2};ldots {};x+1+x_{2}+ldots +x_{k})} из Bkx;x+1{displaystyle B_{k}^{x;x+1}} находится в однозначном соответствии с траекторией (x+1;x+1+x2;…;x+1+x2+…+xk){displaystyle (x+1;x+1+x_{2};ldots {};x+1+x_{2}+ldots +x_{k})} из Bk−1x+1{displaystyle B_{k-1}^{x+1}}. Взаимно-однозначное соответствие доказывается от противного. Предположим, что x1=−1{displaystyle x_{1}=-1} (неоднозначное соответствие); тогда данная траектория (x;x−1;x−1+x2;…;x−1+x2+…+xk){displaystyle (x;x-1;x-1+x_{2};ldots ;x-1+x_{2}+ldots +x_{k})} не сможет вывести частицу из коридора за k{displaystyle k} шагов (а только лишь за k+2{displaystyle k+2} из-за изначального отдаления от верхней стенки коридора). В обратную сторону соответствие является также однозначным из определения: Sk+1=Sk+ξk+1{displaystyle S_{k+1}=S_{k}+xi _{k+1}}. Из этого следует, что P({(x+1;x+1+x2;…;x+1+x2+…+xk)∈Bk−1x+1})=P(bigl{(x+1;x+1+x1;…;x+1+x1+…+xk−1)∈Bk−1x+1})=defP(Bk−1x+1){displaystyle mathbb {P} {Bigl (}{big {}(x+1;x+1+x_{2};ldots ;x+1+x_{2}+ldots +x_{k})in B_{k-1}^{x+1}{bigr }}{Bigr )}=mathbb {P} {Bigl (}bigl{(x+1;x+1+x_{1};ldots ;x+1+x_{1}+ldots +x_{k-1})in B_{k-1}^{x+1}{bigr }}{Bigr )}{mathrel {stackrel {rm {def}}{=}}}mathbb {P} ({mathcal {B}}_{k-1}^{x+1})} (так как ξi{displaystyle xi _{i}} суть независимые одинаково распределённые случайные величины).
Существует и другой способ доказательства:
P(Bkx∣S1x=x+1)=P(Bkx∣ξ1=1)=P((x;x+ξ1;…;x+ξ1+…+ξk)∈Bkx∣ξ1=1)={displaystyle mathbb {P} ({mathcal {B}}_{k}^{x}mid S_{1}^{x}=x+1)=mathbb {P} ({mathcal {B}}_{k}^{x}mid xi _{1}=1)=mathbb {P} {bigl (}(x;x+xi _{1};ldots {};x+xi _{1}+ldots {}+xi _{k}) in B_{k}^{x}mid xi _{1}=1{bigr )}=} |
=P((x;x+ξ1;…;x+ξ1+…+ξk)∈Bkx∩ξ1=1)P({ξ1=1})=P((x;x+1;…;x+1+…+ξk)∈Bkx∩ξ1=1)P({ξ1=1})={displaystyle ={frac {mathbb {P} {bigl (}(x;x+xi _{1};ldots {};x+xi _{1}+ldots {}+xi _{k})in B_{k}^{x}cap xi _{1}=1{bigr )}}{mathbb {P} ({xi _{1}=1})}}={frac {mathbb {P} {bigl (}(x;x+1;ldots {};x+1+ldots {}+xi _{k})in B_{k}^{x}cap xi _{1}=1{bigr )}}{mathbb {P} ({xi _{1}=1})}}=} |
=P({(x;x+1;x+1+ξ2;…;x+1+ξ2+…+ξk)∈Bkx})=P({(x;x+1;x+1+ξ1;…;x+1+ξ1+…+ξk−1)∈Bkx})={displaystyle =mathbb {P} {bigl (}{(x;x+1;x+1+xi _{2};ldots {};x+1+xi _{2}+ldots {}+xi _{k})in B_{k}^{x}}{bigr )}=mathbb {P} {bigl (}{(x;x+1;x+1+xi _{1};ldots {};x+1+xi _{1}+ldots {}+xi _{k-1})in B_{k}^{x}}{bigr )}=} |
=P({(x;x+1;x+1+ξ1;…;x+1+ξ1+…+ξk−1)∈Bk−1x+1})=P(Bk−1x+1)=βk−1(x+1){displaystyle =mathbb {P} {bigl (}{(x;x+1;x+1+xi _{1};ldots {};x+1+xi _{1}+ldots {}+xi _{k-1})in B_{k-1}^{x+1}}{bigr )}=mathbb {P} ({mathcal {B}}_{k-1}^{x+1})=beta _{k-1}(x+1)}. |
Это справедливо потому, что вероятности независимы (это было доказано ранее).
(2) Аналогично докажем, что P(Bkx∣S1x=x−1)=P(Bk−1x+1){displaystyle mathbb {P} ({mathcal {B}}_{k}^{x}mid S_{1}^{x}=x-1)=mathbb {P} ({mathcal {B}}_{k-1}^{x+1})}. Каждая траектория (x;x−1;x−1+x2;…;x−1+x2+…+xk){displaystyle (x;x-1;x-1+x_{2};ldots {};x-1+x_{2}+ldots +x_{k})} из Bkx;x+1{displaystyle B_{k}^{x;x+1}} находится в однозначном соответствии с траекторией (x−1;x−1+x2;…;x−1+x2+…+xk){displaystyle (x-1;x-1+x_{2};ldots {};x-1+x_{2}+ldots +x_{k})} из Bk−1x−1{displaystyle B_{k-1}^{x-1}}. Отсюда P({(x−1;x−1+x2;…;x−1+x2+…+xk)∈Bk−1x−1})=P({(x−1;x−1+x1;…;x−1+x1+…+xk−1)∈Bk−1x−1})=defP(Bk−1x−1).{displaystyle mathbb {P} {Bigl (}{bigl {}(x-1;x-1+x_{2};ldots ;x-1+x_{2}+ldots +x_{k})in B_{k-1}^{x-1}{bigr }}{Bigr )}=mathbb {P} {Bigl (}{bigl {}(x-1;x-1+x_{1};ldots ;x-1+x_{1}+ldots +x_{k-1})in B_{k-1}^{x-1}{bigr }}{Bigr )}{mathrel {stackrel {rm {def}}{=}}}mathbb {P} ({mathcal {B}}_{k-1}^{x-1}).} ◼{displaystyle blacksquare }
Вывод рекуррентного соотношения
Из уравнения для βk(x){displaystyle beta _{k}(x)} следует, что для x∈(A;B){displaystyle xin (A;B)} и k⩽n{displaystyle kleqslant n} верно:P(Bkx)=P(Bkx∣S1x=x+1)⋅p+P(Bkx∣S1x=x−1)⋅q=P(Bk−1x+1)⋅p+P(Bk−1x−1)⋅q=pβk−1(x+1)+qβk−1(x−1).{displaystyle mathbb {P} ({mathcal {B}}_{k}^{x})=mathbb {P} ({mathcal {B}}_{k}^{x}mid S_{1}^{x}=x+1)cdot p+mathbb {P} ({mathcal {B}}_{k}^{x}mid S_{1}^{x}=x-1)cdot q=mathbb {P} ({mathcal {B}}_{k-1}^{x+1})cdot p+mathbb {P} ({mathcal {B}}_{k-1}^{x-1})cdot q=pbeta _{k-1}(x+1)+qbeta _{k-1}(x-1).}
βl(B)=1{displaystyle beta _{l}(B)=1}, βl(A)=0{displaystyle beta _{l}(A)=0} для l∈[0;n]{displaystyle lin [0;n]}. Формула полной вероятности также даёт нам следующий результат: αk(x)=pαk−1(x+1)+qαk−1(x−1){displaystyle alpha _{k}(x)=palpha _{k-1}(x+1)+qalpha _{k-1}(x-1)}. Также отметим, что Bk−1⊂Bk{displaystyle {mathcal {B}}_{k-1}subset {mathcal {B}}_{k}}, и поэтому βk−1(x)⩽βk(x)⩽1{displaystyle beta _{k-1}(x)leqslant beta _{k}(x)leqslant 1} для k⩽n{displaystyle kleqslant n}. Это утверждение верно, так как к любой траектории, выводящей частицу за меньшее количество шагов, можно прибавить в начало один шаг (xj−1=±1{displaystyle x_{j-1}=pm 1}), на котором частица может прийти в точку (j;Sjx){displaystyle (j;S_{j}^{x})} как из (j−1;Sjx−1){displaystyle (j-1;S_{j}^{x}-1)} (для ξj=1{displaystyle xi _{j}=1}), так и из (j−1;Sjx+1){displaystyle (j-1;S_{j}^{x}+1)} (j⩽k{displaystyle jleqslant k}).
Нахождение вероятностей
При достаточно больших n{displaystyle n} вероятность βn(x){displaystyle beta _{n}(x)} близка к β(x){displaystyle beta (x)} — решению уравнения β(x)=pβ(x+1)+qβ(x−1){displaystyle beta (x)=pbeta (x+1)+qbeta (x-1)} при тех условиях, что β(B)=1{displaystyle beta (B)=1} (выход произошёл сразу же из точки B{displaystyle B} — конец игры, выиграл первый игрок), β(A)=0{displaystyle beta (A)=0} (первый игрок никогда не выиграет, если выход произойдёт мгновенно в точке A{displaystyle A}). Эти условия следуют из того, что liml→∞βl(B)=β(B){displaystyle lim limits _{lrightarrow infty }beta _{l}(B)=beta (B)}. Это также будет доказано в этом разделе.
Сначала получим решение уравнения β(x)=pβ(x+1)+qβ(x−1){displaystyle beta (x)=pbeta (x+1)+qbeta (x-1)}. Пусть игра несправедливая (p≠q{displaystyle pneq q}). В таком случае найдём корни уравнения, то есть β(x){displaystyle beta (x)}. Одно частное решение видно сразу: β(x)=const=a{displaystyle beta (x)=mathrm {const} =a}. Другое решение найдём, воспользовавшись тем, что β(x){displaystyle beta (x)} — функция. Целесообразно употребить выражение с отношением qp{displaystyle {frac {q}{p}}}, учитывая, что p+q=1{displaystyle p+q=1}: (qp)x=qx(p+q)px=qxpx−1+qx+1px=pqx+1px+1+qqx−1px−1=p(qp)x+1+q(qp)x−1{displaystyle left({frac {q}{p}}right)^{x}={frac {q^{x}(p+q)}{p^{x}}}={frac {q^{x}}{p^{x-1}}}+{frac {q^{x+1}}{p^{x}}}=p{frac {q^{x+1}}{p^{x+1}}}+q{frac {q^{x-1}}{p^{x-1}}}=pleft({frac {q}{p}}right)^{x+1}+qleft({frac {q}{p}}right)^{x-1}}. Отсюда правомерно предположить, что β(x)=b⋅(qp)x{displaystyle beta (x)=bcdot left({frac {q}{p}}right)^{x}}. Добавление константы ничего не изменит благодаря тому, что p+q=1{displaystyle p+q=1}.
Теперь рассмотрим общее решение: β(x)=a+b(qp)x{displaystyle beta (x)=a+bleft({frac {q}{p}}right)^{x}}. Воспользуемся теми условиями, что β(A)=a+b(qp)A=0{displaystyle beta (A)=a+bleft({frac {q}{p}}right)^{A}=0} и β(B)=a+b(qp)B=1{displaystyle beta (B)=a+bleft({frac {q}{p}}right)^{B}=1}, и получим, что β(x)=β(x)−01−0=β(x)−β(A)β(B)−β(A)=a+b(qp)x−(a+b(qp)A)a+b(qp)B−(a+b(qp)A)=(qp)x−(qp)B(qp)x−(qp)A.{displaystyle beta (x)={frac {beta (x)-0}{1-0}}={frac {beta (x)-beta (A)}{beta (B)-beta (A)}}={frac {a+bleft({frac {q}{p}}right)^{x}-left(a+bleft({frac {q}{p}}right)^{A}right)}{a+bleft({frac {q}{p}}right)^{B}-left(a+bleft({frac {q}{p}}right)^{A}right)}}={frac {left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{B}}{left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{A}}}.}
Подзадача о единственности решения
Докажем единственность решения данной задачи. Для этого покажем, что любое решение задачи β(x)=pβ(x+1)+qβ(x−1){displaystyle beta (x)=pbeta (x+1)+qbeta (x-1)} с граничными условиями может быть представлено в виде (qp)x−(qp)B(qp)x−(qp)A{displaystyle {frac {left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{B}}{left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{A}}}}.
Решение. Рассмотрим некоторое решение βˇ(x){displaystyle {check {beta }}(x)} при условиях βˇ(A)=0{displaystyle {check {beta }}(A)=0}, βˇ(B)=1{displaystyle {check {beta }}(B)=1}. Тогда всегда можно подобрать такие константы aˇ{displaystyle {check {a}}} и bˇ{displaystyle {check {b}}}, что aˇ+bˇ(qp)A=βˇ(A){displaystyle {check {a}}+{check {b}}left({frac {q}{p}}right)^{A}={check {beta }}(A)}, aˇ+bˇ(qp)A+1=βˇ(A+1){displaystyle {check {a}}+{check {b}}left({frac {q}{p}}right)^{A+1}={check {beta }}(A+1)}. Тогда из уравнения поставленной задачи следует, что βˇ(A+2)=aˇ+bˇ(qp)A+2{displaystyle {check {beta }}(A+2)={check {a}}+{check {b}}left({frac {q}{p}}right)^{A+2}}. Тогда в общем случае βˇ(x)=aˇ+bˇ(qp)x{displaystyle {check {beta }}(x)={check {a}}+{check {b}}left({frac {q}{p}}right)^{x}}. Следовательно, решение (qp)x−(qp)B(qp)x−(qp)A{displaystyle {frac {left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{B}}{left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{A}}}} является единственным. Точно такой же ход рассуждений может быть применён и к α(x){displaystyle alpha (x)}. ◼{displaystyle blacksquare }
Предельная сходимость
Рассмотрим вопрос о быстроте предельной сходимости αn(x){displaystyle alpha _{n}(x)} и βn(x){displaystyle beta _{n}(x)} к α(x){displaystyle alpha (x)} и β(x){displaystyle beta (x)}. Пусть блуждание начинается из начала координат (x=0{displaystyle x=0}). Для простоты обозначим αn(0)=αn{displaystyle alpha _{n}(0)=alpha _{n}}, βn(0)=βn{displaystyle beta _{n}(0)=beta _{n}}, γn=1−αn−βn{displaystyle gamma _{n}=1-alpha _{n}-beta _{n}}. Иными словами, γn{displaystyle gamma _{n}} — это единица минус сумма вероятностей выхода частицы из коридора — вероятность того, что она останется блуждать в коридоре: γn=P{ω:A<Sk<B;0⩽k⩽n}{displaystyle gamma _{n}=mathbb {P} {omega colon A<S_{k}<B;0leqslant kleqslant n}}. ω{displaystyle omega } представляет собой событие ⋂0⩽k⩽n{A<Sk<B}{displaystyle bigcap limits _{0leqslant kleqslant n}{A<S_{k}<B}}. Рассмотрим число n=rm{displaystyle n=rm}, где r,m∈Z{displaystyle r,min mathbb {Z} }, и цепочку случайных величин ζn:ζ1=∑i=1mξi, ζ2=∑i=m+12mξi, …, ζr=∑i=m(r−1)rmξi{displaystyle zeta _{n}colon zeta _{1}=sum limits _{i=1}^{m}xi _{i},~zeta _{2}=sum limits _{i=m+1}^{2m}xi _{i},~ldots {},~zeta _{r}=sum limits _{i=m(r-1)}^{rm}xi _{i}}. Если обозначить совокупное богатство за C=|A|+B{displaystyle C=|A|+B}, то тогда {A<Sk<B;1⩽k⩽rm}⊆{|ζ1|<C;…;|ζr|<C}{displaystyle {A<S_{k}<B;1leqslant kleqslant rm}subseteq {bigl {}|zeta _{1}|<C;ldots {};|zeta _{r}|<C{bigr }}}. Этому есть разумное объяснение: если частица выходит из нуля и не пересекает границ, то тогда совершенно определённо сумма m{displaystyle m} штук xi{displaystyle x_{i}} меньше, чем совокупный запас.
Подзадача о независимости случайных величин ζi{displaystyle zeta _{i}}
Докажем, что ζj{displaystyle zeta _{j}} независимы и одинаково распределённые. Достаточно доказать, что они независимы, так как все они имеют биномиальное распределение.
Решение. Докажем, что P({ζ1=m}∩{ζ2=m})=P({ζ1=m})⋅P({ζ2=m}).{displaystyle mathbb {P} {bigl (}{zeta _{1}=m}cap {zeta _{2}=m}{bigr )}=mathbb {P} {bigl (}{zeta _{1}=m}{bigr )}cdot mathbb {P} {bigl (}{zeta _{2}=m}{bigr )}.}
P({ζ1=m}∩{ζ2=m})=P({∑i=1mξi=m}∩{∑i=m+12mξi=m})={displaystyle mathbb {P} {bigl (}{zeta _{1}=m}cap {zeta _{2}=m}{bigr )}=mathbb {P} left(left{sum limits _{i=1}^{m}xi _{i}=mright}cap left{sum limits _{i=m+1}^{2m}xi _{i}=mright}right)=} |
=P({ξ1;…;m=1}∩{ξm+1;…;2m=1})=P2m({ξi=1})=P({ζ1=m})⋅P({ζ2=m}){displaystyle =mathbb {P} {bigl (}{xi _{1;ldots ;m}=1}cap {xi _{m+1;ldots ;2m}=1}{bigr )}=mathbb {P} ^{2m}{bigl (}{xi _{i}=1}{bigr )}=mathbb {P} {bigl (}{zeta _{1}=m}{bigr )}cdot mathbb {P} {bigl (}{zeta _{2}=m}{bigr )}}. ◼{displaystyle blacksquare } |
Вернёмся к рассмотрению сходимости. γn⩽P({|ζ1|;…;|ζr|<C})=∏i=1rP({|ζi|<C})=(P({|ζ1|<C}))r{displaystyle gamma _{n}leqslant mathbb {P} {Bigl (}{bigl {}|zeta _{1}|;ldots ;|zeta _{r}|<C{bigr }}{Bigr )}=prod limits _{i=1}^{r}mathbb {P} {Bigl (}{bigl {}|zeta _{i}|<C{bigr }}{Bigr )}={biggl (}mathbb {P} {Bigl (}{bigl {}|zeta _{1}|<C{bigr }}{Bigr )}{biggr )}^{r}}, что следует из только что доказанного. Рассмотрим дисперсию: D(ζ1)=m(1−(p−q)2){di
splaystyle D(zeta _{1})=m{bigl (}1-(p-q)^{2}{bigr )}} (что вполне правомерно, так как 1−(p−q)2=1−((p+q)2−4pq){displaystyle 1-(p-q)^{2}=1-{bigl (}(p+q)^{2}-4pq{bigr )}}, а ξ{displaystyle xi } — модифицированная бернуллиевская случайная величина), поэтому для достаточно больших m{displaystyle m} и 0<p<1{displaystyle 0<p<1} верно: P({|ζ1|<C})⩽ε1{displaystyle mathbb {P} {Bigl (}{bigl {}|zeta _{1}|<C{bigr }}{Bigr )}leqslant varepsilon _{1}}, где ε1<1{displaystyle varepsilon _{1}<1}, так как если P({|ζ1|⩽C})=1{displaystyle mathbb {P} {Bigl (}{bigl {}|zeta _{1}|leqslant C{bigr }}{Bigr )}=1}, то D(ζ1)⩽C2{displaystyle D(zeta _{1})leqslant C^{2}}. Если p=0{displaystyle p=0} или p=1{displaystyle p=1}, то для довольно больших m{displaystyle m} верно, что P({|ζ1|<C})=0{displaystyle mathbb {P} {Bigl (}{bigl {}|zeta _{1}|<C{bigr }}{bigr )}=0}, поэтому неравенство P({|ζ1|<C})⩽ε1{displaystyle mathbb {P} {Bigl (}{bigl {}|zeta _{1}|<C{bigr }}{Bigr )}leqslant varepsilon _{1}} верно ∀p∈[0;1]{displaystyle forall pin [0;1]}. Из вышесказанного следует, что γn⩽εn{displaystyle gamma _{n}leqslant varepsilon ^{n}}, где ε=ε11m<1{displaystyle varepsilon =varepsilon _{1}^{frac {1}{m}}<1}. Так как α+β=1{displaystyle alpha +beta =1}, то (α−αn)−(β−βn)=γn{displaystyle (alpha -alpha _{n})-(beta -beta _{n})=gamma _{n}}; так как α⩾αn{displaystyle alpha geqslant alpha _{n}} и β⩾βn{displaystyle beta geqslant beta _{n}}, то 0⩽α−αn⩽γn⩽εn{displaystyle 0leqslant alpha -alpha _{n}leqslant gamma _{n}leqslant varepsilon ^{n}}; 0⩽β−βn⩽γn⩽εn{displaystyle 0leqslant beta -beta _{n}leqslant gamma _{n
}leqslant varepsilon ^{n}} при ε<1{displaystyle varepsilon <1}. Аналогичные оценки справедливы и для разностей α(x)−αn(x){displaystyle alpha (x)-alpha _{n}(x)} и β(x)−βn(x){displaystyle beta (x)-beta _{n}(x)}, так как можно свести эти разности к разностям α−αn{displaystyle alpha -alpha _{n}} и β−βn{displaystyle beta -beta _{n}} при A1=A−x{displaystyle A_{1}=A-x}, B1−B−x{displaystyle B_{1}-B-x}.
Вернёмся к рассмотрению α(x){displaystyle alpha (x)}. По аналогии с решением (qp)x−(qp)B(qp)x−(qp)A{displaystyle {frac {left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{B}}{left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{A}}}} уравнения β(x)=pβ(x+1)+qβ(x−1){displaystyle beta (x)=pbeta (x+1)+qbeta (x-1)}, можно сказать, что у уравнения α(x)=pα(x+1)+qα(x−1){displaystyle alpha (x)=palpha (x+1)+qalpha (x-1)} при граничных условиях α(A)=1{displaystyle alpha (A)=1}, α(B)=0{displaystyle alpha (B)=0} существует единственное решение α(x)=(qp)B−(qp)x(qp)B−(qp)A,A⩽x⩽B.{displaystyle alpha (x)={frac {left({frac {q}{p}}right)^{B}-left({frac {q}{p}}right)^{x}}{left({frac {q}{p}}right)^{B}-left({frac {q}{p}}right)^{A}}},qquad Aleqslant xleqslant B.}
Нетрудно заметить, что α(x)+β(x)=(qp)B−(qp)x(qp)B−(qp)A+(qp)x−(qp)B(qp)x−(qp)A=(qp)B−(qp)A(qp)B−(qp)A=1{displaystyle alpha (x)+beta (x)={frac {left({frac {q}{p}}right)^{B}-left({frac {q}{p}}right)^{x}}{left({frac {q}{p}}right)^{B}-left({frac {q}{p}}right)^{A}}}+{frac {left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{B}}{left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{A}}}={frac {left({frac {q}{p}}right)^{B}-left({frac {q}{p}}right)^{A}}{left({frac {q}{p}}right)^{B}-left({frac {q}{p}}right)^{A}}}=1} при любых p∈[0;1]{displaystyle pin [0;1]}. Если же игра является справедливой (вероятность выпадения аверса равна вероятности выпадения реверса), то решения будут выглядеть следующим образом: β(x)=x−AB−A{displaystyle beta (x)={frac {x-A}{B-A}}}, α(x)=B−xB−A{displaystyle alpha (x)={frac {B-x}{B-A}}}.
Ответ о вероятности разорения
Величины α(x){displaystyle alpha (x)} и β(x){displaystyle beta (x)} было бы можно назвать вероятностями разорения первого и второго игрока при начальных капиталах x−A{displaystyle x-A} и x−B{displaystyle x-B} при стремлении количества ходов к бесконечности и характеризации случайной величина ξi=+1{displaystyle xi _{i}=+1} как выигрыша первого игрока, а ξi=−1{displaystyle xi _{i}=-1} — проигрыша первого игрока. В дальнейшем будет показано, почему такую последовательность действительно можно построить.
Если A=0{displaystyle A=0}, то интуитивный смысл функции β(x){displaystyle beta (x)} — это вероятность того, что частица, вышедшая из положения x{displaystyle x}, достигнет верхней стенки (B{displaystyle B}) ранее, чем нуля. Из формул β(x){displaystyle beta (x)} видно, что β(x)={xB,p=q=0,5,(qp)x−1(qp)B−1,p≠q{displaystyle beta (x)={begin{cases}{frac {x}{B}},&p=q=0{,}5,\{frac {left({frac {q}{p}}right)^{x}-1}{left({frac {q}{p}}right)^{B}-1}},&pneq qend{cases}}}.
Парадокс увеличения ставки при неблагоприятной игре
Что необходимо сделать первому игроку, если игра неблагоприятна для него?
Его вероятность проигрыша задана формулой limk→∞αk=α=(qp)B−1(qp)B−(qp)A{displaystyle lim limits _{krightarrow infty }alpha _{k}=alpha ={frac {left({frac {q}{p}}right)^{B}-1}{left({frac {q}{p}}right)^{B}-left({frac {q}{p}}right)^{A}}}}. Теперь пусть первый игрок с капиталом (−A){displaystyle (-A)} примет решение удвоить ставку и играть на два рубля. Теперь P({ξi=2})=p{displaystyle mathbb {P} {bigl (}{xi _{i}=2}{bigr )}=p}, P({ξi=−2})=q{displaystyle mathbb {P} {bigl (}{xi _{i}=-2}{bigr )}=q}. Тогда обозначим предельную вероятность разорения первого игрока так: α2{displaystyle alpha _{2}}. Тогда α2=(qp)0,5B−1(qp)0,5B−(qp)0,5A{displaystyle alpha _{2}={frac {left({frac {q}{p}}right)^{0{,}5B}-1}{left({frac {q}{p}}right)^{0{,}5B}-left({frac {q}{p}}right)^{0{,}5A}}}}. Поэтомуα=(qp)0,5B⋅2−12(qp)0,5B⋅2−(qp)0,5A⋅2=((qp)0,5B−1)⋅((qp)0,5B+1)((qp)0,5B−(qp)0,5A)⋅((qp)0,5B+(qp)0,5A)=α2⋅((qp)0,5B+1)((qp)0,5B+(qp)0,5A)>α2{displaystyle alpha ={frac {left({frac {q}{p}}right)^{0{,}5Bcdot 2}-1^{2}}{left({frac {q}{p}}right)^{0{,}5Bcdot 2}-left({frac {q}{p}}right)^{0{,}5Acdot 2}}}={frac {left(left({frac {q}{p}}right)^{0{,}5B}-1right)cdot left(left({frac {q}{p}}right)^{0{,}5B}+1right)}{left(left({frac {q}{p}}right)^{0{,}5B}-left({frac {q}{p}}right)^{0{,}5A}right)cdot left(left({frac {q}{p}}right)^{0{,}5B}+left({frac {q}{p}}right)^{0{,}5A}right)}}=alpha _{2}cdot {frac {left(left({frac {q}{p}}right)^{0{,}5B}+1right)}{left(left({frac {q}{p}}right)^{0{,
}5B}+left({frac {q}{p}}right)^{0{,}5A}right)}}>alpha _{2}}, так как α2{displaystyle alpha _{2}} уможается на дробь, которая больше единицы при q>p{displaystyle q>p}.
Поэтому если вероятность выпадения столь желанного для первого игрока аверса меньше 0,5{displaystyle 0{,}5}, то ему выгодно увеличить ставку в r>1{displaystyle r>1} раз: это уменьшает вероятность его терминального разорения за счёт того, что вырастает вероятность выскочить из коридора в точке B{displaystyle B}. Это решение кажется парадоксальным, так как складывается впечатление, что при неблагоприятной ситуации надо снизить ставку и уменьшить проигрыш, но в действительности при бесконечном числе игр и низкой ставке проигрывающий игрок в конечном счёте обязательно проиграется в ноль, а игрок с высокой ставкой обладает большими шансами выпадения количества аверсов, достаточного для завершения игры в точке B{displaystyle B}.
Длительность случайного блуждания
Рассмотрим среднюю длительность блуждания нашей частицы. Введём математическое ожидание момента, когда игра прекращается: E(τkx)=mk(x{displaystyle mathbb {E} (tau _{k}^{x})=m_{k}(x} для k⩽n{displaystyle kleqslant n}. Выведем рекуррентное соотношение для математического ожидания продолжительности игры:
mk(x)=E(τkx)=∑1⩽l⩽klP({τkx=l})=∑1⩽l⩽kl(pP({τkx=l}|{ξ1=1})+qP({τkx=l}|{ξ1=−1}))={displaystyle m_{k}(x)=mathbb {E} (tau _{k}^{x})=sum limits _{1leqslant lleqslant k}lmathbb {P} {bigl (}{tau _{k}^{x}=l}{bigr )}=sum limits _{1leqslant lleqslant k}l{Bigl (}pmathbb {P} {bigl (}{tau _{k}^{x}=l}{big |}{xi _{1}=1}{bigr )}+qmathbb {P} {bigl (}{tau _{k}^{x}=l}{big |}{xi _{1}=-1}{bigr )}{Bigr )}=} |
=∑1⩽l⩽kl(pP({τk−1x+1=l−1})+qP{τk−1x−1=l−1}))=∑0⩽l⩽k−1(l+1)(pP({τk−1x+1=l})+qP({τk−1x−1=l}))={displaystyle =sum limits _{1leqslant lleqslant k}l{Bigl (}pmathbb {P} {bigl (}{tau _{k-1}^{x+1}=l-1}{bigr )}+qmathbb {P} {bigl {}tau _{k-1}^{x-1}=l-1}{bigr )}{Bigr )}=sum limits _{0leqslant lleqslant k-1}(l+1){Bigl (}pmathbb {P} {bigl (}{tau _{k-1}^{x+1}=l}{bigr )}+qmathbb {P} {bigl (}{tau _{k-1}^{x-1}=l}{bigr )}{Bigr )}=} |
=pmk−1(x+1)+qmk−1(x−1)+∑0⩽l⩽k−1(pP({τk−1x+1=l})+qP({τk−1x−1=l}))=pmk−1(x+1)+qmk−1(x−1)+1.{displaystyle =pm_{k-1}(x+1)+qm_{k-1}(x-1)+sum limits _{0leqslant lleqslant k-1}{Bigl (}pmathbb {P} {bigl (}{tau _{k-1}^{x+1}=l}{bigr )}+qmathbb {P} {bigl (}{tau _{k-1}^{x-1}=l}{bigr )}{Bigr )}=pm_{k-1}(x+1)+qm_{k-1}(x-1)+1.} |
Для x∈(A;B){displaystyle xin (A;B)} и k∈[0;n]{displaystyle kin [0;n]} мы получили рекуррентное соотношение для функции mk(x){displaystyle m_{k}(x)}: mk(x)=pmk−1(x+1)+qmk−1(x−1)+1{displaystyle m_{k}(x)=pm_{k-1}(x+1)+qm_{k-1}(x-1)+1} при m0(x)=0{displaystyle m_{0}(x)=0}. Введём граничные условия: если игра начинается в точке A{displaystyle A} или B{displaystyle B}, то тогда она тут же и завершится — её длительность будет равна 0: mk(A)=mk(B)=0{displaystyle m_{k}(A)=m_{k}(B)=0}. Из рекуррентного соотношения и граничных условий можно один за другим вычислить mi(x){displaystyle m_{i}(x)}. Так как mk+1(x)⩾mk(x){displaystyle m_{k+1}(x)geqslant m_{k}(x)}, то существует предел m(x)=limn→∞mn(x){displaystyle m(x)=lim limits _{nrightarrow infty }m_{n}(x)}, который удовлетворяет соотношению mk(x)=pmk−1(x+1)+qmk−1(x−1)+1{displaystyle m_{k}(x)=pm_{k-1}(x+1)+qm_{k-1}(x-1)+1}: m(x)=1+pm(x+1)+qm(x−1){displaystyle m(x)=1+pm(x+1)+qm(x-1)} при выполнении m(A)=m(B)=0{displaystyle m(A)=m(B)=0}. Данные переходы аналогичны тем, что мы рассмотрели при переходе к n→∞{displaystyle nrightarrow infty } в уравнении вероятности проигрыша. Для того чтобы решить данное уравнение, надо ввести ещё одно условие: матожидание количества ходов должно быть конечным, т. е. m(x)<∞{displaystyle m(x)<infty }, x∈(A;B){displaystyle xin (A;B)}.
Решим данное уравнение. В уравнении вероятности проигрыше (p≠q{displaystyle pneq q}) уже были получены частные решения a{displaystyle a} и b(qp)x{displaystyle bleft({frac {q}{p}}right)^{x}}. Здесь же появляется ещё один претендент на роль частного решения: xq−p=q−p+(p+q)x+p−qq−p=q−pq−p+p(x+1)q−p+q(x−1)q−p=1+px+1q−p+qx−1q−p{displaystyle {frac {x}{q-p}}={frac {q-p+(p+q)x+p-q}{q-p}}={frac {q-p}{q-p}}+{frac {p(x+1)}{q-p}}+{frac {q(x-1)}{q-p}}=1+p{frac {x+1}{q-p}}+q{frac {x-1}{q-p}}}, поэтому m(x)=xq−p+a+b(qp)x{displaystyle m(x)={frac {x}{q-p}}+a+bleft({frac {q}{p}}right)^{x}}. С учётом граничного условия m(A)=m(B)=0{displaystyle m(A)=m(B)=0} находим при помощи ранее полученных соотношений m(x){displaystyle m(x)}: m(x)=1p−q(Bβ(x)+Aα(x)−x){displaystyle m(x)={frac {1}{p-q}}{bigl (}Bbeta (x)+Aalpha (x)-x{bigr )}}. В случае идеальной монетки получаем следующее выражение: m(x)=a+bx−x2{displaystyle m(x)=a+bx-x^{2}}. Применение граничного условия даёт: m(x)=(B−x)(x−A){displaystyle m(x)=(B-x)(x-A)}. Из этого следует, что в случае равных стартовых капиталов m(0)=B2{displaystyle m(0)=B^{2}}. Например, если у каждого игрока есть по 5 рублей, а ставка — 1 рубль, то в среднем разоряться игроки будут через 25 ходов.
При рассмотрении вышеуказанных формул подразумевалась конечностью математического ожидания числа ходов: m(x)<∞{displaystyle m(x)<infty }. Теперь будет предложено доказательство этого факта.
Задача о конечности ожидаемого числа ходов
Доказать, что m(x)<∞∀A,B{displaystyle m(x)<infty quad forall A,B}.
Решение. Достаточно доказать это для случая x=0{displaystyle x=0} (так как ранее было уже продемонстрировано, что случаи x≠0{displaystyle xneq 0} могут быть сведены к x=0{displaystyle x=0} вариацией A{displaystyle A} и B{displaystyle B}) и p=q{displaystyle p=q}, а затем рассмотреть случай p≠q{displaystyle pneq q}. Итак, рассмотрим последовательность S0;1;…;n{displaystyle S_{0;1;ldots ;n}} и введём случайную величину Sτn=Sτn(ω){displaystyle S_{tau _{n}}=S_{tau _{n}}(omega )}, где τn=τn0{displaystyle tau _{n}=tau _{n}^{0}} — момент остановки. Далее, пусть Sτn(ω)=∑k=0nSk(ω)1{τn=k}(ω){displaystyle S_{tau _{n}}(omega )=sum limits _{k=0}^{n}S_{k}(omega )mathbf {1} _{{{tau _{n}=k}}}(omega )}. Интерпретация такова: Sτn{displaystyle S_{tau _{n}}} — это значение случайного блуждания в момент τn{displaystyle tau _{n}}. Если τn<n{displaystyle tau _{n}<n}, то Sτn∈{A;B}{displaystyle S_{tau _{n}}in {A;B}}; если τn=n{displaystyle tau _{n}=n}, то A⩽Sτn⩽B{displaystyle Aleqslant S_{tau _{n}}leqslant B}. Вспомним, что p=q=0,5{displaystyle p=q=0{,}5}, и докажем, что E(Sτn)=0{displaystyle mathbb {E} (S_{tau _{n}})=0}, E(Sτn2)=E(τn){displaystyle mathbb {E} (S_{tau _{n}}^{2})=mathbb {E} (tau _{n})}.
Для доказательства первого равенства напишем: E(Sτn)=∑k=0nE(Sk1{τn=k}(ω))=∑k=0nE(Sn1{τn=k}(ω))+∑k=0n((Sk−Sn)1{τn=k}(ω))=E(Sn)+∑k=0n((Sk−Sn)1{τn=k}(ω)){displaystyle mathbb {E} (S_{tau _{n}})=sum limits _{k=0}^{n}mathbb {E} {bigl (}S_{k}mathbf {1} _{{{tau _{n}=k}}}(omega ){bigr )}=sum limits _{k=0}^{n}mathbb {E} {bigl (}S_{n}mathbf {1} _{{{tau _{n}=k}}}(omega ){bigr )}+sum limits _{k=0}^{n}{bigl (}(S_{k}-S_{n})mathbf {1} _{{{tau _{n}=k}}}(omega ){bigr )}=mathbb {E} (S_{n})+sum limits _{k=0}^{n}{bigl (}(S_{k}-S_{n})mathbf {1} _{{{tau _{n}=k}}}(omega ){bigr )}}. Совершенно очевидно, что E(Sn)=0{displaystyle mathbb {E} (S_{n})=0}, так как Sn=ξ1+…+ξn{displaystyle S_{n}=xi _{1}+ldots +xi _{n}}, ξi=±1{displaystyle xi _{i}=pm 1} при p=q{displaystyle p=q}. Осталось доказать, что ∑k=0n((Sk−Sn)1{τn=k}(ω))=0{displaystyle sum limits _{k=0}^{n}{bigl (}(S_{k}-S_{n})mathbf {1} _{{{tau _{n}=k}}}(omega ){bigr )}=0}. Для 0⩽k<n{displaystyle 0leqslant k<n} справедливо, что {τn>k}={A<S1<B;…;A<Sk<B}{displaystyle {tau _{n}>k}={A<S_{1}<B;ldots ;A<S_{k}<B}}. Последнее событие может быть представлено в виде {ω:(ξ1;…;ξn)∈J}{displaystyle {bigl {}omega colon (xi _{1};ldots ;xi _{n})in J{bigr }}}, где J{displaystyle J} — некоторое подмножество множества {−1;+1}k{displaystyle {-1;+1}^{k}}. Это множество определяется только ξi{displaystyle xi _{i}} при i=1;k¯{displaystyle i={overline {1;k}}}. Для бо́льших i{displaystyle i} значения ξk+1;…;ξn{displaystyle xi _{k+1};ldots ;xi _{n}} не влияют на J{displaystyle J}. Множество вида {τn=k}={τn>k−1}∖{τn>k}{displaystyle {tau _{n}=k}={tau _{n}>k-1}backslash {tau _{n}>k}} также может быть представлено в виде {ω:(ξ1;…;ξn)∈J}{displaystyle {bigl {}omega colon (xi _{1};ldots ;xi _{n})in J{bigr }}}. Благодаря независимости ξi{displaystyle xi _{i}} (доказано в подзадаче 2) вытекает, что ∀0⩽k<n{displaystyle forall 0leqslant k<n} случайные величины Sn−Sk{displaystyle S_{n}-S_{k}} и 1{τn=k}{displaystyle mathbf {1} _{{tau _{n}=k}}} независимы. Отсюда E(Sk⋅1{τn=k}(ω))=E(Sk)⋅E(1{τn=k}(ω))=0{displaystyle mathbb {E} {bigl (}S_{k}cdot mathbf {1} _{{{tau _{n}=k}}}(omega ){bigr )}=mathbb {E} (S_{k})cdot mathbb {E} {bigl (}mathbf {1} _{{{tau _{n}=k}}}(omega ){bigr )}=0} в силу того, что первый множитель нулевой.
E(Sτn2)=∑k=0nE(Sk21{τn=k})={displaystyle mathbb {E} (S_{tau _{n}}^{2})=sum limits _{k=0}^{n}mathbb {E} (S_{k}^{2}mathbf {1} _{{{tau _{n}=k}}})=} |
=∑k=0nE((Sn+(Sk−Sn)2)1{τn=k})=∑k=0n(E(S2)1{τn=k}+2E(Sn(Sk−Sn))1{τn=k}+E((Sn−Sk)2)1{τn=k})={displaystyle =sum limits _{k=0}^{n}mathbb {E} {Bigl (}{bigl (}S_{n}+(S_{k}-S_{n})^{2}{bigr )}mathbf {1} _{{{tau _{n}=k}}}{Bigr )}=sum limits _{k=0}^{n}{Bigl (}mathbb {E} (S^{2})mathbf {1} _{{{tau _{n}=k}}}+2mathbb {E} {bigl (}S_{n}(S_{k}-S_{n}){bigr )}mathbf {1} _{{{tau _{n}=k}}}+mathbb {E} {bigl (}(S_{n}-S_{k})^{2}{bigr )}mathbf {1} _{{{tau _{n}=k}}}{Bigr )}=} |
=E(S2)−∑k=0nE((Sn−Sk)2)1{τn=k}=n−∑k=0nE(n−k)P({τn=k})=∑k=0nkP({τn=k})=E(τn).{displaystyle =mathbb {E} (S^{2})-sum limits _{k=0}^{n}mathbb {E} {bigl (}(S_{n}-S_{k})^{2}{bigr )}mathbf {1} _{{{tau _{n}=k}}}=n-sum limits _{k=0}^{n}mathbb {E} (n-k)mathbb {P} {bigl (}{tau _{n}=k}{bigr )}=sum limits _{k=0}^{n}kmathbb {P} {bigl (}{tau _{n}=k}{bigr )}=mathbb {E} (tau _{n}).} |
Установлено, что для идеальной монетки E(Sτn)=0{displaystyle mathbb {E} (S_{tau _{n}})=0}, E(Sτn2)=E(τn){displaystyle mathbb {E} (S_{tau _{n}}^{2})=mathbb {E} (tau _{n})}. В случае же p≠q{displaystyle pneq q} имеют место соотношения E(Sτn)=(p−q)E(τn){displaystyle mathbb {E} (S_{tau _{n}})=(p-q)mathbb {E} (tau _{n})} (поскольку E(ξ1)=p−q{displaystyle mathbb {E} (xi _{1})=p-q}) и E((Sτn−τnE(ξ1))2)=D(ξ1)⋅E(τn){displaystyle mathbb {E} {Bigl (}{bigl (}S_{tau _{n}}-tau _{n}mathbb {E} (xi _{1}){bigr )}^{2}{Bigr )}=D(xi _{1})cdot mathbb {E} (tau _{n})}, поскольку D(ξ1)=1−(p−q)2{displaystyle D(xi _{1})=1-(p-q)^{2}}. Теперь покажем, что limn→∞mn(0)=m(0)<∞{displaystyle lim limits _{nrightarrow infty }m_{n}(0)=m(0)<infty }. В случае справедливой игры в силу соотношения E(Sτn2)=E(τn){displaystyle mathbb {E} (S_{tau _{n}}^{2})=mathbb {E} (tau _{n})} верно, что E(τn)⩽max{A2;B2}{displaystyle mathbb {E} (tau _{n})leqslant max{A^{2};B^{2}}}. Тогда же E(τn)=E(Sτn2)=A2αn+B2βn+E(Sn21{A<Sn<B})1{τn=n}{displaystyle mathbb {E} (tau _{n})=mathbb {E} (S_{tau _{n}}^{2})=A^{2}alpha _{n}+B^{2}beta _{n}+mathbb {E} (S_{n}^{2}mathbf {1} _{{{A<S_{n}<B}}})mathbf {1} _{{{tau _{n}=n}}}}, поэтому A2αn+B2βn⩽E(τn)⩽A2αn+B2βn+max{A2;B2}⋅γn{displaystyle A^{2}alpha _{n}+B^{2}beta _{n}leqslant mathbb {E} (tau _{n})leqslant A^{2}alpha _{n}+B^{2}beta _{n}+max{A^{2};B^{2}}cdot gamma _{n}}. Из неравенства γn<εn{displaystyle gamma _{n}<varepsilon ^{n}} следует, что математическое ожидание E(τn){displaystyle mathbb {E} (tau _{n})} сходится при n→∞{displaystyle nrightarrow infty } к предельному значению m(0)=A2α+B2β=A2⋅BB−A−B2⋅AB−A=|AB|{displaystyle m(0)=A^{2}alpha +B^{2}beta =A^{2}cdot {frac {B}{B-A}}-B^{2}cdot {frac {A}{B-A}}=|AB|}. В случае несправедливой игры E(τn)⩽max{|A|;B}|p−q|{displaystyle mathbb {E} (tau _{n})leqslant {frac {max{|A|;B}}{|p-q|}}}. Так как за τn{displaystyle tau _{n}} обозначался момент первого вылета частицы за пределы коридора, то математическое ожидание его меньше определённых чисел, следовательно, меньше бесконечности. При таком условии E(τn)→m(0)=αA+βBp−q{displaystyle mathbb {E} (tau _{n})rightarrow m(0)={frac {alpha A+beta B}{p-q}}}. ◼{displaystyle blacksquare }