![]() |
Это заготовка статьи. Вы можете помочь проекту, дополнив её. Это примечание по возможности следует заменить более точным. |
Задача о разорении игрока — задача из области теории вероятностей.
Формулировка
За столом сидят два игрока. У первого в распоряжении находится −A{displaystyle -A} (A<0{displaystyle A<0} ) рублей, у другого — B{displaystyle B} рублей. Перед ними на столе лежит асимметричная монета (вероятность, что выпадет аверс, может равняться любому числу от 0 до 1 включительно). Если на монете выпадает аверс, то рубль выигрывает первый игрок (второй игрок выплачивает первому 1 рубль), а если выпадает реверс, то первый игрок платит второму один рубль. Требуется найти вероятность того, что один из игроков проиграется в ноль за n{displaystyle n} шагов, и вероятность проигрыша каждого азартного игрока. Также необходимо вычислить среднюю длину игры.
Данная ситуация может быть смоделирована подобным образом: имеется блуждающая частица и коридор [A;B]{displaystyle [A;B]}
. Рассматривается вероятность того, что частица выйдет из коридора за n{displaystyle n} шагов (проскочит через верхнюю или нижнюю стенку).Схема Бернулли
Рассмотрим схему Бернулли с n{displaystyle n}
испытаниями. Пусть (Ω,A,P){displaystyle (Omega ,{mathcal {A}},mathbb {P} )} — вероятностное пространство, где Ω={ω:ω=(x1;…;xn), xi=±1}{displaystyle Omega ={bigl {}omega colon omega =(x_{1};ldots ;x_{n}), x_{i}=pm 1{bigr }}} . A={Ai⊆Ω}{displaystyle {mathcal {A}}={A_{i}subseteq Omega }} — алгебра подмножеств вероятностного пространства. Вероятность задана следующим образом: P({ω})=pν(ω)⋅qn−ν(ω){displaystyle mathbb {P} {bigl (}{omega }{bigr )}=p^{nu (omega )}cdot q^{n-nu (omega )}} , где ν(ω){displaystyle nu (omega )} — количество выпавших в данной последовательность единиц: ν(ω)=∑i=1nxi+n2{displaystyle nu (omega )={frac {sum limits _{i=1}^{n}x_{i}+n}{2}}} . Данная формула позволяет считать количество единиц: ν(ω){displaystyle nu (omega )} превращает соответственно полученные значения (+1;−1){displaystyle (+1;-1)} в (1;0){displaystyle (1;0)} и затем уже считает полученные единицы. Введём последовательность бернуллиевских случайных величин ξi(ω):i=1;n¯;P({ξi=1})=p;P({ξi=−1})=q;p+q=1.{displaystyle xi _{i}(omega )colon i={overline {1;n}};quad mathbb {P} {bigl (}{xi _{i}=1}{bigr )}=p;quad mathbb {P} {bigl (}{xi _{i}=-1}{bigr )}=q;quad p+q=1.}Подзадача о нормированности вероятности
Доказать, что ∑ω∈ΩP({ω})=1.{displaystyle sum limits _{omega in Omega }mathbb {P} {bigl (}{omega }{bigr )}=1.}
Решение. ∑ω∈ΩP({ω})=∑ω∈Ωp∑i=1nxi+n2⋅qn−∑i=1nxi+n2=∑k=0n∑ω∈Akp∑i=1n(xi+1)2⋅q∑i=1n(1−xi)2=∑k=0nCnkpkqn−k.{displaystyle sum limits _{omega in Omega }mathbb {P} {bigl (}{omega }{bigr )}=sum limits _{omega in Omega }p^{frac {sum limits _{i=1}^{n}x_{i}+n}{2}}cdot q^{n-{frac {sum limits _{i=1}^{n}x_{i}+n}{2}}}=sum limits _{k=0}^{n}sum limits _{omega in A_{k}}p^{frac {sum limits _{i=1}^{n}(x_{i}+1)}{2}}cdot q^{frac {sum limits _{i=1}^{n}(1-x_{i})}{2}}=sum limits _{k=0}^{n}C_{n}^{k}p^{k}q^{n-k}.}
Это справедливо в силу того, что xi+12∈{0;1}.{displaystyle {frac {x_{i}+1}{2}}in {0;1}.} ∑k=0nCnkpkqn−k=(p+q)n=1{displaystyle sum limits _{k=0}^{n}C_{n}^{k}p^{k}q^{n-k}=(p+q)^{n}=1} , поскольку по условию p+q=1{displaystyle p+q=1} . ◼{displaystyle blacksquare }Подзадача о независимости случайных величин ξi{displaystyle xi _{i}}
Доказать, что ξ1{displaystyle xi _{1}}
и ξ2{displaystyle xi _{2}} независимы.Решение. Достаточно доказать, что P({ξ1=1}∩{ξ2=1})=P({ξ1=1})P({ξ2=1}).{displaystyle mathbb {P} {bigl (}{xi _{1}=1}cap {xi _{2}=1}{bigr )}=mathbb {P} {bigl (}{xi _{1}=1}{bigr )}mathbb {P} {bigl (}{xi _{2}=1}{bigr )}.}
P({ξ1=1}∩{ξ2=1})=P({ω:ω=(x1;…;xn), x1=1, x2=1})={displaystyle mathbb {P} {bigl (}{xi _{1}=1}cap {xi _{2}=1}{bigr )}=mathbb {P} {bigl (}{omega colon omega =(x_{1};ldots ;x_{n}), x_{1}=1, x_{2}=1}{bigr )}=} |
=∑x3=±1…xn=±1p2+∑i=3nxi+n2⋅qn−2+∑i=3nxi+n2=p2∑x3=±1…xn=±1p∑i=3nxi+(n−2)2⋅q(n−2)−∑i=3nxi+(n−2)2=p2⋅1.{displaystyle =sum limits _{begin{smallmatrix}x_{3}=pm 1\ldots {}\x_{n}=pm 1end{smallmatrix}}p^{frac {2+sum limits _{i=3}^{n}x_{i}+n}{2}}cdot q^{n-{frac {2+sum limits _{i=3}^{n}x_{i}+n}{2}}}=p^{2}sum limits _{begin{smallmatrix}x_{3}=pm 1\ldots {}\x_{n}=pm 1end{smallmatrix}}p^{frac {sum limits _{i=3}^{n}x_{i}+(n-2)}{2}}cdot q^{(n-2)-{frac {sum limits _{i=3}^{n}x_{i}+(n-2)}{2}}}=p^{2}cdot 1.} | ◼{displaystyle blacksquare }
Случайное блуждание
Введём новое обозначение: S0=0{displaystyle S_{0}=0}
, Sk=ξ1+…+ξk,1⩽k⩽n{displaystyle S_{k}=xi _{1}+ldots {}+xi _{k},quad 1leqslant kleqslant n} . n{displaystyle n} — длина игры, а последовательность (Sk)k⩽n{displaystyle (S_{k})_{kleqslant n}} можно рассматривать как траекторию случайного блуждания некоторой частицы, выходящей из нуля. При этом Sk+1=Sk+ξk+1{displaystyle S_{k+1}=S_{k}+xi _{k+1}} . Пусть A{displaystyle A} , B{displaystyle B} — два целых числа, A⩽0{displaystyle Aleqslant 0} , B⩾0{displaystyle Bgeqslant 0} . Требуется найти, с какой вероятностью за n{displaystyle n} шагов будет осуществлён выход частицы из коридора, ограниченного A{displaystyle A} и B{displaystyle B} . Если ξi=+1{displaystyle xi _{i}=+1} , то второй игрок платит первому. Если ξi=−1{displaystyle xi _{i}=-1} , то первый игрок платит второму. Поэтому Sk{displaystyle S_{k}} может рассматриваться в качестве выигрыша первого игрока у второго (который, естественно, может быть отрицательным). Далее, пусть x{displaystyle x} — целое число, x∈Z∩[A;B]{displaystyle xin mathbb {Z} cap [A;B]} . Пусть также для 0⩽k⩽n{displaystyle 0leqslant kleqslant n} верно, что Skx=x+Sk{displaystyle S_{k}^{x}=x+S_{k}} (что означает, что игроки начинали играть с ненулевым капиталом в распоряжении). Пусть τkx=min{l:0⩽l⩽k,Slx={A or B}}{displaystyle tau _{k}^{x}=min {bigl {}lcolon 0leqslant lleqslant k,S_{l}^{x}={Amathrm {~or~} B}{bigr }}} . Условимся считать, что τkx=k{displaystyle tau _{k}^{x}=k} , если A<Slx<B∀l:0⩽l⩽k{displaystyle A<S_{l}^{x}<Bquad forall lcolon 0leqslant lleqslant k} . Если частица так и не пересекла границы, то xk{displaystyle x_{k}} не определён.Для каждого 0⩽k⩽n{displaystyle 0leqslant kleqslant n}случайной величиной, определённой на пространстве элементарных событий Ω{displaystyle Omega } . ∀l<k{ω:τkx=l}{displaystyle forall l<kquad {omega colon tau _{k}^{x}=l}} — это событие, состоящее в том, что случайное блуждание {Six:0⩽i⩽k}{displaystyle {S_{i}^{x}colon 0leqslant ileqslant k}} , начинающееся в точке x{displaystyle x} , выйдет из интервала [A;B]{displaystyle [A;B]} в момент l{displaystyle l} . Введём новые обозначения: Akx=∐0⩽l⩽k{ω:τkx=l, Slx=A}{displaystyle {mathcal {A}}_{k}^{x}=coprod limits _{0leqslant lleqslant k}{omega colon tau _{k}^{x}=l, S_{l}^{x}=A}} , Bkx=∐0⩽l⩽k{ω:τkx=l, Slx=B}{displaystyle {mathcal {B}}_{k}^{x}=coprod limits _{0leqslant lleqslant k}{omega colon tau _{k}^{x}=l, S_{l}^{x}=B}} для 0⩽k⩽n{displaystyle 0leqslant kleqslant n} . Пусть αk(x)=P(Akx){displaystyle alpha _{k}(x)=mathbb {P} ({mathcal {A}}_{k}^{x})} , βk(x)=P(Bkx){displaystyle beta _{k}(x)=mathbb {P} ({mathcal {B}}_{k}^{x})} — вероятности выхода частицы за время [0;k]{displaystyle [0;k]} из интервала [A;B]{displaystyle [A
;B]} соответственно в точках A{displaystyle A} и B{displaystyle B} .
Пусть A<x<B{displaystyle A<x<B}
; очевидно, что α0(x)=β0(x)=0{displaystyle alpha _{0}(x)=beta _{0}(x)=0} (пока игра не началась, частица находится внутри интервала с вероятностью 1). Пусть теперь 0⩽k⩽n{displaystyle 0leqslant kleqslant n} . Тогда по формуле полной вероятности βk(x)=P(Bkx)=P(Bkx∣S1x=x+1)⋅P({ξ1=1})+P(Bkx∣S1x=x−1)⋅P({ξ1=−1}).{displaystyle beta _{k}(x)=mathbb {P} ({mathcal {B}}_{k}^{x})=mathbb {P} ({mathcal {B}}_{k}^{x}mid S_{1}^{x}=x+1)cdot mathbb {P} {bigl (}{xi _{1}=1}{bigr )}+mathbb {P} ({mathcal {B}}_{k}^{x}mid S_{1}^{x}=x-1)cdot mathbb {P} {bigl (}{xi _{1}=-1}{bigr )}.}Подзадача о рекуррентности
Доказать, что (1) P(Bkx∣S1x=x+1)=P(Bk−1x+1){displaystyle mathbb {P} ({mathcal {B}}_{k}^{x}mid S_{1}^{x}=x+1)=mathbb {P} ({mathcal {B}}_{k-1}^{x+1})}
и (2) P(Bkx∣S1x=x−1)=P(Bk−1x−1){displaystyle mathbb {P} ({mathcal {B}}_{k}^{x}mid S_{1}^{x}=x-1)=mathbb {P} ({mathcal {B}}_{k-1}^{x-1})} .Доказательство.
(1) Докажем, что P(Bkx∣S1x=x+1)=P(Bk−1x+1){displaystyle mathbb {P} ({mathcal {B}}_{k}^{x}mid S_{1}^{x}=x+1)=mathbb {P} ({mathcal {B}}_{k-1}^{x+1})}Дизъюнктное объединение правомерно по причине того, что у любой частицы, проходящей по траектории, x1=±1{displaystyle x_{1}=pm 1} . Bkx;x+1{displaystyle B_{k}^{x;x+1}} — те траектории из Bkx{displaystyle B_{k}^{x}} , для которых x1=1{displaystyle x_{1}=1} . Bkx;x−1{displaystyle B_{k}^{x;x-1}} — те траектории из Bkx{displaystyle B_{k}^{x}} , для которых x1=−1{displaystyle x_{1}=-1} . Заметим, что каждая траектория (x;x+1;x+1+x2;…;x+1+x2+…+xk){displaystyle (x;x+1;x+1+x_{2};ldots {};x+1+x_{2}+ldots +x_{k})} из Bkx;x+1{displaystyle B_{k}^{x;x+1}} находится в однозначном соответствии с траекторией (x+1;x+1+x2;…;x+1+x2+…+xk){displaystyle (x+1;x+1+x_{2};ldots {};x+1+x_{2}+ldots +x_{k})} из Bk−1x+1{displaystyle B_{k-1}^{x+1}} . Взаимно-однозначное соответствие доказывается от противного. Предположим, что x1=−1{displaystyle x_{1}=-1} (неоднозначное соответствие); тогда данная траектория (x;x−1;x−1+x2;…;x−1+x2+…+xk){displaystyle (x;x-1;x-1+x_{2};ldots ;x-1+x_{2}+ldots +x_{k})} не сможет вывести частицу из коридора за k{displaystyle k} шагов (а только лишь за k+2{displaystyle k+2} из-за изначального отдаления от верхней стенки коридора). В обратную сторону соответствие является также однозначным из определения: Sk+1=Sk+ξk+1{displaystyle S_{k+1}=S_{k}+xi _{k+1}} . Из этого следует, что P({(x+1;x+1+x2;…;x+1+x2+…+xk)∈Bk−1x+1})=P(bigl{(x+1;x+1+x1;…;x+1+x1+…+xk−1)∈Bk−1x+1})=defP(Bk−1x+1){displaystyle mathbb {P} {Bigl (}{big {}(x+1;x+1+x_{2};ldots ;x+1+x_{2}+ldots +x_{k})in B_{k-1}^{x+1}{bigr }}{Bigr )}=mathbb {P} {Bigl (}bigl{(x+1;x+1+x_{1};ldots ;x+1+x_{1}+ldots +x_{k-1})in B_{k-1}^{x+1}{bigr }}{Bigr )}{mathrel {stackrel {rm {def}}{=}}}mathbb {P} ({mathcal {B}}_{k-1}^{x+1})} (так как ξi{displaystyle xi _{i}} суть независимые одинаково распределённые случайные величины).
. Bkx={ω:(x;x+ξ1;…;x+ξ1+…+ξk)∈Bkx}{displaystyle {mathcal {B}}_{k}^{x}={bigl {}omega colon (x;x+xi _{1};ldots {};x+xi _{1}+ldots {}+xi _{k})in B_{k}^{x}{bigr }}} , где Bkx{displaystyle B_{k}^{x}} — множество траекторий вида (x;x+x1;…;x+x1+…+xk),xi=±1{displaystyle (x;x+x_{1};ldots {};x+x_{1}+ldots {}+x_{k}),quad x_{i}=pm 1} , которые за время [0;k]{displaystyle [0;k]} впервые выходят из интервала (A;B){displaystyle (A;B)} в точке B{displaystyle B} (показано на рисунке). Если случайный вектор попадает в подходящую траекторию, то он попадает в множество B{displaystyle {mathcal {B}}} . Представим множество Bkx{displaystyle B_{k}^{x}} как Bkx;x+1⊔Bkx;x−1{displaystyle B_{k}^{x;x+1}sqcup B_{k}^{x;x-1}} .Существует и другой способ доказательства:
P(Bkx∣S1x=x+1)=P(Bkx∣ξ1=1)=P((x;x+ξ1;…;x+ξ1+…+ξk)∈Bkx∣ξ1=1)={displaystyle mathbb {P} ({mathcal {B}}_{k}^{x}mid S_{1}^{x}=x+1)=mathbb {P} ({mathcal {B}}_{k}^{x}mid xi _{1}=1)=mathbb {P} {bigl (}(x;x+xi _{1};ldots {};x+xi _{1}+ldots {}+xi _{k}) in B_{k}^{x}mid xi _{1}=1{bigr )}=} |
=P((x;x+ξ1;…;x+ξ1+…+ξk)∈Bkx∩ξ1=1)P({ξ1=1})=P((x;x+1;…;x+1+…+ξk)∈Bkx∩ξ1=1)P({ξ1=1})={displaystyle ={frac {mathbb {P} {bigl (}(x;x+xi _{1};ldots {};x+xi _{1}+ldots {}+xi _{k})in B_{k}^{x}cap xi _{1}=1{bigr )}}{mathbb {P} ({xi _{1}=1})}}={frac {mathbb {P} {bigl (}(x;x+1;ldots {};x+1+ldots {}+xi _{k})in B_{k}^{x}cap xi _{1}=1{bigr )}}{mathbb {P} ({xi _{1}=1})}}=} |
=P({(x;x+1;x+1+ξ2;…;x+1+ξ2+…+ξk)∈Bkx})=P({(x;x+1;x+1+ξ1;…;x+1+ξ1+…+ξk−1)∈Bkx})={displaystyle =mathbb {P} {bigl (}{(x;x+1;x+1+xi _{2};ldots {};x+1+xi _{2}+ldots {}+xi _{k})in B_{k}^{x}}{bigr )}=mathbb {P} {bigl (}{(x;x+1;x+1+xi _{1};ldots {};x+1+xi _{1}+ldots {}+xi _{k-1})in B_{k}^{x}}{bigr )}=} |
=P({(x;x+1;x+1+ξ1;…;x+1+ξ1+…+ξk−1)∈Bk−1x+1})=P(Bk−1x+1)=βk−1(x+1){displaystyle =mathbb {P} {bigl (}{(x;x+1;x+1+xi _{1};ldots {};x+1+xi _{1}+ldots {}+xi _{k-1})in B_{k-1}^{x+1}}{bigr )}=mathbb {P} ({mathcal {B}}_{k-1}^{x+1})=beta _{k-1}(x+1)} | .
Это справедливо потому, что вероятности независимы (это было доказано ранее).
(2) Аналогично докажем, что P(Bkx∣S1x=x−1)=P(Bk−1x+1){displaystyle mathbb {P} ({mathcal {B}}_{k}^{x}mid S_{1}^{x}=x-1)=mathbb {P} ({mathcal {B}}_{k-1}^{x+1})}
. Каждая траектория (x;x−1;x−1+x2;…;x−1+x2+…+xk){displaystyle (x;x-1;x-1+x_{2};ldots {};x-1+x_{2}+ldots +x_{k})} из Bkx;x+1{displaystyle B_{k}^{x;x+1}} находится в однозначном соответствии с траекторией (x−1;x−1+x2;…;x−1+x2+…+xk){displaystyle (x-1;x-1+x_{2};ldots {};x-1+x_{2}+ldots +x_{k})} из Bk−1x−1{displaystyle B_{k-1}^{x-1}} . Отсюда P({(x−1;x−1+x2;…;x−1+x2+…+xk)∈Bk−1x−1})=P({(x−1;x−1+x1;…;x−1+x1+…+xk−1)∈Bk−1x−1})=defP(Bk−1x−1).{displaystyle mathbb {P} {Bigl (}{bigl {}(x-1;x-1+x_{2};ldots ;x-1+x_{2}+ldots +x_{k})in B_{k-1}^{x-1}{bigr }}{Bigr )}=mathbb {P} {Bigl (}{bigl {}(x-1;x-1+x_{1};ldots ;x-1+x_{1}+ldots +x_{k-1})in B_{k-1}^{x-1}{bigr }}{Bigr )}{mathrel {stackrel {rm {def}}{=}}}mathbb {P} ({mathcal {B}}_{k-1}^{x-1}).} ◼{displaystyle blacksquare }Вывод рекуррентного соотношения
Из уравнения для βk(x){displaystyle beta _{k}(x)}
следует, что для x∈(A;B){displaystyle xin (A;B)} и k⩽n{displaystyle kleqslant n} верно:P(Bkx)=P(Bkx∣S1x=x+1)⋅p+P(Bkx∣S1x=x−1)⋅q=P(Bk−1x+1)⋅p+P(Bk−1x−1)⋅q=pβk−1(x+1)+qβk−1(x−1).{displaystyle mathbb {P} ({mathcal {B}}_{k}^{x})=mathbb {P} ({mathcal {B}}_{k}^{x}mid S_{1}^{x}=x+1)cdot p+mathbb {P} ({mathcal {B}}_{k}^{x}mid S_{1}^{x}=x-1)cdot q=mathbb {P} ({mathcal {B}}_{k-1}^{x+1})cdot p+mathbb {P} ({mathcal {B}}_{k-1}^{x-1})cdot q=pbeta _{k-1}(x+1)+qbeta _{k-1}(x-1).}βl(B)=1{displaystyle beta _{l}(B)=1}Формула полной вероятности также даёт нам следующий результат: αk(x)=pαk−1(x+1)+qαk−1(x−1){displaystyle alpha _{k}(x)=palpha _{k-1}(x+1)+qalpha _{k-1}(x-1)} . Также отметим, что Bk−1⊂Bk{displaystyle {mathcal {B}}_{k-1}subset {mathcal {B}}_{k}} , и поэтому βk−1(x)⩽βk(x)⩽1{displaystyle beta _{k-1}(x)leqslant beta _{k}(x)leqslant 1} для k⩽n{displaystyle kleqslant n} . Это утверждение верно, так как к любой траектории, выводящей частицу за меньшее количество шагов, можно прибавить в начало один шаг (xj−1=±1{displaystyle x_{j-1}=pm 1} ), на котором частица может прийти в точку (j;Sjx){displaystyle (j;S_{j}^{x})} как из (j−1;Sjx−1){displaystyle (j-1;S_{j}^{x}-1)} (для ξj=1{displaystyle xi _{j}=1} ), так и из (j−1;Sjx+1){displaystyle (j-1;S_{j}^{x}+1)} (j⩽k{displaystyle jleqslant k} ).
, βl(A)=0{displaystyle beta _{l}(A)=0} для l∈[0;n]{displaystyle lin [0;n]} .Нахождение вероятностей
При достаточно больших n{displaystyle n}
вероятность βn(x){displaystyle beta _{n}(x)} близка к β(x){displaystyle beta (x)} — решению уравнения β(x)=pβ(x+1)+qβ(x−1){displaystyle beta (x)=pbeta (x+1)+qbeta (x-1)} при тех условиях, что β(B)=1{displaystyle beta (B)=1} (выход произошёл сразу же из точки B{displaystyle B} — конец игры, выиграл первый игрок), β(A)=0{displaystyle beta (A)=0} (первый игрок никогда не выиграет, если выход произойдёт мгновенно в точке A{displaystyle A} ). Эти условия следуют из того, что liml→∞βl(B)=β(B){displaystyle lim limits _{lrightarrow infty }beta _{l}(B)=beta (B)} . Это также будет доказано в этом разделе.Сначала получим решение уравнения β(x)=pβ(x+1)+qβ(x−1){displaystyle beta (x)=pbeta (x+1)+qbeta (x-1)}
. Пусть игра несправедливая (p≠q{displaystyle pneq q} ). В таком случае найдём корни уравнения, то есть β(x){displaystyle beta (x)} . Одно частное решение видно сразу: β(x)=const=a{displaystyle beta (x)=mathrm {const} =a} . Другое решение найдём, воспользовавшись тем, что β(x){displaystyle beta (x)} — функция. Целесообразно употребить выражение с отношением qp{displaystyle {frac {q}{p}}} , учитывая, что p+q=1{displaystyle p+q=1} : (qp)x=qx(p+q)px=qxpx−1+qx+1px=pqx+1px+1+qqx−1px−1=p(qp)x+1+q(qp)x−1{displaystyle left({frac {q}{p}}right)^{x}={frac {q^{x}(p+q)}{p^{x}}}={frac {q^{x}}{p^{x-1}}}+{frac {q^{x+1}}{p^{x}}}=p{frac {q^{x+1}}{p^{x+1}}}+q{frac {q^{x-1}}{p^{x-1}}}=pleft({frac {q}{p}}right)^{x+1}+qleft({frac {q}{p}}right)^{x-1}} . Отсюда правомерно предположить, что β(x)=b⋅(qp)x{displaystyle beta (x)=bcdot left({frac {q}{p}}right)^{x}} . Добавление константы ничего не изменит благодаря тому, что p+q=1{displaystyle p+q=1} .Теперь рассмотрим общее решение: β(x)=a+b(qp)x{displaystyle beta (x)=a+bleft({frac {q}{p}}right)^{x}}
. Воспользуемся теми условиями, что β(A)=a+b(qp)A=0{displaystyle beta (A)=a+bleft({frac {q}{p}}right)^{A}=0} и β(B)=a+b(qp)B=1{displaystyle beta (B)=a+bleft({frac {q}{p}}right)^{B}=1} , и получим, что β(x)=β(x)−01−0=β(x)−β(A)β(B)−β(A)=a+b(qp)x−(a+b(qp)A)a+b(qp)B−(a+b(qp)A)=(qp)x−(qp)B(qp)x−(qp)A.{displaystyle beta (x)={frac {beta (x)-0}{1-0}}={frac {beta (x)-beta (A)}{beta (B)-beta (A)}}={frac {a+bleft({frac {q}{p}}right)^{x}-left(a+bleft({frac {q}{p}}right)^{A}right)}{a+bleft({frac {q}{p}}right)^{B}-left(a+bleft({frac {q}{p}}right)^{A}right)}}={frac {left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{B}}{left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{A}}}.}Подзадача о единственности решения
Докажем единственность решения данной задачи. Для этого покажем, что любое решение задачи β(x)=pβ(x+1)+qβ(x−1){displaystyle beta (x)=pbeta (x+1)+qbeta (x-1)}
с граничными условиями может быть представлено в виде (qp)x−(qp)B(qp)x−(qp)A{displaystyle {frac {left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{B}}{left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{A}}}} .Решение. Рассмотрим некоторое решение βˇ(x){displaystyle {check {beta }}(x)}
при условиях βˇ(A)=0{displaystyle {check {beta }}(A)=0} , βˇ(B)=1{displaystyle {check {beta }}(B)=1} . Тогда всегда можно подобрать такие константы aˇ{displaystyle {check {a}}} и bˇ{displaystyle {check {b}}} , что aˇ+bˇ(qp)A=βˇ(A){displaystyle {check {a}}+{check {b}}left({frac {q}{p}}right)^{A}={check {beta }}(A)} , aˇ+bˇ(qp)A+1=βˇ(A+1){displaystyle {check {a}}+{check {b}}left({frac {q}{p}}right)^{A+1}={check {beta }}(A+1)} . Тогда из уравнения поставленной задачи следует, что βˇ(A+2)=aˇ+bˇ(qp)A+2{displaystyle {check {beta }}(A+2)={check {a}}+{check {b}}left({frac {q}{p}}right)^{A+2}} . Тогда в общем случае βˇ(x)=aˇ+bˇ(qp)x{displaystyle {check {beta }}(x)={check {a}}+{check {b}}left({frac {q}{p}}right)^{x}} . Следовательно, решение (qp)x−(qp)B(qp)x−(qp)A{displaystyle {frac {left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{B}}{left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{A}}}} является единственным. Точно такой же ход рассуждений может быть применён и к α(x){displaystyle alpha (x)} . ◼{displaystyle blacksquare }Предельная сходимость
Рассмотрим вопрос о быстроте предельной сходимости αn(x){displaystyle alpha _{n}(x)}
и βn(x){displaystyle beta _{n}(x)} к α(x){displaystyle alpha (x)} и β(x){displaystyle beta (x)} . Пусть блуждание начинается из начала координат (x=0{displaystyle x=0} ). Для простоты обозначим αn(0)=αn{displaystyle alpha _{n}(0)=alpha _{n}} , βn(0)=βn{displaystyle beta _{n}(0)=beta _{n}} , γn=1−αn−βn{displaystyle gamma _{n}=1-alpha _{n}-beta _{n}} . Иными словами, γn{displaystyle gamma _{n}} — это единица минус сумма вероятностей выхода частицы из коридора — вероятность того, что она останется блуждать в коридоре: γn=P{ω:A<Sk<B;0⩽k⩽n}{displaystyle gamma _{n}=mathbb {P} {omega colon A<S_{k}<B;0leqslant kleqslant n}} . ω{displaystyle omega } представляет собой событие ⋂0⩽k⩽n{A<Sk<B}{displaystyle bigcap limits _{0leqslant kleqslant n}{A<S_{k}<B}} . Рассмотрим число n=rm{displaystyle n=rm} , где r,m∈Z{displaystyle r,min mathbb {Z} } , и цепочку случайных величин ζn:ζ1=∑i=1mξi, ζ2=∑i=m+12mξi, …, ζr=∑i=m(r−1)rmξi{displaystyle zeta _{n}colon zeta _{1}=sum limits _{i=1}^{m}xi _{i},~zeta _{2}=sum limits _{i=m+1}^{2m}xi _{i},~ldots {},~zeta _{r}=sum limits _{i=m(r-1)}^{rm}xi _{i}} . Если обозначить совокупное богатство за C=|A|+B{displaystyle C=|A|+B} , то тогда {A<Sk<B;1⩽k⩽rm}⊆{|ζ1|<C;…;|ζr|<C}{displaystyle {A<S_{k}<B;1leqslant kleqslant rm}subseteq {bigl {}|zeta _{1}|<C;ldots {};|zeta _{r}|<C{bigr }}} . Этому есть разумное объяснение: если частица выходит из нуля и не пересекает границ, то тогда совершенно определённо сумма m{displaystyle m} штук xi{displaystyle x_{i}} меньше, чем совокупный запас.Подзадача о независимости случайных величин ζi{displaystyle zeta _{i}}
Докажем, что ζj{displaystyle zeta _{j}}независимы и одинаково распределённые. Достаточно доказать, что они независимы, так как все они имеют биномиальное распределение.
Решение. Докажем, что P({ζ1=m}∩{ζ2=m})=P({ζ1=m})⋅P({ζ2=m}).{displaystyle mathbb {P} {bigl (}{zeta _{1}=m}cap {zeta _{2}=m}{bigr )}=mathbb {P} {bigl (}{zeta _{1}=m}{bigr )}cdot mathbb {P} {bigl (}{zeta _{2}=m}{bigr )}.}
P({ζ1=m}∩{ζ2=m})=P({∑i=1mξi=m}∩{∑i=m+12mξi=m})={displaystyle mathbb {P} {bigl (}{zeta _{1}=m}cap {zeta _{2}=m}{bigr )}=mathbb {P} left(left{sum limits _{i=1}^{m}xi _{i}=mright}cap left{sum limits _{i=m+1}^{2m}xi _{i}=mright}right)=} |
=P({ξ1;…;m=1}∩{ξm+1;…;2m=1})=P2m({ξi=1})=P({ζ1=m})⋅P({ζ2=m}){displaystyle =mathbb {P} {bigl (}{xi _{1;ldots ;m}=1}cap {xi _{m+1;ldots ;2m}=1}{bigr )}=mathbb {P} ^{2m}{bigl (}{xi _{i}=1}{bigr )}=mathbb {P} {bigl (}{zeta _{1}=m}{bigr )}cdot mathbb {P} {bigl (}{zeta _{2}=m}{bigr )}} | . ◼{displaystyle blacksquare }
Вернёмся к рассмотрению сходимости. γn⩽P({|ζ1|;…;|ζr|<C})=∏i=1rP({|ζi|<C})=(P({|ζ1|<C}))r{displaystyle gamma _{n}leqslant mathbb {P} {Bigl (}{bigl {}|zeta _{1}|;ldots ;|zeta _{r}|<C{bigr }}{Bigr )}=prod limits _{i=1}^{r}mathbb {P} {Bigl (}{bigl {}|zeta _{i}|<C{bigr }}{Bigr )}={biggl (}mathbb {P} {Bigl (}{bigl {}|zeta _{1}|<C{bigr }}{Bigr )}{biggr )}^{r}}
splaystyle D(zeta _{1})=m{bigl (}1-(p-q)^{2}{bigr )}} (что вполне правомерно, так как 1−(p−q)2=1−((p+q)2−4pq){displaystyle 1-(p-q)^{2}=1-{bigl (}(p+q)^{2}-4pq{bigr )}} , а ξ{displaystyle xi } — модифицированная бернуллиевская случайная величина), поэтому для достаточно больших m{displaystyle m} и 0<p<1{displaystyle 0<p<1} верно: P({|ζ1|<C})⩽ε1{displaystyle mathbb {P} {Bigl (}{bigl {}|zeta _{1}|<C{bigr }}{Bigr )}leqslant varepsilon _{1}} , где ε1<1{displaystyle varepsilon _{1}<1} , так как если P({|ζ1|⩽C})=1{displaystyle mathbb {P} {Bigl (}{bigl {}|zeta _{1}|leqslant C{bigr }}{Bigr )}=1} , то D(ζ1)⩽C2{displaystyle D(zeta _{1})leqslant C^{2}} . Если p=0{displaystyle p=0} или p=1{displaystyle p=1} , то для довольно больших m{displaystyle m} верно, что P({|ζ1|<C})=0{displaystyle mathbb {P} {Bigl (}{bigl {}|zeta _{1}|<C{bigr }}{bigr )}=0} , поэтому неравенство P({|ζ1|<C})⩽ε1{displaystyle mathbb {P} {Bigl (}{bigl {}|zeta _{1}|<C{bigr }}{Bigr )}leqslant varepsilon _{1}} верно ∀p∈[0;1]{displaystyle forall pin [0;1]} . Из вышесказанного следует, что γn⩽εn{displaystyle gamma _{n}leqslant varepsilon ^{n}} , где ε=ε11m<1{displaystyle varepsilon =varepsilon _{1}^{frac {1}{m}}<1} . Так как α+β=1{displaystyle alpha +beta =1} , то (α−αn)−(β−βn)=γn{displaystyle (alpha -alpha _{n})-(beta -beta _{n})=gamma _{n}} ; так как α⩾αn{displaystyle alpha geqslant alpha _{n}} и β⩾βn{displaystyle beta geqslant beta _{n}} , то 0⩽α−αn⩽γn⩽εn{displaystyle 0leqslant alpha -alpha _{n}leqslant gamma _{n}leqslant varepsilon ^{n}} ; 0⩽β−βn⩽γn⩽εn{displaystyle 0leqslant beta -beta _{n}leqslant gamma _{n
}leqslant varepsilon ^{n}} при ε<1{displaystyle varepsilon <1} . Аналогичные оценки справедливы и для разностей α(x)−αn(x){displaystyle alpha (x)-alpha _{n}(x)} и β(x)−βn(x){displaystyle beta (x)-beta _{n}(x)} , так как можно свести эти разности к разностям α−αn{displaystyle alpha -alpha _{n}} и β−βn{displaystyle beta -beta _{n}} при A1=A−x{displaystyle A_{1}=A-x} , B1−B−x{displaystyle B_{1}-B-x} .
Вернёмся к рассмотрению α(x){displaystyle alpha (x)}
. По аналогии с решением (qp)x−(qp)B(qp)x−(qp)A{displaystyle {frac {left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{B}}{left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{A}}}} уравнения β(x)=pβ(x+1)+qβ(x−1){displaystyle beta (x)=pbeta (x+1)+qbeta (x-1)} , можно сказать, что у уравнения α(x)=pα(x+1)+qα(x−1){displaystyle alpha (x)=palpha (x+1)+qalpha (x-1)} при граничных условиях α(A)=1{displaystyle alpha (A)=1} , α(B)=0{displaystyle alpha (B)=0} существует единственное решение α(x)=(qp)B−(qp)x(qp)B−(qp)A,A⩽x⩽B.{displaystyle alpha (x)={frac {left({frac {q}{p}}right)^{B}-left({frac {q}{p}}right)^{x}}{left({frac {q}{p}}right)^{B}-left({frac {q}{p}}right)^{A}}},qquad Aleqslant xleqslant B.}Нетрудно заметить, что α(x)+β(x)=(qp)B−(qp)x(qp)B−(qp)A+(qp)x−(qp)B(qp)x−(qp)A=(qp)B−(qp)A(qp)B−(qp)A=1{displaystyle alpha (x)+beta (x)={frac {left({frac {q}{p}}right)^{B}-left({frac {q}{p}}right)^{x}}{left({frac {q}{p}}right)^{B}-left({frac {q}{p}}right)^{A}}}+{frac {left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{B}}{left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{A}}}={frac {left({frac {q}{p}}right)^{B}-left({frac {q}{p}}right)^{A}}{left({frac {q}{p}}right)^{B}-left({frac {q}{p}}right)^{A}}}=1}
при любых p∈[0;1]{displaystyle pin [0;1]} . Если же игра является справедливой (вероятность выпадения аверса равна вероятности выпадения реверса), то решения будут выглядеть следующим образом: β(x)=x−AB−A{displaystyle beta (x)={frac {x-A}{B-A}}} , α(x)=B−xB−A{displaystyle alpha (x)={frac {B-x}{B-A}}} .Ответ о вероятности разорения
Величины α(x){displaystyle alpha (x)}
и β(x){displaystyle beta (x)} было бы можно назвать вероятностями разорения первого и второго игрока при начальных капиталах x−A{displaystyle x-A} и x−B{displaystyle x-B} при стремлении количества ходов к бесконечности и характеризации случайной величина ξi=+1{displaystyle xi _{i}=+1} как выигрыша первого игрока, а ξi=−1{displaystyle xi _{i}=-1} — проигрыша первого игрока. В дальнейшем будет показано, почему такую последовательность действительно можно построить.Если A=0{displaystyle A=0}
, то интуитивный смысл функции β(x){displaystyle beta (x)} — это вероятность того, что частица, вышедшая из положения x{displaystyle x} , достигнет верхней стенки (B{displaystyle B} ) ранее, чем нуля. Из формул β(x){displaystyle beta (x)} видно, что β(x)={xB,p=q=0,5,(qp)x−1(qp)B−1,p≠q{displaystyle beta (x)={begin{cases}{frac {x}{B}},&p=q=0{,}5,\{frac {left({frac {q}{p}}right)^{x}-1}{left({frac {q}{p}}right)^{B}-1}},&pneq qend{cases}}} .Парадокс увеличения ставки при неблагоприятной игре
Что необходимо сделать первому игроку, если игра неблагоприятна для него?
Его вероятность проигрыша задана формулой limk→∞αk=α=(qp)B−1(qp)B−(qp)A{displaystyle lim limits _{krightarrow infty }alpha _{k}=alpha ={frac {left({frac {q}{p}}right)^{B}-1}{left({frac {q}{p}}right)^{B}-left({frac {q}{p}}right)^{A}}}}
}5B}+left({frac {q}{p}}right)^{0{,}5A}right)}}>alpha _{2}} , так как α2{displaystyle alpha _{2}} уможается на дробь, которая больше единицы при q>p{displaystyle q>p} .
Поэтому если вероятность выпадения столь желанного для первого игрока аверса меньше 0,5{displaystyle 0{,}5}
, то ему выгодно увеличить ставку в r>1{displaystyle r>1} раз: это уменьшает вероятность его терминального разорения за счёт того, что вырастает вероятность выскочить из коридора в точке B{displaystyle B} . Это решение кажется парадоксальным, так как складывается впечатление, что при неблагоприятной ситуации надо снизить ставку и уменьшить проигрыш, но в действительности при бесконечном числе игр и низкой ставке проигрывающий игрок в конечном счёте обязательно проиграется в ноль, а игрок с высокой ставкой обладает большими шансами выпадения количества аверсов, достаточного для завершения игры в точке B{displaystyle B} .Длительность случайного блуждания
Рассмотрим среднюю длительность блуждания нашей частицы. Введём математическое ожидание момента, когда игра прекращается: E(τkx)=mk(x{displaystyle mathbb {E} (tau _{k}^{x})=m_{k}(x}
для k⩽n{displaystyle kleqslant n} . Выведем рекуррентное соотношение для математического ожидания продолжительности игры:mk(x)=E(τkx)=∑1⩽l⩽klP({τkx=l})=∑1⩽l⩽kl(pP({τkx=l}|{ξ1=1})+qP({τkx=l}|{ξ1=−1}))={displaystyle m_{k}(x)=mathbb {E} (tau _{k}^{x})=sum limits _{1leqslant lleqslant k}lmathbb {P} {bigl (}{tau _{k}^{x}=l}{bigr )}=sum limits _{1leqslant lleqslant k}l{Bigl (}pmathbb {P} {bigl (}{tau _{k}^{x}=l}{big |}{xi _{1}=1}{bigr )}+qmathbb {P} {bigl (}{tau _{k}^{x}=l}{big |}{xi _{1}=-1}{bigr )}{Bigr )}=} |
=∑1⩽l⩽kl(pP({τk−1x+1=l−1})+qP{τk−1x−1=l−1}))=∑0⩽l⩽k−1(l+1)(pP({τk−1x+1=l})+qP({τk−1x−1=l}))={displaystyle =sum limits _{1leqslant lleqslant k}l{Bigl (}pmathbb {P} {bigl (}{tau _{k-1}^{x+1}=l-1}{bigr )}+qmathbb {P} {bigl {}tau _{k-1}^{x-1}=l-1}{bigr )}{Bigr )}=sum limits _{0leqslant lleqslant k-1}(l+1){Bigl (}pmathbb {P} {bigl (}{tau _{k-1}^{x+1}=l}{bigr )}+qmathbb {P} {bigl (}{tau _{k-1}^{x-1}=l}{bigr )}{Bigr )}=} |
=pmk−1(x+1)+qmk−1(x−1)+∑0⩽l⩽k−1(pP({τk−1x+1=l})+qP({τk−1x−1=l}))=pmk−1(x+1)+qmk−1(x−1)+1.{displaystyle =pm_{k-1}(x+1)+qm_{k-1}(x-1)+sum limits _{0leqslant lleqslant k-1}{Bigl (}pmathbb {P} {bigl (}{tau _{k-1}^{x+1}=l}{bigr )}+qmathbb {P} {bigl (}{tau _{k-1}^{x-1}=l}{bigr )}{Bigr )}=pm_{k-1}(x+1)+qm_{k-1}(x-1)+1.} |
Для x∈(A;B){displaystyle xin (A;B)}
и k∈[0;n]{displaystyle kin [0;n]} мы получили рекуррентное соотношение для функции mk(x){displaystyle m_{k}(x)} : mk(x)=pmk−1(x+1)+qmk−1(x−1)+1{displaystyle m_{k}(x)=pm_{k-1}(x+1)+qm_{k-1}(x-1)+1} при m0(x)=0{displaystyle m_{0}(x)=0} . Введём граничные условия: если игра начинается в точке A{displaystyle A} или B{displaystyle B} , то тогда она тут же и завершится — её длительность будет равна 0: mk(A)=mk(B)=0{displaystyle m_{k}(A)=m_{k}(B)=0} . Из рекуррентного соотношения и граничных условий можно один за другим вычислить mi(x){displaystyle m_{i}(x)} . Так как mk+1(x)⩾mk(x){displaystyle m_{k+1}(x)geqslant m_{k}(x)} , то существует предел m(x)=limn→∞mn(x){displaystyle m(x)=lim limits _{nrightarrow infty }m_{n}(x)} , который удовлетворяет соотношению mk(x)=pmk−1(x+1)+qmk−1(x−1)+1{displaystyle m_{k}(x)=pm_{k-1}(x+1)+qm_{k-1}(x-1)+1} : m(x)=1+pm(x+1)+qm(x−1){displaystyle m(x)=1+pm(x+1)+qm(x-1)} при выполнении m(A)=m(B)=0{displaystyle m(A)=m(B)=0} . Данные переходы аналогичны тем, что мы рассмотрели при переходе к n→∞{displaystyle nrightarrow infty } в уравнении вероятности проигрыша. Для того чтобы решить данное уравнение, надо ввести ещё одно условие: матожидание количества ходов должно быть конечным, т. е. m(x)<∞{displaystyle m(x)<infty } , x∈(A;B){displaystyle xin (A;B)} .Решим данное уравнение. В уравнении вероятности проигрыше (p≠q{displaystyle pneq q}
) уже были получены частные решения a{displaystyle a} и b(qp)x{displaystyle bleft({frac {q}{p}}right)^{x}} . Здесь же появляется ещё один претендент на роль частного решения: xq−p=q−p+(p+q)x+p−qq−p=q−pq−p+p(x+1)q−p+q(x−1)q−p=1+px+1q−p+qx−1q−p{displaystyle {frac {x}{q-p}}={frac {q-p+(p+q)x+p-q}{q-p}}={frac {q-p}{q-p}}+{frac {p(x+1)}{q-p}}+{frac {q(x-1)}{q-p}}=1+p{frac {x+1}{q-p}}+q{frac {x-1}{q-p}}} , поэтому m(x)=xq−p+a+b(qp)x{displaystyle m(x)={frac {x}{q-p}}+a+bleft({frac {q}{p}}right)^{x}} . С учётом граничного условия m(A)=m(B)=0{displaystyle m(A)=m(B)=0} находим при помощи ранее полученных соотношений m(x){displaystyle m(x)} : m(x)=1p−q(Bβ(x)+Aα(x)−x){displaystyle m(x)={frac {1}{p-q}}{bigl (}Bbeta (x)+Aalpha (x)-x{bigr )}} . В случае идеальной монетки получаем следующее выражение: m(x)=a+bx−x2{displaystyle m(x)=a+bx-x^{2}} . Применение граничного условия даёт: m(x)=(B−x)(x−A){displaystyle m(x)=(B-x)(x-A)} . Из этого следует, что в случае равных стартовых капиталов m(0)=B2{displaystyle m(0)=B^{2}} . Например, если у каждого игрока есть по 5 рублей, а ставка — 1 рубль, то в среднем разоряться игроки будут через 25 ходов.При рассмотрении вышеуказанных формул подразумевалась конечностью математического ожидания числа ходов: m(x)<∞{displaystyle m(x)<infty }
. Теперь будет предложено доказательство этого факта.Задача о конечности ожидаемого числа ходов
Доказать, что m(x)<∞∀A,B{displaystyle m(x)<infty quad forall A,B}
.Решение. Достаточно доказать это для случая x=0{displaystyle x=0}
(так как ранее было уже продемонстрировано, что случаи x≠0{displaystyle xneq 0} могут быть сведены к x=0{displaystyle x=0} вариацией A{displaystyle A} и B{displaystyle B} ) и p=q{displaystyle p=q} , а затем рассмотреть случай p≠q{displaystyle pneq q} . Итак, рассмотрим последовательность S0;1;…;n{displaystyle S_{0;1;ldots ;n}} и введём случайную величину Sτn=Sτn(ω){displaystyle S_{tau _{n}}=S_{tau _{n}}(omega )} , где τn=τn0{displaystyle tau _{n}=tau _{n}^{0}} — момент остановки. Далее, пусть Sτn(ω)=∑k=0nSk(ω)1{τn=k}(ω){displaystyle S_{tau _{n}}(omega )=sum limits _{k=0}^{n}S_{k}(omega )mathbf {1} _{{{tau _{n}=k}}}(omega )} . Интерпретация такова: Sτn{displaystyle S_{tau _{n}}} — это значение случайного блуждания в момент τn{displaystyle tau _{n}} . Если τn<n{displaystyle tau _{n}<n} , то Sτn∈{A;B}{displaystyle S_{tau _{n}}in {A;B}} ; если τn=n{displaystyle tau _{n}=n} , то A⩽Sτn⩽B{displaystyle Aleqslant S_{tau _{n}}leqslant B} . Вспомним, что p=q=0,5{displaystyle p=q=0{,}5} , и докажем, что E(Sτn)=0{displaystyle mathbb {E} (S_{tau _{n}})=0} , E(Sτn2)=E(τn){displaystyle mathbb {E} (S_{tau _{n}}^{2})=mathbb {E} (tau _{n})} .Для доказательства первого равенства напишем: E(Sτn)=∑k=0nE(Sk1{τn=k}(ω))=∑k=0nE(Sn1{τn=k}(ω))+∑k=0n((Sk−Sn)1{τn=k}(ω))=E(Sn)+∑k=0n((Sk−Sn)1{τn=k}(ω)){displaystyle mathbb {E} (S_{tau _{n}})=sum limits _{k=0}^{n}mathbb {E} {bigl (}S_{k}mathbf {1} _{{{tau _{n}=k}}}(omega ){bigr )}=sum limits _{k=0}^{n}mathbb {E} {bigl (}S_{n}mathbf {1} _{{{tau _{n}=k}}}(omega ){bigr )}+sum limits _{k=0}^{n}{bigl (}(S_{k}-S_{n})mathbf {1} _{{{tau _{n}=k}}}(omega ){bigr )}=mathbb {E} (S_{n})+sum limits _{k=0}^{n}{bigl (}(S_{k}-S_{n})mathbf {1} _{{{tau _{n}=k}}}(omega ){bigr )}}событие может быть представлено в виде {ω:(ξ1;…;ξn)∈J}{displaystyle {bigl {}omega colon (xi _{1};ldots ;xi _{n})in J{bigr }}} , где J{displaystyle J} — некоторое подмножество множества {−1;+1}k{displaystyle {-1;+1}^{k}} . Это множество определяется только ξi{displaystyle xi _{i}} при i=1;k¯{displaystyle i={overline {1;k}}} . Для бо́льших i{displaystyle i} значения ξk+1;…;ξn{displaystyle xi _{k+1};ldots ;xi _{n}} не влияют на J{displaystyle J} . Множество вида {τn=k}={τn>k−1}∖{τn>k}{displaystyle {tau _{n}=k}={tau _{n}>k-1}backslash {tau _{n}>k}} также может быть представлено в виде {ω:(ξ1;…;ξn)∈J}{displaystyle {bigl {}omega colon (xi _{1};ldots ;xi _{n})in J{bigr }}} . Благодаря независимости ξi{displaystyle xi _{i}} (доказано в подзадаче 2) вытекает, что ∀0⩽k<n{displaystyle forall 0leqslant k<n} случайные величины Sn−Sk{displaystyle S_{n}-S_{k}} и 1{τn=k}{displaystyle mathbf {1} _{{tau _{n}=k}}} независимы. Отсюда E(Sk⋅1{τn=k}(ω))=E(Sk)⋅E(1{τn=k}(ω))=0{displaystyle mathbb {E} {bigl (}S_{k}cdot mathbf {1} _{{{tau _{n}=k}}}(omega ){bigr )}=mathbb {E} (S_{k})cdot mathbb {E} {bigl (}mathbf {1} _{{{tau _{n}=k}}}(omega ){bigr )}=0} в силу того, что первый множитель нулевой.
. Совершенно очевидно, что E(Sn)=0{displaystyle mathbb {E} (S_{n})=0} , так как Sn=ξ1+…+ξn{displaystyle S_{n}=xi _{1}+ldots +xi _{n}} , ξi=±1{displaystyle xi _{i}=pm 1} при p=q{displaystyle p=q} . Осталось доказать, что ∑k=0n((Sk−Sn)1{τn=k}(ω))=0{displaystyle sum limits _{k=0}^{n}{bigl (}(S_{k}-S_{n})mathbf {1} _{{{tau _{n}=k}}}(omega ){bigr )}=0} . Для 0⩽k<n{displaystyle 0leqslant k<n} справедливо, что {τn>k}={A<S1<B;…;A<Sk<B}{displaystyle {tau _{n}>k}={A<S_{1}<B;ldots ;A<S_{k}<B}} . ПоследнееE(Sτn2)=∑k=0nE(Sk21{τn=k})={displaystyle mathbb {E} (S_{tau _{n}}^{2})=sum limits _{k=0}^{n}mathbb {E} (S_{k}^{2}mathbf {1} _{{{tau _{n}=k}}})=} |
=∑k=0nE((Sn+(Sk−Sn)2)1{τn=k})=∑k=0n(E(S2)1{τn=k}+2E(Sn(Sk−Sn))1{τn=k}+E((Sn−Sk)2)1{τn=k})={displaystyle =sum limits _{k=0}^{n}mathbb {E} {Bigl (}{bigl (}S_{n}+(S_{k}-S_{n})^{2}{bigr )}mathbf {1} _{{{tau _{n}=k}}}{Bigr )}=sum limits _{k=0}^{n}{Bigl (}mathbb {E} (S^{2})mathbf {1} _{{{tau _{n}=k}}}+2mathbb {E} {bigl (}S_{n}(S_{k}-S_{n}){bigr )}mathbf {1} _{{{tau _{n}=k}}}+mathbb {E} {bigl (}(S_{n}-S_{k})^{2}{bigr )}mathbf {1} _{{{tau _{n}=k}}}{Bigr )}=} |
=E(S2)−∑k=0nE((Sn−Sk)2)1{τn=k}=n−∑k=0nE(n−k)P({τn=k})=∑k=0nkP({τn=k})=E(τn).{displaystyle =mathbb {E} (S^{2})-sum limits _{k=0}^{n}mathbb {E} {bigl (}(S_{n}-S_{k})^{2}{bigr )}mathbf {1} _{{{tau _{n}=k}}}=n-sum limits _{k=0}^{n}mathbb {E} (n-k)mathbb {P} {bigl (}{tau _{n}=k}{bigr )}=sum limits _{k=0}^{n}kmathbb {P} {bigl (}{tau _{n}=k}{bigr )}=mathbb {E} (tau _{n}).} |
Установлено, что для идеальной монетки E(Sτn)=0{displaystyle mathbb {E} (S_{tau _{n}})=0}
, E(Sτn2)=E(τn){displaystyle mathbb {E} (S_{tau _{n}}^{2})=mathbb {E} (tau _{n})} . В случае же p≠q{displaystyle pneq q} имеют место соотношения E(Sτn)=(p−q)E(τn){displaystyle mathbb {E} (S_{tau _{n}})=(p-q)mathbb {E} (tau _{n})} (поскольку E(ξ1)=p−q{displaystyle mathbb {E} (xi _{1})=p-q} ) и E((Sτn−τnE(ξ1))2)=D(ξ1)⋅E(τn){displaystyle mathbb {E} {Bigl (}{bigl (}S_{tau _{n}}-tau _{n}mathbb {E} (xi _{1}){bigr )}^{2}{Bigr )}=D(xi _{1})cdot mathbb {E} (tau _{n})} , поскольку D(ξ1)=1−(p−q)2{displaystyle D(xi _{1})=1-(p-q)^{2}} . Теперь покажем, что limn→∞mn(0)=m(0)<∞{displaystyle lim limits _{nrightarrow infty }m_{n}(0)=m(0)<infty } . В случае справедливой игры в силу соотношения E(Sτn2)=E(τn){displaystyle mathbb {E} (S_{tau _{n}}^{2})=mathbb {E} (tau _{n})} верно, что E(τn)⩽max{A2;B2}{displaystyle mathbb {E} (tau _{n})leqslant max{A^{2};B^{2}}} . Тогда же E(τn)=E(Sτn2)=A2αn+B2βn+E(Sn21{A<Sn<B})1{τn=n}{displaystyle mathbb {E} (tau _{n})=mathbb {E} (S_{tau _{n}}^{2})=A^{2}alpha _{n}+B^{2}beta _{n}+mathbb {E} (S_{n}^{2}mathbf {1} _{{{A<S_{n}<B}}})mathbf {1} _{{{tau _{n}=n}}}} , поэтому A2αn+B2βn⩽E(τn)⩽A2αn+B2βn+max{A2;B2}⋅γn{displaystyle A^{2}alpha _{n}+B^{2}beta _{n}leqslant mathbb {E} (tau _{n})leqslant A^{2}alpha _{n}+B^{2}beta _{n}+max{A^{2};B^{2}}cdot gamma _{n}} . Из неравенства γn<εn{displaystyle gamma _{n}<varepsilon ^{n}} следует, что математическое ожидание E(τn){displaystyle mathbb {E} (tau _{n})} сходится при n→∞{displaystyle nrightarrow infty } к предельному значению m(0)=A2α+B2β=A2⋅BB−A−B2⋅AB−A=|AB|{displaystyle m(0)=A^{2}alpha +B^{2}beta =A^{2}cdot {frac {B}{B-A}}-B^{2}cdot {frac {A}{B-A}}=|AB|} . В случае несправедливой игры E(τn)⩽max{|A|;B}|p−q|{displaystyle mathbb {E} (tau _{n})leqslant {frac {max{|A|;B}}{|p-q|}}} . Так как за τn{displaystyle tau _{n}} обозначался момент первого вылета частицы за пределы коридора, то математическое ожидание его меньше определённых чисел, следовательно, меньше бесконечности. При таком условии E(τn)→m(0)=αA+βBp−q{displaystyle mathbb {E} (tau _{n})rightarrow m(0)={frac {alpha A+beta B}{p-q}}} . ◼{displaystyle blacksquare }