wiki

Задача о разорении игрока

Разделы:

Это заготовка статьи. Вы можете помочь проекту, дополнив её.
Это примечание по возможности следует заменить более точным.

Задача о разорении игрока — задача из области теории вероятностей.

Table of Contents

Формулировка

За столом сидят два игрока. У первого в распоряжении находится −A{displaystyle -A} $-A$ (A<0{displaystyle A<0} ${displaystyle A<0}$ ) рублей, у другого — B{displaystyle B} $B$ рублей. Перед ними на столе лежит асимметричная монета (вероятность, что выпадет аверс, может равняться любому числу от 0 до 1 включительно). Если на монете выпадает аверс, то рубль выигрывает первый игрок (второй игрок выплачивает первому 1 рубль), а если выпадает реверс, то первый игрок платит второму один рубль. Требуется найти вероятность того, что один из игроков проиграется в ноль за n{displaystyle n} $n$ шагов, и вероятность проигрыша каждого азартного игрока. Также необходимо вычислить среднюю длину игры.

Данная ситуация может быть смоделирована подобным образом: имеется блуждающая частица и коридор [A;B]{displaystyle [A;B]} $[A;B]$ . Рассматривается вероятность того, что частица выйдет из коридора за n{displaystyle n} $n$ шагов (проскочит через верхнюю или нижнюю стенку).

Схема Бернулли

Рассмотрим схему Бернулли с n{displaystyle n} $n$ испытаниями. Пусть (Ω,A,P){displaystyle (Omega ,{mathcal {A}},mathbb {P} )} $(Omega,mathcal{A},mathbb{P})$ — вероятностное пространство, где Ω={ω:ω=(x1;…;xn), xi=±1}{displaystyle Omega ={bigl {}omega colon omega =(x_{1};ldots ;x_{n}), x_{i}=pm 1{bigr }}} $Omega = bigl{omegacolon omega=(x_1;ldots;x_n), x_i = pm 1 bigr}$ . A={Ai⊆Ω}{displaystyle {mathcal {A}}={A_{i}subseteq Omega }} $mathcal{A} = { A_i subseteq Omega }$ — алгебра подмножеств вероятностного пространства. Вероятность задана следующим образом: P({ω})=pν(ω)⋅qn−ν(ω){displaystyle mathbb {P} {bigl (}{omega }{bigr )}=p^{nu (omega )}cdot q^{n-nu (omega )}} $mathbb{P}bigl({ omega }bigr) = p^{nu(omega)}cdot q^{n-nu(omega)}$ , где ν(ω){displaystyle nu (omega )} $nu(omega)$ — количество выпавших в данной последовательность единиц: ν(ω)=∑i=1nxi+n2{displaystyle nu (omega )={frac {sum limits _{i=1}^{n}x_{i}+n}{2}}} $nu(omega) = frac{sumlimits_{i=1}^n x_i + n}{2}$ . Данная формула позволяет считать количество единиц: ν(ω){displaystyle nu (omega )} $nu(omega)$ превращает соответственно полученные значения (+1;−1){displaystyle (+1;-1)} $(+1;-1)$ в (1;0){displaystyle (1;0)} $(1;0)$ и затем уже считает полученные единицы. Введём последовательность бернуллиевских случайных величин ξi(ω):i=1;n¯;P({ξi=1})=p;P({ξi=−1})=q;p+q=1.{displaystyle xi _{i}(omega )colon i={overline {1;n}};quad mathbb {P} {bigl (}{xi _{i}=1}{bigr )}=p;quad mathbb {P} {bigl (}{xi _{i}=-1}{bigr )}=q;quad p+q=1.} $xi_i(omega)colon i=overline{1;n};quadmathbb{P}bigl({xi_i=1}bigr)=p;quadmathbb{P}bigl({xi_i=-1}bigr)=q;quad p+q=1.$

Подзадача о нормированности вероятности

Доказать, что ∑ω∈ΩP({ω})=1.{displaystyle sum limits _{omega in Omega }mathbb {P} {bigl (}{omega }{bigr )}=1.} $sumlimits_{omegainOmega} mathbb{P}bigl({omega}bigr) = 1.$

Решение. ∑ω∈ΩP({ω})=∑ω∈Ωp∑i=1nxi+n2⋅qn−∑i=1nxi+n2=∑k=0n∑ω∈Akp∑i=1n(xi+1)2⋅q∑i=1n(1−xi)2=∑k=0nCnkpkqn−k.{displaystyle sum limits _{omega in Omega }mathbb {P} {bigl (}{omega }{bigr )}=sum limits _{omega in Omega }p^{frac {sum limits _{i=1}^{n}x_{i}+n}{2}}cdot q^{n-{frac {sum limits _{i=1}^{n}x_{i}+n}{2}}}=sum limits _{k=0}^{n}sum limits _{omega in A_{k}}p^{frac {sum limits _{i=1}^{n}(x_{i}+1)}{2}}cdot q^{frac {sum limits _{i=1}^{n}(1-x_{i})}{2}}=sum limits _{k=0}^{n}C_{n}^{k}p^{k}q^{n-k}.} ${displaystyle sum limits _{omega in Omega }mathbb {P} {bigl (}{omega }{bigr )}=sum limits _{omega in Omega }p^{frac {sum limits _{i=1}^{n}x_{i}+n}{2}}cdot q^{n-{frac {sum limits _{i=1}^{n}x_{i}+n}{2}}}=sum limits _{k=0}^{n}sum limits _{omega in A_{k}}p^{frac {sum limits _{i=1}^{n}(x_{i}+1)}{2}}cdot q^{frac {sum limits _{i=1}^{n}(1-x_{i})}{2}}=sum limits _{k=0}^{n}C_{n}^{k}p^{k}q^{n-k}.}$ Это справедливо в силу того, что xi+12∈{0;1}.{displaystyle {frac {x_{i}+1}{2}}in {0;1}.} $frac{x_i+1}{2}in { 0;1 }.$ ∑k=0nCnkpkqn−k=(p+q)n=1{displaystyle sum limits _{k=0}^{n}C_{n}^{k}p^{k}q^{n-k}=(p+q)^{n}=1} $sumlimits_{k=0}^n C^k_n p^k q^{n-k} = (p+q)^n = 1$ , поскольку по условию p+q=1{displaystyle p+q=1} $p+q=1$ . ◼{displaystyle blacksquare } $blacksquare$

Подзадача о независимости случайных величин ξi{displaystyle xi _{i}} $xi _{i}$

Доказать, что ξ1{displaystyle xi _{1}} $xi_1$ и ξ2{displaystyle xi _{2}} $xi_2$ независимы.

Решение. Достаточно доказать, что P({ξ1=1}∩{ξ2=1})=P({ξ1=1})P({ξ2=1}).{displaystyle mathbb {P} {bigl (}{xi _{1}=1}cap {xi _{2}=1}{bigr )}=mathbb {P} {bigl (}{xi _{1}=1}{bigr )}mathbb {P} {bigl (}{xi _{2}=1}{bigr )}.} $mathbb{P}bigl({xi_1=1}cap{xi_2=1} bigr)=mathbb{P}bigl( {xi_1=1} bigr)mathbb{P} bigl({xi_2=1} bigr).$

P({ξ1=1}∩{ξ2=1})=P({ω:ω=(x1;…;xn), x1=1, x2=1})={displaystyle mathbb {P} {bigl (}{xi _{1}=1}cap {xi _{2}=1}{bigr )}=mathbb {P} {bigl (}{omega colon omega =(x_{1};ldots ;x_{n}), x_{1}=1, x_{2}=1}{bigr )}=}

mathbb{P}bigl( {xi_1=1}cap{xi_2=1} bigr) = mathbb{P} bigl({ omegacolon omega=(x_1;ldots;x_n), x_1=1, x_2=1 } bigr) =

=∑x3=±1…xn=±1p2+∑i=3nxi+n2⋅qn−2+∑i=3nxi+n2=p2∑x3=±1…xn=±1p∑i=3nxi+(n−2)2⋅q(n−2)−∑i=3nxi+(n−2)2=p2⋅1.{displaystyle =sum limits _{begin{smallmatrix}x_{3}=pm 1\ldots {}\x_{n}=pm 1end{smallmatrix}}p^{frac {2+sum limits _{i=3}^{n}x_{i}+n}{2}}cdot q^{n-{frac {2+sum limits _{i=3}^{n}x_{i}+n}{2}}}=p^{2}sum limits _{begin{smallmatrix}x_{3}=pm 1\ldots {}\x_{n}=pm 1end{smallmatrix}}p^{frac {sum limits _{i=3}^{n}x_{i}+(n-2)}{2}}cdot q^{(n-2)-{frac {sum limits _{i=3}^{n}x_{i}+(n-2)}{2}}}=p^{2}cdot 1.}

=sumlimits_{begin{smallmatrix}x_3=pm 1 \ ldots{} \ x_n=pm 1end{smallmatrix}} p^{frac{2+sumlimits_{i=3}^n x_i + n}{2}}cdot q^{n - frac{2+sumlimits_{i=3}^n x_i + n}{2}} = p^2 sumlimits_{begin{smallmatrix}x_3=pm 1 \ ldots{} \ x_n=pm 1end{smallmatrix}} p^{frac{sumlimits_{i=3}^n x_i + (n-2)}{2}}cdot q^{(n-2) - frac{sumlimits_{i=3}^n x_i + (n-2)}{2}} = p^2 cdot 1.

◼{displaystyle blacksquare }

blacksquare

Случайное блуждание

Введём новое обозначение: S0=0{displaystyle S_{0}=0} $S_0 = 0$ , Sk=ξ1+…+ξk,1⩽k⩽n{displaystyle S_{k}=xi _{1}+ldots {}+xi _{k},quad 1leqslant kleqslant n} $S_k = xi_1 + ldots{} + xi_k, quad 1leqslant k leqslant n$ . n{displaystyle n} $n$ — длина игры, а последовательность (Sk)k⩽n{displaystyle (S_{k})_{kleqslant n}} $(S_k)_{kleqslant n}$ можно рассматривать как траекторию случайного блуждания некоторой частицы, выходящей из нуля. При этом Sk+1=Sk+ξk+1{displaystyle S_{k+1}=S_{k}+xi _{k+1}} $S_{k+1} = S_k + xi_{k+1}$ . Пусть A{displaystyle A} $A$ , B{displaystyle B} $B$ — два целых числа, A⩽0{displaystyle Aleqslant 0} $Aleqslant 0$ , B⩾0{displaystyle Bgeqslant 0} $B geqslant 0$ . Требуется найти, с какой вероятностью за n{displaystyle n} $n$ шагов будет осуществлён выход частицы из коридора, ограниченного A{displaystyle A} $A$ и B{displaystyle B} $B$ . Если ξi=+1{displaystyle xi _{i}=+1} $xi_i = +1$ , то второй игрок платит первому. Если ξi=−1{displaystyle xi _{i}=-1} $xi_i = -1$ , то первый игрок платит второму. Поэтому Sk{displaystyle S_{k}} $S_k$ может рассматриваться в качестве выигрыша первого игрока у второго (который, естественно, может быть отрицательным). Далее, пусть x{displaystyle x} $x$ — целое число, x∈Z∩[A;B]{displaystyle xin mathbb {Z} cap [A;B]} $xin mathbb{Z}cap [A;B]$ . Пусть также для 0⩽k⩽n{displaystyle 0leqslant kleqslant n} $0leqslant k leqslant n$ верно, что Skx=x+Sk{displaystyle S_{k}^{x}=x+S_{k}} $S^x_k = x+S_k$ (что означает, что игроки начинали играть с ненулевым капиталом в распоряжении). Пусть τkx=min{l:0⩽l⩽k,Slx={A or B}}{displaystyle tau _{k}^{x}=min {bigl {}lcolon 0leqslant lleqslant k,S_{l}^{x}={Amathrm {~or~} B}{bigr }}} $tau^x_k = min bigl{ lcolon 0leqslant l leqslant k, S^x_l = {A mathrm{~or~} B } bigr}$ . Условимся считать, что τkx=k{displaystyle tau _{k}^{x}=k} $tau^x_k = k$ , если A<Slx<B∀l:0⩽l⩽k{displaystyle A<S_{l}^{x}<Bquad forall lcolon 0leqslant lleqslant k} $A < S_l^x < Bquad forall lcolon 0leqslant l leqslant k$ . Если частица так и не пересекла границы, то xk{displaystyle x_{k}} $x_k$ не определён.

Для каждого 0⩽k⩽n{displaystyle 0leqslant kleqslant n} $0leqslant k leqslant n$ и x∈[A;B]∩Z{displaystyle xin [A;B]cap mathbb {Z} } $xin [A; B]cap mathbb{Z}$ момент τkx{displaystyle tau _{k}^{x}} $tau^x_k$ называется моментом остановки, который является случайной величиной, определённой на пространстве элементарных событий Ω{displaystyle Omega } $Omega$ . ∀l<k{ω:τkx=l}{displaystyle forall l<kquad {omega colon tau _{k}^{x}=l}} $forall l<kquad {omegacolon tau^x_k = l}$ — это событие, состоящее в том, что случайное блуждание {Six:0⩽i⩽k}{displaystyle {S_{i}^{x}colon 0leqslant ileqslant k}} ${S^x_icolon 0leqslant i leqslant k }$ , начинающееся в точке x{displaystyle x} $x$ , выйдет из интервала [A;B]{displaystyle [A;B]} $[A;B]$ в момент l{displaystyle l} $l$ . Введём новые обозначения: Akx=∐0⩽l⩽k{ω:τkx=l, Slx=A}{displaystyle {mathcal {A}}_{k}^{x}=coprod limits _{0leqslant lleqslant k}{omega colon tau _{k}^{x}=l, S_{l}^{x}=A}} $mathcal{A}^x_k = coprodlimits_{0leqslant l leqslant k}{ omegacolon tau^x_k= l, S^x_l = A }$ , Bkx=∐0⩽l⩽k{ω:τkx=l, Slx=B}{displaystyle {mathcal {B}}_{k}^{x}=coprod limits _{0leqslant lleqslant k}{omega colon tau _{k}^{x}=l, S_{l}^{x}=B}} $mathcal{B}^x_k = coprodlimits_{0leqslant l leqslant k}{ omegacolon tau^x_k= l, S^x_l = B }$ для 0⩽k⩽n{displaystyle 0leqslant kleqslant n} $0leqslant k leqslant n$ . Пусть αk(x)=P(Akx){displaystyle alpha _{k}(x)=mathbb {P} ({mathcal {A}}_{k}^{x})} $alpha_k(x) = mathbb{P} (mathcal{A}^x_k)$ , βk(x)=P(Bkx){displaystyle beta _{k}(x)=mathbb {P} ({mathcal {B}}_{k}^{x})} $beta_k(x) = mathbb{P} (mathcal{B}^x_k)$ — вероятности выхода частицы за время [0;k]{displaystyle [0;k]} $[0;k]$ из интервала [A;B]{displaystyle [A
;B]} $[A;B]$ соответственно в точках A{displaystyle A} $A$ и B{displaystyle B} $B$ .

Пусть A<x<B{displaystyle A<x<B} $A<x<B$ ; очевидно, что α0(x)=β0(x)=0{displaystyle alpha _{0}(x)=beta _{0}(x)=0} $alpha_0(x) = beta_0 (x) = 0$ (пока игра не началась, частица находится внутри интервала с вероятностью 1). Пусть теперь 0⩽k⩽n{displaystyle 0leqslant kleqslant n} $0leqslant k leqslant n$ . Тогда по формуле полной вероятности βk(x)=P(Bkx)=P(Bkx∣S1x=x+1)⋅P({ξ1=1})+P(Bkx∣S1x=x−1)⋅P({ξ1=−1}).{displaystyle beta _{k}(x)=mathbb {P} ({mathcal {B}}_{k}^{x})=mathbb {P} ({mathcal {B}}_{k}^{x}mid S_{1}^{x}=x+1)cdot mathbb {P} {bigl (}{xi _{1}=1}{bigr )}+mathbb {P} ({mathcal {B}}_{k}^{x}mid S_{1}^{x}=x-1)cdot mathbb {P} {bigl (}{xi _{1}=-1}{bigr )}.} $beta_k (x) = mathbb{P} (mathcal{B}^x_k) = mathbb{P} ( mathcal{B}^x_k mid S_1^x = x+1 )cdot mathbb{P}bigl({xi_1 = 1 }bigr) + mathbb{P} ( mathcal{B}^x_k mid S_1^x = x-1 )cdot mathbb{P}bigl({ xi_1 = -1 }bigr).$

Подзадача о рекуррентности

Доказать, что (1) P(Bkx∣S1x=x+1)=P(Bk−1x+1){displaystyle mathbb {P} ({mathcal {B}}_{k}^{x}mid S_{1}^{x}=x+1)=mathbb {P} ({mathcal {B}}_{k-1}^{x+1})} $mathbb{P} ( mathcal{B}^x_k mid S_1^x = x+1 ) = mathbb{P} ( mathcal{B}^{x+1}_{k-1} )$ и (2) P(Bkx∣S1x=x−1)=P(Bk−1x−1){displaystyle mathbb {P} ({mathcal {B}}_{k}^{x}mid S_{1}^{x}=x-1)=mathbb {P} ({mathcal {B}}_{k-1}^{x-1})} $mathbb{P} ( mathcal{B}^x_k mid S_1^x = x-1 ) = mathbb{P} ( mathcal{B}^{x-1}_{k-1} )$ .

Доказательство.

(1) Докажем, что P(Bkx∣S1x=x+1)=P(Bk−1x+1){displaystyle mathbb {P} ({mathcal {B}}_{k}^{x}mid S_{1}^{x}=x+1)=mathbb {P} ({mathcal {B}}_{k-1}^{x+1})} $mathbb{P} ( mathcal{B}^x_k mid S_1^x = x+1 ) = mathbb{P} ( mathcal{B}^{x+1}_{k-1} )$ . Bkx={ω:(x;x+ξ1;…;x+ξ1+…+ξk)∈Bkx}{displaystyle {mathcal {B}}_{k}^{x}={bigl {}omega colon (x;x+xi _{1};ldots {};x+xi _{1}+ldots {}+xi _{k})in B_{k}^{x}{bigr }}} $mathcal{B}^x_k = bigl{ omegacolon (x;x+xi_1;ldots{};x+xi_1+ldots{}+xi_k) in B^x_k bigr}$ , где Bkx{displaystyle B_{k}^{x}} $B^x_k$ — множество траекторий вида (x;x+x1;…;x+x1+…+xk),xi=±1{displaystyle (x;x+x_{1};ldots {};x+x_{1}+ldots {}+x_{k}),quad x_{i}=pm 1} $(x;x+x_1;ldots{};x+x_1+ldots{}+x_k),quad x_i=pm 1$ , которые за время [0;k]{displaystyle [0;k]} $[0;k]$ впервые выходят из интервала (A;B){displaystyle (A;B)} $(A;B)$ в точке B{displaystyle B} $B$ (показано на рисунке). Если случайный вектор попадает в подходящую траекторию, то он попадает в множество B{displaystyle {mathcal {B}}} ${mathcal {B}}$ . Представим множество Bkx{displaystyle B_{k}^{x}} $B_k^x$ как Bkx;x+1⊔Bkx;x−1{displaystyle B_{k}^{x;x+1}sqcup B_{k}^{x;x-1}} $B_k^{x;x+1}sqcup B_k^{x;x-1}$ . Дизъюнктное объединение правомерно по причине того, что у любой частицы, проходящей по траектории, x1=±1{displaystyle x_{1}=pm 1} $x_1=pm 1$ . Bkx;x+1{displaystyle B_{k}^{x;x+1}} $B_k^{x;x+1}$ — те траектории из Bkx{displaystyle B_{k}^{x}} $B_k^x$ , для которых x1=1{displaystyle x_{1}=1} $x_1=1$ . Bkx;x−1{displaystyle B_{k}^{x;x-1}} $B_k^{x;x-1}$ — те траектории из Bkx{displaystyle B_{k}^{x}} $B_k^x$ , для которых x1=−1{displaystyle x_{1}=-1} $x_{1}=-1$ . Заметим, что каждая траектория (x;x+1;x+1+x2;…;x+1+x2+…+xk){displaystyle (x;x+1;x+1+x_{2};ldots {};x+1+x_{2}+ldots +x_{k})} $(x;x+1;x+1+x_2;ldots{};x+1+x_2+ldots+x_k)$ из Bkx;x+1{displaystyle B_{k}^{x;x+1}} $B_k^{x;x+1}$ находится в однозначном соответствии с траекторией (x+1;x+1+x2;…;x+1+x2+…+xk){displaystyle (x+1;x+1+x_{2};ldots {};x+1+x_{2}+ldots +x_{k})} $(x+1;x+1+x_2;ldots{};x+1+x_2+ldots+x_k)$ из Bk−1x+1{displaystyle B_{k-1}^{x+1}} $B_{k-1}^{x+1}$ . Взаимно-однозначное соответствие доказывается от противного. Предположим, что x1=−1{displaystyle x_{1}=-1} $x_1 = -1$ (неоднозначное соответствие); тогда данная траектория (x;x−1;x−1+x2;…;x−1+x2+…+xk){displaystyle (x;x-1;x-1+x_{2};ldots ;x-1+x_{2}+ldots +x_{k})} $(x;x-1;x-1+x_2;ldots;x-1+x_2+ldots+x_k)$ не сможет вывести частицу из коридора за k{displaystyle k} $k$ шагов (а только лишь за k+2{displaystyle k+2} $k+2$ из-за изначального отдаления от верхней стенки коридора). В обратную сторону соответствие является также однозначным из определения: Sk+1=Sk+ξk+1{displaystyle S_{k+1}=S_{k}+xi _{k+1}} $S_{k+1} = S_k + xi_{k+1}$ . Из этого следует, что P({(x+1;x+1+x2;…;x+1+x2+…+xk)∈Bk−1x+1})=P(bigl{(x+1;x+1+x1;…;x+1+x1+…+xk−1)∈Bk−1x+1})=defP(Bk−1x+1){displaystyle mathbb {P} {Bigl (}{big {}(x+1;x+1+x_{2};ldots ;x+1+x_{2}+ldots +x_{k})in B_{k-1}^{x+1}{bigr }}{Bigr )}=mathbb {P} {Bigl (}bigl{(x+1;x+1+x_{1};ldots ;x+1+x_{1}+ldots +x_{k-1})in B_{k-1}^{x+1}{bigr }}{Bigr )}{mathrel {stackrel {rm {def}}{=}}}mathbb {P} ({mathcal {B}}_{k-1}^{x+1})} ${displaystyle mathbb {P} {Bigl (}{big {}(x+1;x+1+x_{2};ldots ;x+1+x_{2}+ldots +x_{k})in B_{k-1}^{x+1}{bigr }}{Bigr )}=mathbb {P} {Bigl (}bigl{(x+1;x+1+x_{1};ldots ;x+1+x_{1}+ldots +x_{k-1})in B_{k-1}^{x+1}{bigr }}{Bigr )}{mathrel {stackrel {rm {def}}{=}}}mathbb {P} ({mathcal {B}}_{k-1}^{x+1})}$ (так как ξi{displaystyle xi _{i}} $xi _{i}$ суть независимые одинаково распределённые случайные величины).

Существует и другой способ доказательства:

P(Bkx∣S1x=x+1)=P(Bkx∣ξ1=1)=P((x;x+ξ1;…;x+ξ1+…+ξk)∈Bkx∣ξ1=1)={displaystyle mathbb {P} ({mathcal {B}}_{k}^{x}mid S_{1}^{x}=x+1)=mathbb {P} ({mathcal {B}}_{k}^{x}mid xi _{1}=1)=mathbb {P} {bigl (}(x;x+xi _{1};ldots {};x+xi _{1}+ldots {}+xi _{k})
in B_{k}^{x}mid xi _{1}=1{bigr )}=}

mathbb{P} ( mathcal{B}^x_k mid S_1^x = x+1 ) = mathbb{P} ( mathcal{B}^x_k mid xi_1 = 1 ) = mathbb{P} bigl( (x;x+xi_1;ldots{};x+xi_1+ldots{}+xi_k)in B^x_k mid xi_1 = 1 bigr) =

=P((x;x+ξ1;…;x+ξ1+…+ξk)∈Bkx∩ξ1=1)P({ξ1=1})=P((x;x+1;…;x+1+…+ξk)∈Bkx∩ξ1=1)P({ξ1=1})={displaystyle ={frac {mathbb {P} {bigl (}(x;x+xi _{1};ldots {};x+xi _{1}+ldots {}+xi _{k})in B_{k}^{x}cap xi _{1}=1{bigr )}}{mathbb {P} ({xi _{1}=1})}}={frac {mathbb {P} {bigl (}(x;x+1;ldots {};x+1+ldots {}+xi _{k})in B_{k}^{x}cap xi _{1}=1{bigr )}}{mathbb {P} ({xi _{1}=1})}}=}

=frac{mathbb{P} bigl( (x;x+xi_1;ldots{};x+xi_1+ldots{}+xi_k)in B^x_k cap xi_1 = 1 bigr)}{mathbb{P}({ xi_1 = 1 })} = frac{mathbb{P} bigl( (x;x+1;ldots{};x+1+ldots{}+xi_k)in B^x_k cap xi_1 = 1 bigr)}{mathbb{P}({ xi_1 = 1 })} =

=P({(x;x+1;x+1+ξ2;…;x+1+ξ2+…+ξk)∈Bkx})=P({(x;x+1;x+1+ξ1;…;x+1+ξ1+…+ξk−1)∈Bkx})={displaystyle =mathbb {P} {bigl (}{(x;x+1;x+1+xi _{2};ldots {};x+1+xi _{2}+ldots {}+xi _{k})in B_{k}^{x}}{bigr )}=mathbb {P} {bigl (}{(x;x+1;x+1+xi _{1};ldots {};x+1+xi _{1}+ldots {}+xi _{k-1})in B_{k}^{x}}{bigr )}=}

=mathbb{P}bigl( { (x;x+1;x+1+xi_2;ldots{};x+1+xi_2+ldots{}+xi_k)in B_k^x } bigr) = mathbb{P}bigl( { (x;x+1;x+1+xi_1;ldots{};x+1+xi_1+ldots{}+xi_{k-1})in B_k^x } bigr) =

=P({(x;x+1;x+1+ξ1;…;x+1+ξ1+…+ξk−1)∈Bk−1x+1})=P(Bk−1x+1)=βk−1(x+1){displaystyle =mathbb {P} {bigl (}{(x;x+1;x+1+xi _{1};ldots {};x+1+xi _{1}+ldots {}+xi _{k-1})in B_{k-1}^{x+1}}{bigr )}=mathbb {P} ({mathcal {B}}_{k-1}^{x+1})=beta _{k-1}(x+1)}

=mathbb{P}bigl( { (x;x+1;x+1+xi_1;ldots{};x+1+xi_1+ldots{}+xi_{k-1})in B_{k-1}^{x+1} } bigr) = mathbb{P} (mathcal{B}_{k-1}^{x+1}) = beta_{k-1}(x+1)

Это справедливо потому, что вероятности независимы (это было доказано ранее).

(2) Аналогично докажем, что P(Bkx∣S1x=x−1)=P(Bk−1x+1){displaystyle mathbb {P} ({mathcal {B}}_{k}^{x}mid S_{1}^{x}=x-1)=mathbb {P} ({mathcal {B}}_{k-1}^{x+1})} $mathbb{P} ( mathcal{B}^x_k mid S_1^x = x-1 ) = mathbb{P} ( mathcal{B}^{x+1}_{k-1} )$ . Каждая траектория (x;x−1;x−1+x2;…;x−1+x2+…+xk){displaystyle (x;x-1;x-1+x_{2};ldots {};x-1+x_{2}+ldots +x_{k})} $(x;x-1;x-1+x_2;ldots{};x-1+x_2+ldots+x_k)$ из Bkx;x+1{displaystyle B_{k}^{x;x+1}} $B_k^{x;x+1}$ находится в однозначном соответствии с траекторией (x−1;x−1+x2;…;x−1+x2+…+xk){displaystyle (x-1;x-1+x_{2};ldots {};x-1+x_{2}+ldots +x_{k})} $(x-1;x-1+x_2;ldots{};x-1+x_2+ldots+x_k)$ из Bk−1x−1{displaystyle B_{k-1}^{x-1}} $B_{k-1}^{x-1}$ . Отсюда P({(x−1;x−1+x2;…;x−1+x2+…+xk)∈Bk−1x−1})=P({(x−1;x−1+x1;…;x−1+x1+…+xk−1)∈Bk−1x−1})=defP(Bk−1x−1).{displaystyle mathbb {P} {Bigl (}{bigl {}(x-1;x-1+x_{2};ldots ;x-1+x_{2}+ldots +x_{k})in B_{k-1}^{x-1}{bigr }}{Bigr )}=mathbb {P} {Bigl (}{bigl {}(x-1;x-1+x_{1};ldots ;x-1+x_{1}+ldots +x_{k-1})in B_{k-1}^{x-1}{bigr }}{Bigr )}{mathrel {stackrel {rm {def}}{=}}}mathbb {P} ({mathcal {B}}_{k-1}^{x-1}).} $mathbb{P} Bigl( bigl{ (x-1;x-1+x_2;ldots; x-1+x_2+ldots+x_k) in B_{k-1}^{x-1} bigr} Bigr) = mathbb{P} Bigl( bigl{ (x-1;x-1+x_1;ldots; x-1+x_1+ldots+x_{k-1}) in B_{k-1}^{x-1} bigr} Bigr) mathrel{stackrel{rm def}=} mathbb{P}(mathcal{B}_{k-1}^{x-1}).$ ◼{displaystyle blacksquare } $blacksquare$

Вывод рекуррентного соотношения

Из уравнения для βk(x){displaystyle beta _{k}(x)} $beta_k(x)$ следует, что для x∈(A;B){displaystyle xin (A;B)} $xin (A;B)$ и k⩽n{displaystyle kleqslant n} $kleqslant n$ верно:P(Bkx)=P(Bkx∣S1x=x+1)⋅p+P(Bkx∣S1x=x−1)⋅q=P(Bk−1x+1)⋅p+P(Bk−1x−1)⋅q=pβk−1(x+1)+qβk−1(x−1).{displaystyle mathbb {P} ({mathcal {B}}_{k}^{x})=mathbb {P} ({mathcal {B}}_{k}^{x}mid S_{1}^{x}=x+1)cdot p+mathbb {P} ({mathcal {B}}_{k}^{x}mid S_{1}^{x}=x-1)cdot q=mathbb {P} ({mathcal {B}}_{k-1}^{x+1})cdot p+mathbb {P} ({mathcal {B}}_{k-1}^{x-1})cdot q=pbeta _{k-1}(x+1)+qbeta _{k-1}(x-1).} $mathbb{P}(mathcal{B}_k^x) = mathbb{P} ( mathcal{B}^x_k mid S_1^x = x+1 )cdot p + mathbb{P} ( mathcal{B}^x_k mid S_1^x = x-1 )cdot q = mathbb{P} ( mathcal{B}^{x+1}_{k-1}) cdot p + mathbb{P} ( mathcal{B}^{x-1}_{k-1})cdot q = pbeta_{k-1}(x+1) + qbeta_{k-1}(x-1).$

βl(B)=1{displaystyle beta _{l}(B)=1} $beta_l(B)= 1$ , βl(A)=0{displaystyle beta _{l}(A)=0} $beta_l(A)=0$ для l∈[0;n]{displaystyle lin [0;n]} $lin[0;n]$ . Формула полной вероятности также даёт нам следующий результат: αk(x)=pαk−1(x+1)+qαk−1(x−1){displaystyle alpha _{k}(x)=palpha _{k-1}(x+1)+qalpha _{k-1}(x-1)} $alpha_k(x) = palpha_{k-1}(x+1) + qalpha_{k-1}(x-1)$ . Также отметим, что Bk−1⊂Bk{displaystyle {mathcal {B}}_{k-1}subset {mathcal {B}}_{k}} $mathcal{B}_{k-1} subset mathcal{B}_{k}$ , и поэтому βk−1(x)⩽βk(x)⩽1{displaystyle beta _{k-1}(x)leqslant beta _{k}(x)leqslant 1} $beta_{k-1}(x)leqslant beta_k(x)leqslant 1$ для k⩽n{displaystyle kleqslant n} $k leqslant n$ . Это утверждение верно, так как к любой траектории, выводящей частицу за меньшее количество шагов, можно прибавить в начало один шаг (xj−1=±1{displaystyle x_{j-1}=pm 1} $x_{j-1}=pm 1$ ), на котором частица может прийти в точку (j;Sjx){displaystyle (j;S_{j}^{x})} $(j;S^x_{j})$ как из (j−1;Sjx−1){displaystyle (j-1;S_{j}^{x}-1)} $(j-1;S^x_{j}-1)$ (для ξj=1{displaystyle xi _{j}=1} $xi_j=1$ ), так и из (j−1;Sjx+1){displaystyle (j-1;S_{j}^{x}+1)} $(j-1;S^x_{j}+1)$ (j⩽k{displaystyle jleqslant k} $jleqslant k$ ).

Нахождение вероятностей

При достаточно больших n{displaystyle n} $n$ вероятность βn(x){displaystyle beta _{n}(x)} $beta_n (x)$ близка к β(x){displaystyle beta (x)} $beta(x)$ — решению уравнения β(x)=pβ(x+1)+qβ(x−1){displaystyle beta (x)=pbeta (x+1)+qbeta (x-1)} $beta(x) = pbeta(x+1) + qbeta(x-1)$ при тех условиях, что β(B)=1{displaystyle beta (B)=1} $beta(B)=1$ (выход произошёл сразу же из точки B{displaystyle B} $B$ — конец игры, выиграл первый игрок), β(A)=0{displaystyle beta (A)=0} $beta(A)=0$ (первый игрок никогда не выиграет, если выход произойдёт мгновенно в точке A{displaystyle A} $A$ ). Эти условия следуют из того, что liml→∞βl(B)=β(B){displaystyle lim limits _{lrightarrow infty }beta _{l}(B)=beta (B)} $limlimits_{lrightarrowinfty} beta_l(B) = beta(B)$ . Это также будет доказано в этом разделе.

Сначала получим решение уравнения β(x)=pβ(x+1)+qβ(x−1){displaystyle beta (x)=pbeta (x+1)+qbeta (x-1)} $beta(x) = pbeta(x+1) + qbeta(x-1)$ . Пусть игра несправедливая (p≠q{displaystyle pneq q} $pne q$ ). В таком случае найдём корни уравнения, то есть β(x){displaystyle beta (x)} $beta(x)$ . Одно частное решение видно сразу: β(x)=const=a{displaystyle beta (x)=mathrm {const} =a} $beta(x) = mathrm{const} = a$ . Другое решение найдём, воспользовавшись тем, что β(x){displaystyle beta (x)} $beta(x)$ — функция. Целесообразно употребить выражение с отношением qp{displaystyle {frac {q}{p}}} $frac{q}{p}$ , учитывая, что p+q=1{displaystyle p+q=1} $p+q=1$ : (qp)x=qx(p+q)px=qxpx−1+qx+1px=pqx+1px+1+qqx−1px−1=p(qp)x+1+q(qp)x−1{displaystyle left({frac {q}{p}}right)^{x}={frac {q^{x}(p+q)}{p^{x}}}={frac {q^{x}}{p^{x-1}}}+{frac {q^{x+1}}{p^{x}}}=p{frac {q^{x+1}}{p^{x+1}}}+q{frac {q^{x-1}}{p^{x-1}}}=pleft({frac {q}{p}}right)^{x+1}+qleft({frac {q}{p}}right)^{x-1}} $left( frac{q}{p} right)^x = frac{q^x(p+q)}{p^x} = frac{q^x}{p^{x-1}} + frac{q^{x+1}}{p^x} = pfrac{q^{x+1}}{p^{x+1}} + qfrac{q^{x-1}}{p^{x-1}} = pleft(frac{q}{p}right)^{x+1} + qleft(frac{q}{p}right)^{x-1}$ . Отсюда правомерно предположить, что β(x)=b⋅(qp)x{displaystyle beta (x)=bcdot left({frac {q}{p}}right)^{x}} $beta(x) = bcdot left(frac{q}{p}right)^x$ . Добавление константы ничего не изменит благодаря тому, что p+q=1{displaystyle p+q=1} $p+q=1$ .

Теперь рассмотрим общее решение: β(x)=a+b(qp)x{displaystyle beta (x)=a+bleft({frac {q}{p}}right)^{x}} $beta(x) = a + bleft(frac{q}{p}right)^x$ . Воспользуемся теми условиями, что β(A)=a+b(qp)A=0{displaystyle beta (A)=a+bleft({frac {q}{p}}right)^{A}=0} $beta(A) = a+bleft(frac{q}{p}right)^A=0$ и β(B)=a+b(qp)B=1{displaystyle beta (B)=a+bleft({frac {q}{p}}right)^{B}=1} $beta(B) = a+bleft(frac{q}{p}right)^B=1$ , и получим, что β(x)=β(x)−01−0=β(x)−β(A)β(B)−β(A)=a+b(qp)x−(a+b(qp)A)a+b(qp)B−(a+b(qp)A)=(qp)x−(qp)B(qp)x−(qp)A.{displaystyle beta (x)={frac {beta (x)-0}{1-0}}={frac {beta (x)-beta (A)}{beta (B)-beta (A)}}={frac {a+bleft({frac {q}{p}}right)^{x}-left(a+bleft({frac {q}{p}}right)^{A}right)}{a+bleft({frac {q}{p}}right)^{B}-left(a+bleft({frac {q}{p}}right)^{A}right)}}={frac {left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{B}}{left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{A}}}.} ${displaystyle beta (x)={frac {beta (x)-0}{1-0}}={frac {beta (x)-beta (A)}{beta (B)-beta (A)}}={frac {a+bleft({frac {q}{p}}right)^{x}-left(a+bleft({frac {q}{p}}right)^{A}right)}{a+bleft({frac {q}{p}}right)^{B}-left(a+bleft({frac {q}{p}}right)^{A}right)}}={frac {left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{B}}{left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{A}}}.}$

Подзадача о единственности решения

Докажем единственность решения данной задачи. Для этого покажем, что любое решение задачи β(x)=pβ(x+1)+qβ(x−1){displaystyle beta (x)=pbeta (x+1)+qbeta (x-1)} $beta(x) = pbeta(x+1) + qbeta(x-1)$ с граничными условиями может быть представлено в виде (qp)x−(qp)B(qp)x−(qp)A{displaystyle {frac {left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{B}}{left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{A}}}} ${displaystyle {frac {left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{B}}{left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{A}}}}$ .

Решение. Рассмотрим некоторое решение βˇ(x){displaystyle {check {beta }}(x)} $check beta(x)$ при условиях βˇ(A)=0{displaystyle {check {beta }}(A)=0} $checkbeta (A)=0$ , βˇ(B)=1{displaystyle {check {beta }}(B)=1} $checkbeta(B)=1$ . Тогда всегда можно подобрать такие константы aˇ{displaystyle {check {a}}} $check a$ и bˇ{displaystyle {check {b}}} $check b$ , что aˇ+bˇ(qp)A=βˇ(A){displaystyle {check {a}}+{check {b}}left({frac {q}{p}}right)^{A}={check {beta }}(A)} $check a + check b left( frac{q}{p}right)^{A} = checkbeta(A)$ , aˇ+bˇ(qp)A+1=βˇ(A+1){displaystyle {check {a}}+{check {b}}left({frac {q}{p}}right)^{A+1}={check {beta }}(A+1)} $check a + check bleft( frac{q}{p}right)^{A+1} = check beta(A+1)$ . Тогда из уравнения поставленной задачи следует, что βˇ(A+2)=aˇ+bˇ(qp)A+2{displaystyle {check {beta }}(A+2)={check {a}}+{check {b}}left({frac {q}{p}}right)^{A+2}} $checkbeta(A+2) = check a + check b left( frac{q}{p}right)^{A+2}$ . Тогда в общем случае βˇ(x)=aˇ+bˇ(qp)x{displaystyle {check {beta }}(x)={check {a}}+{check {b}}left({frac {q}{p}}right)^{x}} $check beta(x) = check a + check bleft( frac{q}{p}right)^{x}$ . Следовательно, решение (qp)x−(qp)B(qp)x−(qp)A{displaystyle {frac {left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{B}}{left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{A}}}} ${displaystyle {frac {left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{B}}{left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{A}}}}$ является единственным. Точно такой же ход рассуждений может быть применён и к α(x){displaystyle alpha (x)} $alpha(x)$ . ◼{displaystyle blacksquare } $blacksquare$

Предельная сходимость

Рассмотрим вопрос о быстроте предельной сходимости αn(x){displaystyle alpha _{n}(x)} $alpha_n(x)$ и βn(x){displaystyle beta _{n}(x)} $beta_n(x)$ к α(x){displaystyle alpha (x)} $alpha(x)$ и β(x){displaystyle beta (x)} $beta(x)$ . Пусть блуждание начинается из начала координат (x=0{displaystyle x=0} $x=0$ ). Для простоты обозначим αn(0)=αn{displaystyle alpha _{n}(0)=alpha _{n}} $alpha_n(0)=alpha_n$ , βn(0)=βn{displaystyle beta _{n}(0)=beta _{n}} $beta_n(0)=beta_n$ , γn=1−αn−βn{displaystyle gamma _{n}=1-alpha _{n}-beta _{n}} $gamma_n = 1-alpha_n-beta_n$ . Иными словами, γn{displaystyle gamma _{n}} $gamma_n$ — это единица минус сумма вероятностей выхода частицы из коридора — вероятность того, что она останется блуждать в коридоре: γn=P{ω:A<Sk<B;0⩽k⩽n}{displaystyle gamma _{n}=mathbb {P} {omega colon A<S_{k}<B;0leqslant kleqslant n}} $gamma_n = mathbb{P} { omegacolon A<S_k<B; 0leqslant k leqslant n }$ . ω{displaystyle omega } $omega$ представляет собой событие ⋂0⩽k⩽n{A<Sk<B}{displaystyle bigcap limits _{0leqslant kleqslant n}{A<S_{k}<B}} $bigcaplimits_{0leqslant k leqslant n} { A<S_k<B }$ . Рассмотрим число n=rm{displaystyle n=rm} $n=rm$ , где r,m∈Z{displaystyle r,min mathbb {Z} } $r,min mathbb{Z}$ , и цепочку случайных величин ζn:ζ1=∑i=1mξi, ζ2=∑i=m+12mξi, …, ζr=∑i=m(r−1)rmξi{displaystyle zeta _{n}colon zeta _{1}=sum limits _{i=1}^{m}xi _{i},~zeta _{2}=sum limits _{i=m+1}^{2m}xi _{i},~ldots {},~zeta _{r}=sum limits _{i=m(r-1)}^{rm}xi _{i}} $zeta_ncolon zeta_1 = sumlimits_{i=1}^m xi_i,~zeta_2 = sumlimits_{i=m+1}^{2m} xi_i,~ldots{},~zeta_r = sumlimits_{i=m(r-1)}^{rm} xi_i$ . Если обозначить совокупное богатство за C=|A|+B{displaystyle C=|A|+B} $C = |A| +B$ , то тогда {A<Sk<B;1⩽k⩽rm}⊆{|ζ1|<C;…;|ζr|<C}{displaystyle {A<S_{k}<B;1leqslant kleqslant rm}subseteq {bigl {}|zeta _{1}|<C;ldots {};|zeta _{r}|<C{bigr }}} ${A<S_k<B;1leqslant k leqslant rm } subseteq bigl{|zeta_1|<C;ldots{};|zeta_r|<Cbigr}$ . Этому есть разумное объяснение: если частица выходит из нуля и не пересекает границ, то тогда совершенно определённо сумма m{displaystyle m} $m$ штук xi{displaystyle x_{i}} $x_{i}$ меньше, чем совокупный запас.

Подзадача о независимости случайных величин ζi{displaystyle zeta _{i}} $zeta_i$

Докажем, что ζj{displaystyle zeta _{j}} $zeta_j$ независимы и одинаково распределённые. Достаточно доказать, что они независимы, так как все они имеют биномиальное распределение.

Решение. Докажем, что P({ζ1=m}∩{ζ2=m})=P({ζ1=m})⋅P({ζ2=m}).{displaystyle mathbb {P} {bigl (}{zeta _{1}=m}cap {zeta _{2}=m}{bigr )}=mathbb {P} {bigl (}{zeta _{1}=m}{bigr )}cdot mathbb {P} {bigl (}{zeta _{2}=m}{bigr )}.} $mathbb{P}bigl({ zeta_1=m } cap { zeta_2=m } bigr) = mathbb{P} bigl( {zeta_1=m}bigr) cdot mathbb{P}bigl( {zeta_2=m}bigr).$

P({ζ1=m}∩{ζ2=m})=P({∑i=1mξi=m}∩{∑i=m+12mξi=m})={displaystyle mathbb {P} {bigl (}{zeta _{1}=m}cap {zeta _{2}=m}{bigr )}=mathbb {P} left(left{sum limits _{i=1}^{m}xi _{i}=mright}cap left{sum limits _{i=m+1}^{2m}xi _{i}=mright}right)=}

mathbb{P}bigl({ zeta_1=m } cap { zeta_2=m } bigr) = mathbb{P} left( left{ sumlimits_{i=1}^{m} xi_i = m right} cap left{ sumlimits_{i=m+1}^{2m} xi_i = m right} right) =

=P({ξ1;…;m=1}∩{ξm+1;…;2m=1})=P2m({ξi=1})=P({ζ1=m})⋅P({ζ2=m}){displaystyle =mathbb {P} {bigl (}{xi _{1;ldots ;m}=1}cap {xi _{m+1;ldots ;2m}=1}{bigr )}=mathbb {P} ^{2m}{bigl (}{xi _{i}=1}{bigr )}=mathbb {P} {bigl (}{zeta _{1}=m}{bigr )}cdot mathbb {P} {bigl (}{zeta _{2}=m}{bigr )}}

=mathbb{P}bigl( { xi_{1;ldots;m} = 1 } cap { xi_{m+1;ldots;2m} = 1} bigr) = mathbb{P}^{2m}bigl( {xi_i=1}bigr) = mathbb{P} bigl({zeta_1=m}bigr) cdot mathbb{P} bigl({zeta_2=m}bigr)

. ◼{displaystyle blacksquare }

blacksquare

Вернёмся к рассмотрению сходимости. γn⩽P({|ζ1|;…;|ζr|<C})=∏i=1rP({|ζi|<C})=(P({|ζ1|<C}))r{displaystyle gamma _{n}leqslant mathbb {P} {Bigl (}{bigl {}|zeta _{1}|;ldots ;|zeta _{r}|<C{bigr }}{Bigr )}=prod limits _{i=1}^{r}mathbb {P} {Bigl (}{bigl {}|zeta _{i}|<C{bigr }}{Bigr )}={biggl (}mathbb {P} {Bigl (}{bigl {}|zeta _{1}|<C{bigr }}{Bigr )}{biggr )}^{r}} $gamma_n leqslant mathbb{P} Bigl( bigl{ |zeta_1|;ldots;|zeta_r|<Cbigr} Bigr) = prodlimits_{i=1}^r mathbb{P} Bigl( bigl{ |zeta_i|<C bigr} Bigr) = biggl( mathbb{P} Bigl( bigl{ |zeta_1|<C bigr} Bigr) biggr)^r$ , что следует из только что доказанного. Рассмотрим дисперсию: D(ζ1)=m(1−(p−q)2){di
splaystyle D(zeta _{1})=m{bigl (}1-(p-q)^{2}{bigr )}} ${displaystyle D(zeta _{1})=m{bigl (}1-(p-q)^{2}{bigr )}}$ (что вполне правомерно, так как 1−(p−q)2=1−((p+q)2−4pq){displaystyle 1-(p-q)^{2}=1-{bigl (}(p+q)^{2}-4pq{bigr )}} $1-(p-q)^2 =1-bigl((p+q)^2-4pqbigr)$ , а ξ{displaystyle xi } $xi$ — модифицированная бернуллиевская случайная величина), поэтому для достаточно больших m{displaystyle m} $m$ и 0<p<1{displaystyle 0<p<1} $0<p<1$ верно: P({|ζ1|<C})⩽ε1{displaystyle mathbb {P} {Bigl (}{bigl {}|zeta _{1}|<C{bigr }}{Bigr )}leqslant varepsilon _{1}} $mathbb{P}Bigl( bigl{ |zeta_1|<Cbigr} Bigr) leqslant varepsilon_1$ , где ε1<1{displaystyle varepsilon _{1}<1} $varepsilon_1<1$ , так как если P({|ζ1|⩽C})=1{displaystyle mathbb {P} {Bigl (}{bigl {}|zeta _{1}|leqslant C{bigr }}{Bigr )}=1} $mathbb{P}Bigl( bigl{ |zeta_1|leqslant C bigr} Bigr)=1$ , то D(ζ1)⩽C2{displaystyle D(zeta _{1})leqslant C^{2}} ${displaystyle D(zeta _{1})leqslant C^{2}}$ . Если p=0{displaystyle p=0} $p=0$ или p=1{displaystyle p=1} $p=1$ , то для довольно больших m{displaystyle m} $m$ верно, что P({|ζ1|<C})=0{displaystyle mathbb {P} {Bigl (}{bigl {}|zeta _{1}|<C{bigr }}{bigr )}=0} ${displaystyle mathbb {P} {Bigl (}{bigl {}|zeta _{1}|<C{bigr }}{bigr )}=0}$ , поэтому неравенство P({|ζ1|<C})⩽ε1{displaystyle mathbb {P} {Bigl (}{bigl {}|zeta _{1}|<C{bigr }}{Bigr )}leqslant varepsilon _{1}} $mathbb{P}Bigl( bigl{ |zeta_1|<C bigr} Bigr) leqslant varepsilon_1$ верно ∀p∈[0;1]{displaystyle forall pin [0;1]} $forall pin[0;1]$ . Из вышесказанного следует, что γn⩽εn{displaystyle gamma _{n}leqslant varepsilon ^{n}} $gamma_n leqslant varepsilon^n$ , где ε=ε11m<1{displaystyle varepsilon =varepsilon _{1}^{frac {1}{m}}<1} $varepsilon = varepsilon_1^{frac{1}{m}}<1$ . Так как α+β=1{displaystyle alpha +beta =1} $alpha+beta = 1$ , то (α−αn)−(β−βn)=γn{displaystyle (alpha -alpha _{n})-(beta -beta _{n})=gamma _{n}} $(alpha-alpha_n)-(beta-beta_n)=gamma_n$ ; так как α⩾αn{displaystyle alpha geqslant alpha _{n}} $alphageqslant alpha_n$ и β⩾βn{displaystyle beta geqslant beta _{n}} $betageqslant beta_n$ , то 0⩽α−αn⩽γn⩽εn{displaystyle 0leqslant alpha -alpha _{n}leqslant gamma _{n}leqslant varepsilon ^{n}} $0leqslant alpha-alpha_n leqslant gamma_n leqslant varepsilon^n$ ; 0⩽β−βn⩽γn⩽εn{displaystyle 0leqslant beta -beta _{n}leqslant gamma _{n
}leqslant varepsilon ^{n}} $0leqslant beta-beta_n leqslant gamma_n leqslant varepsilon^n$ при ε<1{displaystyle varepsilon <1} $varepsilon<1$ . Аналогичные оценки справедливы и для разностей α(x)−αn(x){displaystyle alpha (x)-alpha _{n}(x)} $alpha(x)-alpha_n(x)$ и β(x)−βn(x){displaystyle beta (x)-beta _{n}(x)} $beta(x)-beta_n(x)$ , так как можно свести эти разности к разностям α−αn{displaystyle alpha -alpha _{n}} $alpha-alpha_n$ и β−βn{displaystyle beta -beta _{n}} $beta-beta_n$ при A1=A−x{displaystyle A_{1}=A-x} $A_1 = A-x$ , B1−B−x{displaystyle B_{1}-B-x} ${displaystyle B_{1}-B-x}$ .

Вернёмся к рассмотрению α(x){displaystyle alpha (x)} $alpha(x)$ . По аналогии с решением (qp)x−(qp)B(qp)x−(qp)A{displaystyle {frac {left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{B}}{left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{A}}}} ${displaystyle {frac {left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{B}}{left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{A}}}}$ уравнения β(x)=pβ(x+1)+qβ(x−1){displaystyle beta (x)=pbeta (x+1)+qbeta (x-1)} $beta(x) = pbeta(x+1) + qbeta(x-1)$ , можно сказать, что у уравнения α(x)=pα(x+1)+qα(x−1){displaystyle alpha (x)=palpha (x+1)+qalpha (x-1)} $alpha(x) = palpha(x+1) + qalpha(x-1)$ при граничных условиях α(A)=1{displaystyle alpha (A)=1} $alpha(A)=1$ , α(B)=0{displaystyle alpha (B)=0} $alpha(B)=0$ существует единственное решение α(x)=(qp)B−(qp)x(qp)B−(qp)A,A⩽x⩽B.{displaystyle alpha (x)={frac {left({frac {q}{p}}right)^{B}-left({frac {q}{p}}right)^{x}}{left({frac {q}{p}}right)^{B}-left({frac {q}{p}}right)^{A}}},qquad Aleqslant xleqslant B.} $alpha(x) = frac{left( frac{q}{p}right)^{B}-left( frac{q}{p}right)^{x}}{left( frac{q}{p}right)^{B}-left( frac{q}{p}right)^{A}},qquad Aleqslant x leqslant B.$

Нетрудно заметить, что α(x)+β(x)=(qp)B−(qp)x(qp)B−(qp)A+(qp)x−(qp)B(qp)x−(qp)A=(qp)B−(qp)A(qp)B−(qp)A=1{displaystyle alpha (x)+beta (x)={frac {left({frac {q}{p}}right)^{B}-left({frac {q}{p}}right)^{x}}{left({frac {q}{p}}right)^{B}-left({frac {q}{p}}right)^{A}}}+{frac {left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{B}}{left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{A}}}={frac {left({frac {q}{p}}right)^{B}-left({frac {q}{p}}right)^{A}}{left({frac {q}{p}}right)^{B}-left({frac {q}{p}}right)^{A}}}=1} ${displaystyle alpha (x)+beta (x)={frac {left({frac {q}{p}}right)^{B}-left({frac {q}{p}}right)^{x}}{left({frac {q}{p}}right)^{B}-left({frac {q}{p}}right)^{A}}}+{frac {left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{B}}{left({frac {q}{p}}right)^{x}-left({frac {q}{p}}right)^{A}}}={frac {left({frac {q}{p}}right)^{B}-left({frac {q}{p}}right)^{A}}{left({frac {q}{p}}right)^{B}-left({frac {q}{p}}right)^{A}}}=1}$ при любых p∈[0;1]{displaystyle pin [0;1]} $pin [0;1]$ . Если же игра является справедливой (вероятность выпадения аверса равна вероятности выпадения реверса), то решения будут выглядеть следующим образом: β(x)=x−AB−A{displaystyle beta (x)={frac {x-A}{B-A}}} $beta(x) = frac{x-A}{B-A}$ , α(x)=B−xB−A{displaystyle alpha (x)={frac {B-x}{B-A}}} $alpha(x) = frac{B-x}{B-A}$ .

Ответ о вероятности разорения

Величины α(x){displaystyle alpha (x)} $alpha(x)$ и β(x){displaystyle beta (x)} $beta(x)$ было бы можно назвать вероятностями разорения первого и второго игрока при начальных капиталах x−A{displaystyle x-A} $x-A$ и x−B{displaystyle x-B} $x-B$ при стремлении количества ходов к бесконечности и характеризации случайной величина ξi=+1{displaystyle xi _{i}=+1} $xi_i=+1$ как выигрыша первого игрока, а ξi=−1{displaystyle xi _{i}=-1} $xi_i=-1$ — проигрыша первого игрока. В дальнейшем будет показано, почему такую последовательность действительно можно построить.

Если A=0{displaystyle A=0} $A=0$ , то интуитивный смысл функции β(x){displaystyle beta (x)} $beta(x)$ — это вероятность того, что частица, вышедшая из положения x{displaystyle x} $x$ , достигнет верхней стенки (B{displaystyle B} $B$ ) ранее, чем нуля. Из формул β(x){displaystyle beta (x)} $beta (x)$ видно, что β(x)={xB,p=q=0,5,(qp)x−1(qp)B−1,p≠q{displaystyle beta (x)={begin{cases}{frac {x}{B}},&p=q=0{,}5,\{frac {left({frac {q}{p}}right)^{x}-1}{left({frac {q}{p}}right)^{B}-1}},&pneq qend{cases}}} $beta(x) = begin{cases} frac{x}{B}, & p=q=0{,}5,\ frac{left( frac{q}{p}right)^{x}-1}{left( frac{q}{p}right)^{B}-1}, & pne q end{cases}$ .

Парадокс увеличения ставки при неблагоприятной игре

Что необходимо сделать первому игроку, если игра неблагоприятна для него?

Его вероятность проигрыша задана формулой limk→∞αk=α=(qp)B−1(qp)B−(qp)A{displaystyle lim limits _{krightarrow infty }alpha _{k}=alpha ={frac {left({frac {q}{p}}right)^{B}-1}{left({frac {q}{p}}right)^{B}-left({frac {q}{p}}right)^{A}}}} $limlimits_{krightarrowinfty} alpha_k = alpha = frac{left( frac{q}{p}right)^{B}-1}{left( frac{q}{p}right)^{B}-left( frac{q}{p}right)^{A}}$ . Теперь пусть первый игрок с капиталом (−A){displaystyle (-A)} $(-A)$ примет решение удвоить ставку и играть на два рубля. Теперь P({ξi=2})=p{displaystyle mathbb {P} {bigl (}{xi _{i}=2}{bigr )}=p} $mathbb{P}bigl( {xi_i=2}bigr)=p$ , P({ξi=−2})=q{displaystyle mathbb {P} {bigl (}{xi _{i}=-2}{bigr )}=q} $mathbb{P}bigl( {xi_i=-2}bigr)=q$ . Тогда обозначим предельную вероятность разорения первого игрока так: α2{displaystyle alpha _{2}} $alpha_2$ . Тогда α2=(qp)0,5B−1(qp)0,5B−(qp)0,5A{displaystyle alpha _{2}={frac {left({frac {q}{p}}right)^{0{,}5B}-1}{left({frac {q}{p}}right)^{0{,}5B}-left({frac {q}{p}}right)^{0{,}5A}}}} $alpha_2 = frac{left( frac{q}{p}right)^{0{,}5B}-1}{left( frac{q}{p}right)^{0{,}5B}-left( frac{q}{p}right)^{0{,}5A}}$ . Поэтомуα=(qp)0,5B⋅2−12(qp)0,5B⋅2−(qp)0,5A⋅2=((qp)0,5B−1)⋅((qp)0,5B+1)((qp)0,5B−(qp)0,5A)⋅((qp)0,5B+(qp)0,5A)=α2⋅((qp)0,5B+1)((qp)0,5B+(qp)0,5A)>α2{displaystyle alpha ={frac {left({frac {q}{p}}right)^{0{,}5Bcdot 2}-1^{2}}{left({frac {q}{p}}right)^{0{,}5Bcdot 2}-left({frac {q}{p}}right)^{0{,}5Acdot 2}}}={frac {left(left({frac {q}{p}}right)^{0{,}5B}-1right)cdot left(left({frac {q}{p}}right)^{0{,}5B}+1right)}{left(left({frac {q}{p}}right)^{0{,}5B}-left({frac {q}{p}}right)^{0{,}5A}right)cdot left(left({frac {q}{p}}right)^{0{,}5B}+left({frac {q}{p}}right)^{0{,}5A}right)}}=alpha _{2}cdot {frac {left(left({frac {q}{p}}right)^{0{,}5B}+1right)}{left(left({frac {q}{p}}right)^{0{,
}5B}+left({frac {q}{p}}right)^{0{,}5A}right)}}>alpha _{2}} $alpha = frac{left( frac{q}{p}right)^{0{,}5Bcdot2} - 1^2}{ left( frac{q}{p}right)^{0{,}5Bcdot2} - left( frac{q}{p}right)^{0{,}5Acdot2} } = frac{left( left( frac{q}{p}right)^{0{,}5B}-1right)cdot left( left( frac{q}{p}right)^{0{,}5B}+1right)}{left( left( frac{q}{p}right)^{0{,}5B}-left( frac{q}{p}right)^{0{,}5A}right) cdot left( left( frac{q}{p}right)^{0{,}5B}+left( frac{q}{p}right)^{0{,}5A}right)} = alpha_2 cdot frac{left( left( frac{q}{p}right)^{0{,}5B}+1right)}{left( left( frac{q}{p}right)^{0{,}5B}+left( frac{q}{p}right)^{0{,}5A}right)} > alpha_2$ , так как α2{displaystyle alpha _{2}} $alpha_2$ уможается на дробь, которая больше единицы при q>p{displaystyle q>p} $q>p$ .

Поэтому если вероятность выпадения столь желанного для первого игрока аверса меньше 0,5{displaystyle 0{,}5} $0{,}5$ , то ему выгодно увеличить ставку в r>1{displaystyle r>1} $r>1$ раз: это уменьшает вероятность его терминального разорения за счёт того, что вырастает вероятность выскочить из коридора в точке B{displaystyle B} $B$ . Это решение кажется парадоксальным, так как складывается впечатление, что при неблагоприятной ситуации надо снизить ставку и уменьшить проигрыш, но в действительности при бесконечном числе игр и низкой ставке проигрывающий игрок в конечном счёте обязательно проиграется в ноль, а игрок с высокой ставкой обладает большими шансами выпадения количества аверсов, достаточного для завершения игры в точке B{displaystyle B} $B$ .

Длительность случайного блуждания

Рассмотрим среднюю длительность блуждания нашей частицы. Введём математическое ожидание момента, когда игра прекращается: E(τkx)=mk(x{displaystyle mathbb {E} (tau _{k}^{x})=m_{k}(x} ${displaystyle mathbb {E} (tau _{k}^{x})=m_{k}(x}$ для k⩽n{displaystyle kleqslant n} $kleqslant n$ . Выведем рекуррентное соотношение для математического ожидания продолжительности игры:

mk(x)=E(τkx)=∑1⩽l⩽klP({τkx=l})=∑1⩽l⩽kl(pP({τkx=l}|{ξ1=1})+qP({τkx=l}|{ξ1=−1}))={displaystyle m_{k}(x)=mathbb {E} (tau _{k}^{x})=sum limits _{1leqslant lleqslant k}lmathbb {P} {bigl (}{tau _{k}^{x}=l}{bigr )}=sum limits _{1leqslant lleqslant k}l{Bigl (}pmathbb {P} {bigl (}{tau _{k}^{x}=l}{big |}{xi _{1}=1}{bigr )}+qmathbb {P} {bigl (}{tau _{k}^{x}=l}{big |}{xi _{1}=-1}{bigr )}{Bigr )}=}

m_k(x) = mathbb{E}(tau_k^x) = sumlimits_{1leqslant l leqslant k} lmathbb{P} bigl( {tau_k^x = l} bigr) = sumlimits_{1leqslant l leqslant k} l Bigl( pmathbb{P}bigl({ tau_k^x = l } big| { xi_1=1 }bigr) + qmathbb{P}bigl({ tau_k^x = l } big| { xi_1=-1 }bigr) Bigr) =

=∑1⩽l⩽kl(pP({τk−1x+1=l−1})+qP{τk−1x−1=l−1}))=∑0⩽l⩽k−1(l+1)(pP({τk−1x+1=l})+qP({τk−1x−1=l}))={displaystyle =sum limits _{1leqslant lleqslant k}l{Bigl (}pmathbb {P} {bigl (}{tau _{k-1}^{x+1}=l-1}{bigr )}+qmathbb {P} {bigl {}tau _{k-1}^{x-1}=l-1}{bigr )}{Bigr )}=sum limits _{0leqslant lleqslant k-1}(l+1){Bigl (}pmathbb {P} {bigl (}{tau _{k-1}^{x+1}=l}{bigr )}+qmathbb {P} {bigl (}{tau _{k-1}^{x-1}=l}{bigr )}{Bigr )}=}

= sumlimits_{1leqslant l leqslant k} l Bigl( pmathbb{P}bigl( { tau_{k-1}^{x+1} = l-1 }bigr) + qmathbb{P}bigl{ tau_{k-1}^{x-1} = l-1 }bigr) Bigr) = sumlimits_{0leqslant l leqslant k-1} (l+1) Bigl( pmathbb{P}bigl( { tau_{k-1}^{x+1} = l}bigr) + qmathbb{P}bigl({ tau_{k-1}^{x-1} = l }bigr) Bigr) =

=pmk−1(x+1)+qmk−1(x−1)+∑0⩽l⩽k−1(pP({τk−1x+1=l})+qP({τk−1x−1=l}))=pmk−1(x+1)+qmk−1(x−1)+1.{displaystyle =pm_{k-1}(x+1)+qm_{k-1}(x-1)+sum limits _{0leqslant lleqslant k-1}{Bigl (}pmathbb {P} {bigl (}{tau _{k-1}^{x+1}=l}{bigr )}+qmathbb {P} {bigl (}{tau _{k-1}^{x-1}=l}{bigr )}{Bigr )}=pm_{k-1}(x+1)+qm_{k-1}(x-1)+1.}

= pm_{k-1}(x+1) + qm_{k-1}(x-1) + sumlimits_{0leqslant l leqslant k-1} Bigl( pmathbb{P}bigl( { tau_{k-1}^{x+1} = l}bigr) + qmathbb{P}bigl({ tau_{k-1}^{x-1} = l }bigr) Bigr) = pm_{k-1}(x+1) + qm_{k-1}(x-1) + 1.

Для x∈(A;B){displaystyle xin (A;B)} $xin (A;B)$ и k∈[0;n]{displaystyle kin [0;n]} $kin[0;n]$ мы получили рекуррентное соотношение для функции mk(x){displaystyle m_{k}(x)} $m_k(x)$ : mk(x)=pmk−1(x+1)+qmk−1(x−1)+1{displaystyle m_{k}(x)=pm_{k-1}(x+1)+qm_{k-1}(x-1)+1} $m_k(x) = pm_{k-1}(x+1) + qm_{k-1}(x-1) + 1$ при m0(x)=0{displaystyle m_{0}(x)=0} $m_0(x)=0$ . Введём граничные условия: если игра начинается в точке A{displaystyle A} $A$ или B{displaystyle B} $B$ , то тогда она тут же и завершится — её длительность будет равна 0: mk(A)=mk(B)=0{displaystyle m_{k}(A)=m_{k}(B)=0} $m_k(A) = m_k(B)=0$ . Из рекуррентного соотношения и граничных условий можно один за другим вычислить mi(x){displaystyle m_{i}(x)} $m_i(x)$ . Так как mk+1(x)⩾mk(x){displaystyle m_{k+1}(x)geqslant m_{k}(x)} $m_{k+1}(x) geqslant m_k(x)$ , то существует предел m(x)=limn→∞mn(x){displaystyle m(x)=lim limits _{nrightarrow infty }m_{n}(x)} $m(x) = limlimits_{nrightarrowinfty} m_n(x)$ , который удовлетворяет соотношению mk(x)=pmk−1(x+1)+qmk−1(x−1)+1{displaystyle m_{k}(x)=pm_{k-1}(x+1)+qm_{k-1}(x-1)+1} $m_k(x) = pm_{k-1}(x+1) + qm_{k-1}(x-1) + 1$ : m(x)=1+pm(x+1)+qm(x−1){displaystyle m(x)=1+pm(x+1)+qm(x-1)} $m(x) = 1+pm(x+1) + qm(x-1)$ при выполнении m(A)=m(B)=0{displaystyle m(A)=m(B)=0} $m(A)=m(B)=0$ . Данные переходы аналогичны тем, что мы рассмотрели при переходе к n→∞{displaystyle nrightarrow infty } $nrightarrowinfty$ в уравнении вероятности проигрыша. Для того чтобы решить данное уравнение, надо ввести ещё одно условие: матожидание количества ходов должно быть конечным, т. е. m(x)<∞{displaystyle m(x)<infty } $m(x)<infty$ , x∈(A;B){displaystyle xin (A;B)} $xin(A;B)$ .

Решим данное уравнение. В уравнении вероятности проигрыше (p≠q{displaystyle pneq q} $pne q$ ) уже были получены частные решения a{displaystyle a} $a$ и b(qp)x{displaystyle bleft({frac {q}{p}}right)^{x}} $bleft( frac{q}{p}right)^{x}$ . Здесь же появляется ещё один претендент на роль частного решения: xq−p=q−p+(p+q)x+p−qq−p=q−pq−p+p(x+1)q−p+q(x−1)q−p=1+px+1q−p+qx−1q−p{displaystyle {frac {x}{q-p}}={frac {q-p+(p+q)x+p-q}{q-p}}={frac {q-p}{q-p}}+{frac {p(x+1)}{q-p}}+{frac {q(x-1)}{q-p}}=1+p{frac {x+1}{q-p}}+q{frac {x-1}{q-p}}} $frac{x}{q-p} =frac{q-p+(p+q)x + p-q}{q-p} = frac{q-p}{q-p} + frac{p(x+1)}{q-p} + frac{q(x-1)}{q-p} = 1 + pfrac{x+1}{q-p} + qfrac{x-1}{q-p}$ , поэтому m(x)=xq−p+a+b(qp)x{displaystyle m(x)={frac {x}{q-p}}+a+bleft({frac {q}{p}}right)^{x}} $m(x) = frac{x}{q-p} + a + bleft( frac{q}{p}right)^{x}$ . С учётом граничного условия m(A)=m(B)=0{displaystyle m(A)=m(B)=0} $m(A)=m(B)=0$ находим при помощи ранее полученных соотношений m(x){displaystyle m(x)} $m(x)$ : m(x)=1p−q(Bβ(x)+Aα(x)−x){displaystyle m(x)={frac {1}{p-q}}{bigl (}Bbeta (x)+Aalpha (x)-x{bigr )}} $m(x) = frac{1}{p-q}bigl( Bbeta(x) + Aalpha(x) - xbigr)$ . В случае идеальной монетки получаем следующее выражение: m(x)=a+bx−x2{displaystyle m(x)=a+bx-x^{2}} $m(x) = a+bx-x^2$ . Применение граничного условия даёт: m(x)=(B−x)(x−A){displaystyle m(x)=(B-x)(x-A)} $m(x)= (B-x)(x-A)$ . Из этого следует, что в случае равных стартовых капиталов m(0)=B2{displaystyle m(0)=B^{2}} $m(0)=B^2$ . Например, если у каждого игрока есть по 5 рублей, а ставка — 1 рубль, то в среднем разоряться игроки будут через 25 ходов.

При рассмотрении вышеуказанных формул подразумевалась конечностью математического ожидания числа ходов: m(x)<∞{displaystyle m(x)<infty } $m(x)<infty$ . Теперь будет предложено доказательство этого факта.

Задача о конечности ожидаемого числа ходов

Доказать, что m(x)<∞∀A,B{displaystyle m(x)<infty quad forall A,B} $m(x)<inftyquad forall A,B$ .

Решение. Достаточно доказать это для случая x=0{displaystyle x=0} $x=0$ (так как ранее было уже продемонстрировано, что случаи x≠0{displaystyle xneq 0} $xneq 0$ могут быть сведены к x=0{displaystyle x=0} $x=0$ вариацией A{displaystyle A} $A$ и B{displaystyle B} $B$ ) и p=q{displaystyle p=q} $p=q$ , а затем рассмотреть случай p≠q{displaystyle pneq q} $pne q$ . Итак, рассмотрим последовательность S0;1;…;n{displaystyle S_{0;1;ldots ;n}} $S_{0;1;ldots;n}$ и введём случайную величину Sτn=Sτn(ω){displaystyle S_{tau _{n}}=S_{tau _{n}}(omega )} $S_{tau_n} = S_{tau_n}(omega)$ , где τn=τn0{displaystyle tau _{n}=tau _{n}^{0}} $tau_n=tau_n^0$ — момент остановки. Далее, пусть Sτn(ω)=∑k=0nSk(ω)1{τn=k}(ω){displaystyle S_{tau _{n}}(omega )=sum limits _{k=0}^{n}S_{k}(omega )mathbf {1} _{{{tau _{n}=k}}}(omega )} $S_{tau_n} (omega) = sumlimits_{k=0}^n S_k(omega) mathbf{1}_{{ {tau_n=k} }}(omega)$ . Интерпретация такова: Sτn{displaystyle S_{tau _{n}}} $S_{tau_n}$ — это значение случайного блуждания в момент τn{displaystyle tau _{n}} $tau_n$ . Если τn<n{displaystyle tau _{n}<n} $tau_n<n$ , то Sτn∈{A;B}{displaystyle S_{tau _{n}}in {A;B}} $S_{tau_n}in {A;B}$ ; если τn=n{displaystyle tau _{n}=n} $tau_n=n$ , то A⩽Sτn⩽B{displaystyle Aleqslant S_{tau _{n}}leqslant B} $Aleqslant S_{tau_n} leqslant B$ . Вспомним, что p=q=0,5{displaystyle p=q=0{,}5} $p=q=0{,}5$ , и докажем, что E(Sτn)=0{displaystyle mathbb {E} (S_{tau _{n}})=0} $mathbb{E}(S_{tau_n})=0$ , E(Sτn2)=E(τn){displaystyle mathbb {E} (S_{tau _{n}}^{2})=mathbb {E} (tau _{n})} $mathbb{E}(S_{tau_n}^2) = mathbb{E}(tau_n)$ .

Для доказательства первого равенства напишем: E(Sτn)=∑k=0nE(Sk1{τn=k}(ω))=∑k=0nE(Sn1{τn=k}(ω))+∑k=0n((Sk−Sn)1{τn=k}(ω))=E(Sn)+∑k=0n((Sk−Sn)1{τn=k}(ω)){displaystyle mathbb {E} (S_{tau _{n}})=sum limits _{k=0}^{n}mathbb {E} {bigl (}S_{k}mathbf {1} _{{{tau _{n}=k}}}(omega ){bigr )}=sum limits _{k=0}^{n}mathbb {E} {bigl (}S_{n}mathbf {1} _{{{tau _{n}=k}}}(omega ){bigr )}+sum limits _{k=0}^{n}{bigl (}(S_{k}-S_{n})mathbf {1} _{{{tau _{n}=k}}}(omega ){bigr )}=mathbb {E} (S_{n})+sum limits _{k=0}^{n}{bigl (}(S_{k}-S_{n})mathbf {1} _{{{tau _{n}=k}}}(omega ){bigr )}} $mathbb{E}(S_{tau_n}) = sumlimits_{k=0}^n mathbb{E} bigl(S_kmathbf{1}_{{ {tau_n=k} }}(omega)bigr) = sumlimits_{k=0}^n mathbb{E} bigl( S_nmathbf{1}_{{ {tau_n=k} }}(omega) bigr) + sumlimits_{k=0}^n bigl( (S_k-S_n)mathbf{1}_{{ {tau_n=k} }}(omega) bigr) = mathbb{E}(S_n) + sumlimits_{k=0}^n bigl( (S_k-S_n)mathbf{1}_{{ {tau_n=k} }}(omega) bigr)$ . Совершенно очевидно, что E(Sn)=0{displaystyle mathbb {E} (S_{n})=0} $mathbb{E}(S_n)=0$ , так как Sn=ξ1+…+ξn{displaystyle S_{n}=xi _{1}+ldots +xi _{n}} $S_n = xi_1+ldots+xi_n$ , ξi=±1{displaystyle xi _{i}=pm 1} $xi_i=pm 1$ при p=q{displaystyle p=q} $p=q$ . Осталось доказать, что ∑k=0n((Sk−Sn)1{τn=k}(ω))=0{displaystyle sum limits _{k=0}^{n}{bigl (}(S_{k}-S_{n})mathbf {1} _{{{tau _{n}=k}}}(omega ){bigr )}=0} $sumlimits_{k=0}^n bigl( (S_k-S_n)mathbf{1}_{{ {tau_n=k} }}(omega) bigr) = 0$ . Для 0⩽k<n{displaystyle 0leqslant k<n} $0leqslant k < n$ справедливо, что {τn>k}={A<S1<B;…;A<Sk<B}{displaystyle {tau _{n}>k}={A<S_{1}<B;ldots ;A<S_{k}<B}} ${ tau_n>k } = { A<S_1<B;ldots;A<S_k<B}$ . Последнее событие может быть представлено в виде {ω:(ξ1;…;ξn)∈J}{displaystyle {bigl {}omega colon (xi _{1};ldots ;xi _{n})in J{bigr }}} $bigl{omegacolon (xi_1;ldots;xi_n)in J bigr}$ , где J{displaystyle J} $J$ — некоторое подмножество множества {−1;+1}k{displaystyle {-1;+1}^{k}} ${ -1;+1 }^k$ . Это множество определяется только ξi{displaystyle xi _{i}} $xi _{i}$ при i=1;k¯{displaystyle i={overline {1;k}}} $i=overline{1;k}$ . Для бо́льших i{displaystyle i} $i$ значения ξk+1;…;ξn{displaystyle xi _{k+1};ldots ;xi _{n}} $xi_{k+1};ldots;xi_n$ не влияют на J{displaystyle J} $J$ . Множество вида {τn=k}={τn>k−1}∖{τn>k}{displaystyle {tau _{n}=k}={tau _{n}>k-1}backslash {tau _{n}>k}} ${ tau_n=k } = { tau_n>k-1 } backslash { tau_n>k }$ также может быть представлено в виде {ω:(ξ1;…;ξn)∈J}{displaystyle {bigl {}omega colon (xi _{1};ldots ;xi _{n})in J{bigr }}} $bigl{omegacolon (xi_1;ldots;xi_n)in J bigr}$ . Благодаря независимости ξi{displaystyle xi _{i}} $xi _{i}$ (доказано в подзадаче 2) вытекает, что ∀0⩽k<n{displaystyle forall 0leqslant k<n} $forall 0leqslant k < n$ случайные величины Sn−Sk{displaystyle S_{n}-S_{k}} $S_n-S_k$ и 1{τn=k}{displaystyle mathbf {1} _{{tau _{n}=k}}} $mathbf{1}_{{ tau_n=k }}$ независимы. Отсюда E(Sk⋅1{τn=k}(ω))=E(Sk)⋅E(1{τn=k}(ω))=0{displaystyle mathbb {E} {bigl (}S_{k}cdot mathbf {1} _{{{tau _{n}=k}}}(omega ){bigr )}=mathbb {E} (S_{k})cdot mathbb {E} {bigl (}mathbf {1} _{{{tau _{n}=k}}}(omega ){bigr )}=0} $mathbb{E} bigl( S_kcdotmathbf{1}_{{ {tau_n=k} }}(omega)bigr) = mathbb{E}(S_k)cdot mathbb{E}bigl(mathbf{1}_{{ {tau_n=k} }}(omega)bigr)=0$ в силу того, что первый множитель нулевой.

E(Sτn2)=∑k=0nE(Sk21{τn=k})={displaystyle mathbb {E} (S_{tau _{n}}^{2})=sum limits _{k=0}^{n}mathbb {E} (S_{k}^{2}mathbf {1} _{{{tau _{n}=k}}})=}

mathbb{E}(S_{tau_n}^2) = sumlimits_{k=0}^n mathbb{E} ( S^2_k mathbf{1}_{{ {tau_n=k} }}) =

=∑k=0nE((Sn+(Sk−Sn)2)1{τn=k})=∑k=0n(E(S2)1{τn=k}+2E(Sn(Sk−Sn))1{τn=k}+E((Sn−Sk)2)1{τn=k})={displaystyle =sum limits _{k=0}^{n}mathbb {E} {Bigl (}{bigl (}S_{n}+(S_{k}-S_{n})^{2}{bigr )}mathbf {1} _{{{tau _{n}=k}}}{Bigr )}=sum limits _{k=0}^{n}{Bigl (}mathbb {E} (S^{2})mathbf {1} _{{{tau _{n}=k}}}+2mathbb {E} {bigl (}S_{n}(S_{k}-S_{n}){bigr )}mathbf {1} _{{{tau _{n}=k}}}+mathbb {E} {bigl (}(S_{n}-S_{k})^{2}{bigr )}mathbf {1} _{{{tau _{n}=k}}}{Bigr )}=}

= sumlimits_{k=0}^n mathbb{E} Bigl( bigl(S_n +(S_k - S_n)^2bigr) mathbf{1}_{{{tau_n=k}}}Bigr) = sumlimits_{k=0}^n Bigl( mathbb{E}(S^2)mathbf{1}_{{{tau_n=k}}} + 2mathbb{E} bigl( S_n (S_k - S_n)bigr) mathbf{1}_{{{tau_n=k}}} + mathbb{E} bigl( (S_n-S_k)^2 bigr)mathbf{1}_{{{tau_n=k}}} Bigr) =

=E(S2)−∑k=0nE((Sn−Sk)2)1{τn=k}=n−∑k=0nE(n−k)P({τn=k})=∑k=0nkP({τn=k})=E(τn).{displaystyle =mathbb {E} (S^{2})-sum limits _{k=0}^{n}mathbb {E} {bigl (}(S_{n}-S_{k})^{2}{bigr )}mathbf {1} _{{{tau _{n}=k}}}=n-sum limits _{k=0}^{n}mathbb {E} (n-k)mathbb {P} {bigl (}{tau _{n}=k}{bigr )}=sum limits _{k=0}^{n}kmathbb {P} {bigl (}{tau _{n}=k}{bigr )}=mathbb {E} (tau _{n}).}

=mathbb{E}(S^2) - sumlimits_{k=0}^n mathbb{E} bigl( (S_n-S_k)^2 bigr)mathbf{1}_{{{tau_n=k}}} = n - sumlimits_{k=0}^n mathbb{E} (n-k)mathbb{P}bigl( {tau_n=k}bigr) = sumlimits_{k=0}^n kmathbb{P}bigl({tau_n=k}bigr) = mathbb{E}(tau_n).

Установлено, что для идеальной монетки E(Sτn)=0{displaystyle mathbb {E} (S_{tau _{n}})=0} $mathbb{E}(S_{tau_n})=0$ , E(Sτn2)=E(τn){displaystyle mathbb {E} (S_{tau _{n}}^{2})=mathbb {E} (tau _{n})} $mathbb{E}(S_{tau_n}^2) = mathbb{E}(tau_n)$ . В случае же p≠q{displaystyle pneq q} $pne q$ имеют место соотношения E(Sτn)=(p−q)E(τn){displaystyle mathbb {E} (S_{tau _{n}})=(p-q)mathbb {E} (tau _{n})} ${mathbb {E}}(S_{{tau _{n}}})=(p-q){mathbb {E}}(tau _{n})$ (поскольку E(ξ1)=p−q{displaystyle mathbb {E} (xi _{1})=p-q} $mathbb{E}(xi_1) = p-q$ ) и E((Sτn−τnE(ξ1))2)=D(ξ1)⋅E(τn){displaystyle mathbb {E} {Bigl (}{bigl (}S_{tau _{n}}-tau _{n}mathbb {E} (xi _{1}){bigr )}^{2}{Bigr )}=D(xi _{1})cdot mathbb {E} (tau _{n})} ${displaystyle mathbb {E} {Bigl (}{bigl (}S_{tau _{n}}-tau _{n}mathbb {E} (xi _{1}){bigr )}^{2}{Bigr )}=D(xi _{1})cdot mathbb {E} (tau _{n})}$ , поскольку D(ξ1)=1−(p−q)2{displaystyle D(xi _{1})=1-(p-q)^{2}} ${displaystyle D(xi _{1})=1-(p-q)^{2}}$ . Теперь покажем, что limn→∞mn(0)=m(0)<∞{displaystyle lim limits _{nrightarrow infty }m_{n}(0)=m(0)<infty } $limlimits_{nrightarrowinfty} m_n(0) = m(0)<infty$ . В случае справедливой игры в силу соотношения E(Sτn2)=E(τn){displaystyle mathbb {E} (S_{tau _{n}}^{2})=mathbb {E} (tau _{n})} $mathbb{E}(S_{tau_n}^2) = mathbb{E}(tau_n)$ верно, что E(τn)⩽max{A2;B2}{displaystyle mathbb {E} (tau _{n})leqslant max{A^{2};B^{2}}} $mathbb{E}(tau_n)leqslant max{ A^2;B^2}$ . Тогда же E(τn)=E(Sτn2)=A2αn+B2βn+E(Sn21{A<Sn<B})1{τn=n}{displaystyle mathbb {E} (tau _{n})=mathbb {E} (S_{tau _{n}}^{2})=A^{2}alpha _{n}+B^{2}beta _{n}+mathbb {E} (S_{n}^{2}mathbf {1} _{{{A<S_{n}<B}}})mathbf {1} _{{{tau _{n}=n}}}} $mathbb{E} (tau_n) = mathbb{E}(S^2_{tau_n}) = A^2 alpha_n + B^2 beta_n + mathbb{E} (S^2_n mathbf{1}_{{{A<S_n<B}}}) mathbf{1}_{{{tau_n=n}}}$ , поэтому A2αn+B2βn⩽E(τn)⩽A2αn+B2βn+max{A2;B2}⋅γn{displaystyle A^{2}alpha _{n}+B^{2}beta _{n}leqslant mathbb {E} (tau _{n})leqslant A^{2}alpha _{n}+B^{2}beta _{n}+max{A^{2};B^{2}}cdot gamma _{n}} $A^2 alpha_n + B^2 beta_n leqslant mathbb{E}(tau_n) leqslant A^2 alpha_n + B^2 beta_n + max{ A^2;B^2 }cdot gamma_n$ . Из неравенства γn<εn{displaystyle gamma _{n}<varepsilon ^{n}} $gamma_n<varepsilon^n$ следует, что математическое ожидание E(τn){displaystyle mathbb {E} (tau _{n})} $mathbb{E}(tau_n)$ сходится при n→∞{displaystyle nrightarrow infty } $nrightarrowinfty$ к предельному значению m(0)=A2α+B2β=A2⋅BB−A−B2⋅AB−A=|AB|{displaystyle m(0)=A^{2}alpha +B^{2}beta =A^{2}cdot {frac {B}{B-A}}-B^{2}cdot {frac {A}{B-A}}=|AB|} $m(0) = A^2alpha + B^2 beta = A^2 cdot frac{B}{B-A} - B^2cdot frac{A}{B-A} = |AB|$ . В случае несправедливой игры E(τn)⩽max{|A|;B}|p−q|{displaystyle mathbb {E} (tau _{n})leqslant {frac {max{|A|;B}}{|p-q|}}} $mathbb{E}(tau_n)leqslant frac{max{ |A|;B }}{|p-q|}$ . Так как за τn{displaystyle tau _{n}} $tau_n$ обозначался момент первого вылета частицы за пределы коридора, то математическое ожидание его меньше определённых чисел, следовательно, меньше бесконечности. При таком условии E(τn)→m(0)=αA+βBp−q{displaystyle mathbb {E} (tau _{n})rightarrow m(0)={frac {alpha A+beta B}{p-q}}} $mathbb{E}(tau_n)rightarrow m(0) = frac{alpha A + beta B}{p-q}$ . ◼{displaystyle blacksquare } $blacksquare$