Bài giảng xác suất thống kê: Biến ngẫu nhiên (2)

 

Trong phân này:

- Các phép toán với biến ngẫu nhiên

- Giá trị kỳ vọng

- Giá trị kỳ vọng hình học

Các phép toán với biến ngẫu nhiên

Tương tự như với các số và các hàm số, ta có thể làm nhiều phép toán khác nhau với các biến ngẫu nhiên: cộng, trừ, nhân, chia, lấy giới hạn, tích phân, hàm hợp, v.v. Qua các phép toán như vậy, chúng ta có thể sinh ra các biến ngẫu nhiên mới từ các biến ngẫu nhiên cho trước.

Ví dụ. Một học sinh thi vào đại học phải thi 3 môn. Điểm của mỗi môn có thể coi là 1 biến ngẫu nhiên. Tổng số điểm cũng là một biến ngẫu nhiên, và nó là tổng của 3 biến ngẫu nhiên phía trước.

Ví dụ. Tốc độ V của một xe ô tô đang chạy trên đường có thể coi là một biến ngẫu nhiên. Nếu xe đang chạy mà phải phanh gấp lại vì phía trước có nguy hiểm, thì từ thời điểm người lái xe bóp phanh cho đến thời điểm xe dừng lại, xe phải chạy thêm mất một quãng đường có độ dài D nữa. D cũng có thể coi là một biến ngẫu nhiên. Nó không phải là tỷ lệ thuận với V, mà là tỷ lệ thuận với bình phương của V. Tức là biến ngẫu nhiên D có thể được sinh ra từ biến ngẫu nhiên V theo công thức: D = k. V^2. Hệ số k ở đây phụ thuộc vào điều kiện của đường và điều kiện của xe; nó có thể coi là xác định nếu ta biết các điều kiện này, còn nếu không thì có thể coi là một biến ngẫu nhiên khác. Ví dụ, trong điều kiện đường tốt và xe tốt, thì k = 0,08m^{-1}.s^2: một xe đang chạy với tốc độ 36km/h = 10m/s thì từ lúc bóp phanh đến lúc dừng lại chạy thêm mất 0,08 \times 10^2 = 8 mét, nhưng nếu xe đang chạy với tốc độ  108km/h = 3  \times 36km/h, thì từ lúc bóp phanh đến lúc dừng lại sẽ chạy thêm mất những 8 \times 3^2 = 72 mét.

Giá trị kỳ vọng

Khi ta có một biến ngẫu nhiên, ta có thể nghiên cứu các tính chất, đặc trưng của nó, để rút ra các thông tin, kết luận nào đó. Một trong những đặc trưng quan trọng nhất là giá trị kỳ vọng.

Định nghĩa. Giá trị kỳ vọng của một biến ngẫu nhiên F, ký hiệu là \mathbb{E}(F) chính là trung bình cộng của biến ngẫu nhiên đó trên không gian xác suất các tình huống.

Trong trường hợp không gian xác suất các tình huống là một tập hợp hữu hạn, \Omega = \{x_1,\hdots,x_n\} với các xác suất p(x_i) (\sum_i p(x_i) = 1), thì công thức tính giá trị kỳ vọng (trung bình cộng) của một biến ngẫu nhiên F: \Omega \to \mathbb{R}

\mathbb{E}(F) = \sum_{i} F(x_i). p(x_i)

Trong trường hợp tổng quát, công thức tính giá trị kỳ vọng được viết dưới dạng tích phân:

\mathbb{E}(f) = \int_\Omega f dp

Tất nhiên, nếu một biến ngẫu nhiên thực ra là một hằng số, thì giá trị kỳ vọng của nó chính là hằng số đó.

Bổ đề. Giá trị kỳ vọng của một biến ngẫu nhiên f có thể được xác định thông qua phân bố xác suất p_f của biến ngẫu nhiên đó, theo công thức sau:

\mathbb{E}(f) = \int_{x \in \mathbb{R}} x dp_f

Chứng minh. Nó được suy ra trực tiếp từ định nghĩa của tích phân trên không gian xác suất.

Một số tính chất cơ bản của giá trị kỳ vọng:

Tuyến tính: Nếu F,G là hai biến ngẫu nhiên và a,b là hai hằng số thì  \mathbb{E}(aF + bG) = a \mathbb{E}(F) + b \mathbb{E}(G)

Đơn điệu: Nếu  f \geq 0 thì  \mathbb{E}(f) \geq 0 . Tổng quát hơn, nếu F \geq G thì \mathbb{E}(F) \geq \mathbb{E}(G)

Ví dụ. Một doanh nghiệp đầu tư phát triển một sản phẩm mới, xác suất thành công là 30%. Chi phí đầu tư bỏ ra là 100 nghìn USD. Nếu không thành công thì mất chi phí đầu tư mà không thu về được gì, nhưng nếu thành công thì thu về được 1 triệu. Thử hỏi kỳ vọng lợi nhuận từ vụ đầu tư này là bao nhiêu ? Trả lời: Không gian xác suất ở đây có thể coi gồm 2 điểm: S (thành công) với xác suất 30%, với giá trị của biến ngẫu nhiên “lợi nhuận” tại S là 1000000-100000 = 900000 (USD), và F (thất bại) với xác suất 1-30% = 70%, với giá trị của “lợi nhuận” là – 100000 USD. Như vậy giá trị kỳ vọng của lợi nhuận là (theo đơn vị USD):

 900000 \times 30\% + ( - 100000)  \times (1 - 30\%) = 170000

Ví dụ. Đặc trưng của những “con bạc khát nước” là ham chơi những trò dính dáng tiền nong có kỳ vọng lợi nhuận bằng 0 hoặc âm (mất tiền). Ví dụ như trò chơi đề: trong 100 số đề sẽ chỉ có 1 số thắng, 99 số thua. Thắng thì được 70 lần tiền đặt cọc. Thua thì mất tiền đặt cọc. Nếu đặt cọc T tiền, thì kỳ vọng số tiền nhận lại được là 99\% \times 0 + 1\% \times 70 . X = 0,7 . X. Kỳ vọng lãi (lỗ) là . Tức đem X tiền đi chơi đề một lần, thì kỳ vọng là bị thua 0,3 . X .

Ví dụ. Trong một mô hình xác suất liên tục, với không gian xác suất là đoạn thẳng  [1,4] với phân bố xác suất đều trên đó (tức là xác suất của một đoạn thẳng con trong đó bằng chiều dài của đoạn đó chia cho 3, ở đây 3 laf chiều dài của đoạn  [1,4], hay nói cách khác độ đo xác suất ở đây bằng 1/3 độ đo thông thường), và biến ngẫu nhiên là hàm  f: [1,4] \to \mathbb{R} định nghĩa bởi công thức  f(x) = x^2 + x, giá trị kỳ vọng của biến ngẫu nhiên này sẽ là

 \mathbb{E}(f) = \int_1^4 (x^2 + x) dx/3 = {19 \over 2}

Ví dụ. Giá trị kỳ vọng của một biến ngẫu nhiên F với phân bố Poisson p(F = k) = {\lambda^k \over k!}. e^{-\lambda} bằng \lambda. Thật vậy, \mathbb{E}(F)= \sum_k k.p_F(k)

 = \sum_k k. {\lambda^k \over k!}. e^{-\lambda}= (\sum_{k \geq 1}  {\lambda^k \over (k-1)!}). e^{-\lambda}

 = \lambda. (\sum_{k \geq 1}  {\lambda^{k-1} \over (k-1)!}). e^{-\lambda} = \lambda.e^{\lambda}.e^{-\lambda} = \lambda

Ví dụ. Giá trị kỳ vọng của phân bố geometric p_T(k) = q(1-q)^{k-1}\mathbb{E}(T) = \sum_{k=1}^\infty k. q. (1-q)^{k-1} = 1/q. Điều này phù hợp với suy luận trực giác rằng, nếu xác suất để ném vòng một lần trúng cổ chai là q, thì trung bình phải ném vòng 1/q lần mới trúng cổ chai.

Ví dụ. Giá trị kỳ vọng của phân bố xác suất normal với các tham số \mu,\sigma chính bằng \lmu.

Bài tập. Xây dựng một ví dụ đơn giản với hai biến ngẫu nhiên F,G sao cho \mathbb{E}(FG) \neq \mathbb{E}(F). \mathbb{E}(G)

Giá trị kỳ vọng hình học

Trong các tài liệu khác về xác suất ít khi nhắc tới kỳ vọng hình học. Nhưng khái niệm này cũng rất quan trọng, bởi vậy tôi muốn đề cập nó ở đây. Giá trị kỳ vọng ứng với trung bình cộng, còn giá trì kỳ vọng hình học ứng với trung bình nhân. Một ví dụ đơn giản sau đây cho thấy sự quan trọng của trung bình nhân trong thực tế.

Ví dụ. Giả sử giá nhà dao động trong 4 năm như sau. Năm đầu tiên giảm 15%, năm thứ hai tăng 35%, năm thứ ba giảm 20%, năm thứ tư tăng 20%. Hỏi xem trong 4 năm đó giá nhà tăng lên (hay giảm đi) trùng bình mỗi năm bao nhiêu % ? Nếu ta lấy trung bình cộng thì được (-15% + 35% – 20% + 20%)/ 4 = 5% một năm. Nhưng con số đó có phản ánh chính xác sự đi lên của giá nhà trong 4 năm không ? Nếu gọi giá lúc đầu là X, thì sau năm đầu giá là (1-15%)X, sau năm thứ hai giá là (1+35%)(1-15%)X, sau năm thứ ba giá là (1-20%)(1+35%)(1-15%)X, sau 4 năm giá là (1+20%)(1-20%)(1+35%)(1-15%)X = 1,1016 X. Tức là sau 4 năm giá nhà chỉ tăng lên có 10,16%, chứ không phải 20% (= 4 lần 5%) như là người ta tưởng ! Để có cái nhìn chính xác về mức độ tăng trưởng trung bình hàng năm trong giai đoạn 4 năm, cần phải lấy trung bình nhân của các con số 1+20%, 1-20%, 1+35%, 1-15% rồi trừ đi 1. Kết quả là 2,449% một năm.

Như chúng ta biết, nếu có một dãy các số dương a_1,\hdots, a_n, a_i > 0 với mọi i, thì ngoài giá trị trung bình cộng (\sum a_i)/n, chúng ta còn có thể nói đến trung bình nhân:

(\prod_i a_i)^{1/n}

Từ tiếng Anh cho trung bình nhân là geometric mean, nếu dịch từng chữ ra tiếng Việt thì là “trung bình hình học”, còn trung bình cộng là “trung binh số học”.

Trung bình nhân có thể được định nghĩa qua trung bình cộng và qua hàm logarithm \ln, và hàm ngược của hàm \ln, tức là hàm \exp:

(\prod_i a_i)^{1/n} = \exp (\sum_i (\ln a_i)/n )

Hàm \lnhàm lõm trên nửa đường thẳng dương (đạo hàm bậc hai của nó bằng - 1/x^2 là một hàm âm), bởi vậy ta có:

(\sum_i \ln a_i)/n \leq \ln (\sum_i a_i)

Lấy \exp của hai vế của bất đẳng trên, ta được bất đẳng thức quen thuộc sau: Trung bình nhân luôn luôn nhỏ hơn hoặc bằng trung bình cộng:

(\prod_i a_i)^{1/n} \leq (\sum_i a_i)/n

Dấu bằng xảy ra khi và chỉ khi tất cả các số a_i bằng nhau.

Nếu thay vì một dãy các số dương, ta có một biến ngẫu nhiên Fmà các giá trị đều dương, thì ta cũng có thể làm tương tự như trên, và kết quả gọi là giá trị kỳ vọng hình học của F, và tôi sẽ ký hiệu là \mathbb{G}(F):

\mathbb{G}(F) = \exp ( \mathbb{E}( \ln F) ) = \exp (\int_\Omega \ln(F) dp)

Chúng ta cũng có bất đẳng thức sau: Giá trị kỳ vọng hình học luôn nhỏ hơn hoặc bằng giá trị kỳ vọng:

\mathbb{G}(F) \leq \mathbb{E} (F)

Dấu bằng xảy ra khi và chỉ khi F là hằng số trên không gian xác suất, tức là không ngẫu nhiên. (Nói theo kiểu chặt chẽ toán học, thì F là hằng số theo nghĩa xác suất, tức là có thể có một tập con có độ đo xác suất bằng 0 mà ở đó F nhận giá trị khác).

Ví dụ. Giả sử có một cơ hội đầu tư như sau. Khả năng thắng/thua là 50%/50%, sau 1 tháng biết kết quả. Nếu thắng thì lãi 100%, nếu thua thì lỗ 50% tiền bỏ ra. (Trên thị trường chứng khoán có những trường hợp tương tự như vậy, ví dụ như 1 hãng công nghệ sinh học khi đang đợi kết quả thí nghiệm lâm sàng của một loại thuốc chữa ung thư, nếu thành công thì giá trị cổ phiếu của hãng có thể tăng vài lần, nếu thất bại thì giá trị cũng có thể mất trên 50%). Thử hỏi đối với người đầu tư thì có nên đầu tư vào những cơ hội như vậy không, và nếu nên thì nên đầu tư với nhiều nhất nhiêu % vốn đầu tư (để đạt kỳ vọng lợi nhuận cao nhất, giả sử là không có các cơ hội đầu tư khác)?

Trước hết, ta có thể tính giá trị kỳ vọng của lợi nhuận của đầu tư theo cơ hội trên, với 1 đơn vị vốn bỏ ra. Gọi P là biến “lợi nhuận”, ta có 2 khả năng: hoặc P = 1 hoặc P = - 1/2, mỗi khả năng có xác suất 50%. Như vậy kỳ vọng lợi nhuận trên 1 đơn vị vốn bỏ ra là:

\mathbb{E}(P) = 50\%. 1 + 50\%. (-1/2) = 0,25

Kỳ vọng lợi nhận ở đây là dương và khá lớn (bằng 25% vốn bỏ ra), nên đây là cơ hội nên đầu tư, trừ khi có những cơ hội khác tốt hơn. (Lãi 25% trong một tháng có thể gọi là siêu lợi nhuận).

Câu hỏi thứ hai là nhà đầu tư nên đầu tư vào đó nhiều nhất là bao nhiêu phần trăm vốn đầu tư ? Nếu giả sử đầu tư toàn bộ 100% vốn. Khi đó có 2 khả năng, hoặc là tổng số vốn tăng lên gấp đôi, hoặc là giảm đi còn 1 nửa, với xác suất của mỗi khả năng là 50%. Nhưng nếu một nhà đầu tư mà làm như vậy 2 lần liên tiếp, 1 lần thắng một lần thua, thì sau hai lần số vốn lại về như cũ không tăng trưởng được gì cả. Muốn đảm bảo cho vốn tăng trưởng “về lâu về dài”, cái cần tính đến không phải là giá trị kỳ vọng của vốn sau mỗi lần đầu tư, mà là giá trị kỳ vọng hình học. Nếu giả sử chỉ có 1 cơ hội đầu tư duy nhất như trên, thì giá trị kỳ vọng hình học của vốn có được sau khi đầu tư Y tiền vào đó trên tổng số X tiền sẽ là:

\sqrt{(X - Y/2) (X + Y)}

Để tối ưu hóa giá trị kỳ vọng hình học tức là tìm Y sao cho \sqrt{(X -Y/2) (X + Y)} đặt cực đại, với X cho trước. Kết quả là Y = X/2, và khi đó giá trị kỳ vọng hình học của vốn sau khi đầu tư là \sqrt{(X - X/4) (X + X/2)} =1,061.X Như vậy, kỳ vọng lợi nhuận của một cơ hội đầu tư như trên, tính trên toàn bộ vốn của nhà đầu tư, chỉ có không quá 6,1% chứ không phải 25%.

Ngoài bất đẳng thức “giá trị kỳ vọng hình học nhỏ hơn hoặc bằng giá trị kỳ vọng” viết phía trên, giá trị kỳ vọng hình học còn có thêm một số tính chất đáng chú ý như sau:

Tính đơn điệu: Tương tự như giá trị kỳ vọng, nếu F \geq G thì \mathbb{G}(F) \geq \mathbb{G}(G)

Tính thuần nhất: Nếu c là hằng số thì \mathbb{G}(cF) = c \mathbb{G}(F)

Tính lõm: Giá trị kỳ vọng hình học không có tính tuyến tính như giá trị kỳ vọng; thay vì đó nó có tính lõm:

(\mathbb{G}(F) + \mathbb{G}(G))/2 \leq \mathbb{G}((F+G)/2)

Dấu bằng xảy ra khi và chỉ khi FG tỷ lệ thuận với nhau, tức là tồn tại một hằng số dương c sao cho G = cF.

(Bài tập: chứng minh bất đẳng thức trên, cho trường hợp không gian xác suất là một không gian hữu hạn phần tử có phân bố xác suất đều)

Tính lõm của giá trị kỳ vọng hình học chính là cơ sở của nguyên tắc đa dạng hóa tài sản (diversification) trong đầu tư: Bằng cách đa dạng hóa tài sản (đầu tư một phần vào F và một phần vào G , thay vì chỉ đầu tư vào F hay chỉ đầu tư vào G) có thể làm tăng giá trị kỳ vọng hình học của danh mục đầu tư (ít ra là trong trường hợp F và G có cùng kỳ vọng hình học về performance).

Print Friendly
 

Leave a Reply

  

  

  

You can use these HTML tags

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Spam Protection by WP-SpamFree