Copula trong xác suất và tài chính (1)

 

Seminar toán tài chính tiếng Việt ở Toulouse (chiều thứ 6 hàng tuần) đang thảo luận về copula trong xác suất và quản lý rủi ro tài chính. Tôi tóm tắt lại đây những gì đã thảo luận. Tuần sau sẽ viết tiếp phần thảo luận tuần sau

Khái niệm copula được Abe Sklar đưa vào xác suất thống kê từ năm 1959, nhưng chỉ trong khoảng 2 thập kỷ lại đây lý thuyết copula mới phát triển mạnh, do nhu cậu ứng dụng trong quản lý rủi ro tài chính. Trong từ điển về thống kê phải đến quãng 1997 mới xuất hiện thuật ngữ này. Theo tiếng Anh, copula có nghĩa là “bộ phận nối, đoạn nối”. (Không nhầm với cupola, có nghĩa là mái vòm). Trong xác suất, nó được dùng theo nghĩa “hàm nối” các phân bố xác suất của một bộ nhiều biến ngẫu nhiên với nhau.

Các copula n chiều là các hàm n biến, từ [0,1]^n vào [0,1], thể hiện sự phụ thuộc vào nhau của một bộ n biến ngẫu nhiên. Các copula là các hàm đặc biệt với nhiều tính chất rất thú vị, và khi ta biết copula thì cũng có thể tính toán được sự phụ thuộc của các biến ngẫu nhiên trên mức covariance và correlation. Lý thuyết đầu tư và rủi ro chỉ sử dụng covariance và correlation (của các chỉ số, giá cả, v.v.) không thôi thì chưa đủ, mà phải khảo sát copula của chúng.

Một số tài liệu tham khảo về copula là:

Sách:

- Roger Nelson, An introduction to copulas, 2nd edition, Springer, 2006.

- U. Cherubini, E. Luciano, W. Vecchiato, Copula methods in finance, John Wiley & Sons, 2004.

Bài báo:

- P. Embrechts, F. Lindskog, A. McNeil, Modelling dependence with copulas and applications to risk management, 2001 (đây là bài báo dùng làm seminar tuần vừa qua)

- và một số bài báo khác của Paul Embrechts (giáo sư ở ETH Zurich) và các đồng tác giả.

(Hai quyển sách là do Nguyễn Văn Minh (NCS ở Toulouse) tìm ra, các bài báo là do TS Lưu Hoàng Đức (Viện Toán HN) giới thiệu, ai muốn xin files của chúng có thể hỏi Nguyễn Văn Minh).

Copula là gì ?

Nếu ta có một hàm H định nghĩa trên một miền n chiều chứa một hình hộp B = [a_1,b_1] \times \hdots \times [a_n,b_n], thì ta có thể định nghĩa thể tích của H trên B bằng

V_H(B) = \sum sign(c) H(c)

trong đó c chạy trên các đỉnh của B; dấu của c  là dương nếu trong các tọa độ của nó có một số chẵn các a_i và là âm nếu ngược lại.

Chẳng hạn, nếu

H (x_1,\hdots, x_n) = P(X_1 \leq x_1,\hdots, X_n \leq x_n) là hàm phân phối xác suất toàn phần đồng thời của một bộ n biến ngẫu nhiên X_1, \hdots, X_n, thì ta có

V_H (B) = P(a_1 < X_1 \leq b_1,\hdots, a_n < X_n \leq b_n)

Hàm H được gọi là n-tăng nếu thể tích của nó trên hộp bất kỳ là không âm. Ví dụ hàm phân phối xác suất là hàm tăng.

Ta sẽgiả sử rằng bản thân miền xác định của hàm H là một hộp [A_1, B_1] \times \hdots \times [A_n, B_n], trong đó $A_i$ và $B_i$ là các số thực hoặc cộng trừ vô cùng. Hàm H được gọi là có đáy (grounded) nếu

H(x_1, \hdots, A_i, \hdots x_n) = 0

với mọi i và mọi x_j (j \neq i). Nếu hơn nữa, [A_i,B_i] = [- \infty, + \infty] với mọi iH(+ \infty, \hdots, + \infty) = 1, thì H được gọi là hàm phân phối. (Hàm phân phối xác suất thực sự sẽ có thêm điều kiện liên tục bên phải, nhưng ta tạm thời bỏ qua điều kiện đó ở đây).

Các hàm

H_k(x) := H(B_1, \hdots, x, \hdots, B_n)

được gọi là các hàm biên duyên (margin) của H (tương tự như là hàm phân phối xác suất biên duyên).

Dễ thấy rằng nếu H là hàm n-tăng có đáy, thì nó tăng theo từng biến, và hơn nữa ta có bất đẳng thức sau (Schweizer-Sklar 1983):

|H(x_1,\hdots, x_n) - H(y_1,\hdots, y_n)| \leq \sum_{k=1}^n |H_k(x_k) - H_k(y_k)|

Định nghĩa. Một hàm n biến C: [0,1]^n \to [0,1]^n được gọi là một copula nếu nó là hàm n-tăng có đáy sau cho các hàm biên duyên C_k(u), k=1,\hdots, n đều có dạng C_k(u) = u với mọi u \in [0,1].

Có thể thấy ngay rằng, mỗi hàm copula (với giả sử liên tục) cho một phân bố xác suất trên [0,1]^n với tính chất các phân bố biên duyên đều là phân bố đều trên đoạn thẳng [0,1]

Định lý (Sklar). Nếu H là hàm phân phối bất kỳ trên [-\infty, +\infty]^n với các hàm phân phối biên duyên H_k, thì tồn tại một copula C sao cho H(x_1, \hdots, x_n) = C(H_1(x_1), \hdots H_n(x_n)). Nếu các hàm H_k đều liên tục, thì C là duy nhất. (Nếu không thì nó duy nhất trên Ran H_1 \times \hdots \times Ran H_n). Ngược lại, với bất kỳ copula C nào và bất kỳ các hàm phân phối 1 chiều H_1, \hdots H_n nào, công thức trên định nghĩa một hàm phân phối n chiều.

Trong định lý trên, Ran có nghĩa là range, tức là ảnh của các hàm.

Ý nghĩa của định lý Sklar là, đối với một vector ngẫu nhiên n chiều, thì phần phụ thuộc giữa các biến ngẫu nhiên trong đó được xác định bởi một copula, và có thể tách rời nó ra khỏi phần các phân bố biên duyên. Hai phần này kết hợp lại với nhau thì cho phân bố chung n chiều.

Ví dụ. Đối với phân bố normal n chiều có ma trận correlation (các hệ số tương quan) là R và các phân bố biên duyên đều là phân bố normal chuẩn tắc với hàm phân phối ký hiệu là \Phi, thì  copula của nó

C(u_1,\hdots, u_n) = \Phi^n_R (\Phi^{-1}(u_1), \hdots, \Phi^{-1}(u_n))

cũng được gọi là copula normal (hay Gaussian) n chiều.

Chặn Fréchet-Hoeffding cho các phân bố chung

Ông Fréchet nói đến ở đây chính là Maurice René Fréchet (1878-1973) nổi tiếng bởi không gian Fréchet trong giải tích hàm. Ông cũng có nhiều đóng góp trong xác suất thống kê.

Đặt tên các hàm n biến sau (trong  đó \bold{u} = (u_1,\hdots,u_n)):

M^n(\bold{u}) = \min (u_1,\hdots,u_n),

\Pi^n (u) = u_1\hdots u_n,

W^n(u) = \max (u_1 + \hdots + u_n - n +1, 0)

Các hàm M^n, \Pi^n là các copula cho mọi n \geq 2, còn W^n không phải là copula nếu n > 2 mà chỉ là copula khi n =2 (bài tập: hãy tự chứng minh điều đó, dựa trên định nghĩa về copula!). M^n là copula của các biến ngẫu nhiên hoàn toàn phụ thuộc vào nhau và đồng điệu, còn \Pi^n là copula của các biến ngẫu nhiên độc lập với nhau.

Ta có định lý sau của Fréchet (1957) dựa trên kết quả trước đó của Hoeffding (1940).

Định lý . Với mọi copula n chiều C và mọi \bold{u} \in [0,1]^n ta có

W^n(\bold{u}) \leq C(\bold{u}) \leq M^n(\bold{u})

Hơn nữa, khi n \geq 3, thì với mọi \bold{u} \in [0,1]^n tồn tại một copula C sao cho W^n(\bold{u}) \leq C(\bold{u}).

Định lý trên cho thấy chặn Fréchet-Hoeffding là chặn trên-chặn dưới tốt nhất có thể có cho các copula nói chung.

Định nghĩa. Nếu C là copula n chiều, thì hàm sống sót (survival) \bar{C} của C được định nghĩa là:

\bar{C}(u_1,\hdots,u_n) = V_C ( [u_1,1] \times \hdots \times [u_n,1])

Copula C được gọi là nhỏ hơn copula C' (theo nghĩa của copula, ký hiệu: C \prec C') nếu như C \leq C'\bar{C} \leq \bar{C'}

Trong trường hợp n=2 thì \bar{C} (u_1,u_2) = 1 + C(u_1,u_2) - u_1 - u_2,  do đó trong trường hợp này thì nhỏ hơn theo nghĩa copula tương đương với nhỏ hơn theo nghĩa thông thường, và định lý Fréchet phía trên cho thấy M^2 là copula lớn nhất trong các copula 2 chiều, còn W^2 là copula nhỏ nhất trong số các copula 2 chiều.

(Phần sau: copula và sự phụ thuộc giữa các biến ngẫu nhiên)

Print Friendly
 

12 comments to Copula trong xác suất và tài chính (1)

Leave a Reply

  

  

  

You can use these HTML tags

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Spam Protection by WP-SpamFree