Sebuah Prekursor untuk Normalisasi Arus

Dalam episode sebelumnya Stat Stories, saya membahas transformasi variabel untuk distribusi kontinu univariat. Transformasi variabel seperti ini penting untuk menghasilkan distribusi baru dan kompleks dari distribusi yang lebih sederhana. Namun pembahasannya hanya terbatas pada satu variabel saja. Pada artikel kali ini kita akan membahas tentang transformasi distribusi bivariat. Memahami mekanisme transformasi multivariat adalah langkah pertama menuju metode pembelajaran mesin Normalisasi Aliran yang baru-baru ini populer. Namun untuk mempermudah, pada artikel ini kami hanya akan berpegang pada distribusi bivariat yang dapat digeneralisasikan ke distribusi multivariat.



Transformasi Bivariat

Pertimbangkan vektor acak bivariat (X, Y). Selanjutnya, kita pertimbangkan transformasi berikut pada vektor acak: U = g₁(X, Y) , V = g₂(X, Y). Selanjutnya kita berasumsi bahwa g₁ dan g₂ kontinu, terdiferensiasi, dan satu-ke-satu, oleh karena itu, inversnya ada dan kita dapat menuliskan transformasi inversnya sebagai X = h₁(U, V), Y= h₂(U, V). Alternatifnya, kita juga dapat mengasumsikan fungsi gpada vektor acak (X, Y ) yang secara gabungan menghasilkan (U, V), yaitu g(X, Y ) = (U, V). Kami berasumsi bahwa g tetap dapat dibalik.

Jika diperhatikan xX, y∈ Y,maka matriks jacobian dapat ditulis sebagai

dan determinannya adalah det(J) atau sederhananya, Jacobian.

Transformasi Kepadatan

Jika kita menggambar persegi panjang dari (u, v) sampai (u + ∆u, v + ∆v)seperti terlihat pada Gambar 2,

maka di dalam persegi panjang tersebut, kita mempunyai probabilitas fᵤ, ᵥ (u, v)∆u∆v untuk fungsi kepadatan sambungan fᵤ, ᵥ(u,v). Jika g⁻¹ adalah kebalikan dari g,maka (x,y) = g⁻¹(u,v). Dengan menggunakan ekspansi Taylor, dan hanya mempertahankan diferensiasi orde pertama, pendekatan linier g⁻¹menghasilkan dua sisi dalam jajaran genjang yang dapat didekati sebagai persegi panjang:

Luas persegi panjang ditentukan oleh norma perkalian silang

Persamaan 3 dapat dihitung dengan menggunakan penentuan matriks Jacobian yang disebutkan dalam Persamaan 1.

Karena itu,

dimana perkiraannya meningkat sebagai ∆y, ∆v → 0. Jadi, kita sampai pada rumus transformasi kepadatan bivariat:

yang dapat diperluas ke variabel acak multivariat Usebagai berikut:

Contoh

Kami menganggap X dan Y sebagai variabel acak normal standar yang independen. Jadi pdf gabungan dari X dan Y diberikan oleh

Kita mempunyai transformasi invers g⁻¹(x,y)sebagai berikut yang merupakan transformasi koordinat kutub (r ∈ R, θ ∈ Θ):

Kita dapat menulis determinan matriks Jacobian sebagai

Jadi, pdf gabungan R dan Θ menggunakan Persamaan 5 dapat ditulis sebagai

Di sini, R dan Θ bebas dan Θ seragam pada [0, 2π).

Pada Stat Stories episode selanjutnya saya akan membahas tentang Normalizing Flows. Normalisasi Aliran hanyalah perpanjangan dari transformasi variabel yang menggunakan kekuatan jaringan saraf untuk estimasi kepadatan dan pengambilan sampel, pembuatan data sintetis, dll. Apa yang kita diskusikan hingga saat ini hanyalah puncak gunung es.

Sementara saya memproduksi konten tentang Normalisasi Arus, silakan periksa episode Stat Stories sebelumnya:









Jika Anda ingin mempelajari lebih lanjut tentang topik penting dalam Statistika dan Ilmu Data, silakan berlangganan Medium melalui https://rahulbhadani.medium.com/membership. Harganya hanya $5/bulan tetapi sangat membantu saya karena Medium membayar sebagian dari biaya berlangganan Anda kepada penulis.

Jika Anda sudah sampai sejauh ini, lihat gambar kucing saya yang menggemaskan, Yuja:

Terima kasih sudah membaca.