Saya sedang menulis beberapa metode jaringan saraf dasar - khususnya fungsi aktivasi - dan telah mencapai batas pengetahuan saya tentang matematika. Saya memahami rentang masing-masing (-1/1) (0/1) dll, tetapi deskripsi dan implementasi yang berbeda-beda membuat saya bingung.
Khususnya sigmoid, logistik, bipolar sigmoid, tanh, dll.
Apakah sigmoid hanya mendeskripsikan bentuk fungsi terlepas dari rentangnya? Jika ya, apakah tanh merupakan 'fungsi sigmoid'?
Saya telah melihat 'bipolar sigmoid' dibandingkan dengan 'tanh' di sebuah makalah, namun saya telah melihat kedua fungsi tersebut diimplementasikan (di berbagai perpustakaan) dengan kode yang sama:
(( 2/ (1 + Exp(-2 * n))) - 1). Apakah keduanya sama persis?
Demikian pula, saya telah melihat aktivasi logistik dan sigmoid diimplementasikan dengan kode yang sama:
( 1/ (1 + Exp(-1 * n))). Apakah ini juga setara?
Terakhir, apakah hal itu terlalu penting dalam praktiknya? Saya melihat di wiki plot fungsi sigmoid yang sangat mirip - dapatkah salah satu dari ini digunakan? Beberapa di antaranya tampak jauh lebih cepat untuk dihitung daripada yang lain.