ฉันกำลังเขียนวิธีการโครงข่ายประสาทเทียมขั้นพื้นฐานบางอย่าง โดยเฉพาะฟังก์ชันการเปิดใช้งาน และได้เข้าถึงขีดจำกัดความรู้คณิตศาสตร์อันไร้สาระของฉันแล้ว ฉันเข้าใจช่วงที่เกี่ยวข้อง (-1/1) (0/1) ฯลฯ แต่คำอธิบายและการใช้งานที่แตกต่างกันทำให้ฉันสับสน
โดยเฉพาะ sigmoid, โลจิสติก, ไบโพลาร์ sigmoid, tanh ฯลฯ
sigmoid เป็นเพียงการอธิบายรูปร่างของฟังก์ชันโดยไม่คำนึงถึงช่วงหรือไม่ ถ้าเป็นเช่นนั้น tanh ถือเป็น 'ฟังก์ชันซิกมอยด์' หรือไม่
ฉันเคยเห็น 'bipolar sigmoid' เมื่อเปรียบเทียบกับ 'tanh' ในกระดาษ แต่ฉันได้เห็นการใช้งานทั้งสองฟังก์ชั่น (ในห้องสมุดต่างๆ) ด้วยรหัสเดียวกัน:
(( 2/ (1 + ประสบการณ์(-2 * n))) - 1). พวกเขาเป็นสิ่งเดียวกันทุกประการหรือไม่?
ในทำนองเดียวกัน ฉันได้เห็นการเปิดใช้งาน logistic และ sigmoid ด้วยโค้ดเดียวกัน:
( 1/ (1 + ประสบการณ์(-1 * n))). สิ่งเหล่านี้เทียบเท่ากันหรือไม่?
สุดท้ายนี้ มันสำคัญขนาดนั้นเลยในการฝึกซ้อมเหรอ? ฉันเห็นในวิกิ พล็อตของฟังก์ชัน sigmoid ที่คล้ายกันมาก - สิ่งเหล่านี้สามารถนำมาใช้ได้ไหม บางอย่างดูเหมือนว่าอาจจะคำนวณได้เร็วกว่าอย่างอื่นมาก