สิ่งพิมพ์ตามแท็ก large-language-models

สิ่งตีพิมพ์ในหัวข้อ 'large-language-models'

Stochastic Parrots สามารถเข้าใจสิ่งที่พวกเขาเรียนรู้ได้อย่างแท้จริงหรือไม่?

ฉันคิดว่าฉันมีคุณแล้วกับพาดหัว นกแก้วสุ่มห่าคืออะไร? เอาล่ะ มาดำดิ่งลงไปเลย! ในแมชชีนเลิร์นนิง "นกแก้วสุ่ม" คือโมเดลภาษาขนาดใหญ่ (เช่น GPT-3 โดย "OpenAI", "Cohere", "Hugging Face") ที่สร้างภาษาที่น่าเชื่อถือได้ดีแต่ไม่เข้าใจความหมายจริงๆ ของภาษาที่กำลังประมวลผล ในบทความนี้ เราจะเจาะลึกความซับซ้อนของนกแก้วสุ่ม สำรวจข้อจำกัดของนกแก้วสุ่ม และประเมินความสามารถในการเข้าใจสิ่งที่พวกเขาเรียนรู้อย่างแท้จริง ทำความเข้าใจกับนกแก้ว Stochastic Stochastic Parrot คืออะไร? นกแก้ว..

วิศวกรรมพร้อมท์: ประสบการณ์การเรียนรู้ของเครื่องก่อนหน้านี้ล้าสมัยหรือไม่? ไม่เร็วนัก

วิศวกรรมพร้อมท์: ประสบการณ์การเรียนรู้ของเครื่องก่อนหน้านี้ล้าสมัยหรือไม่? ไม่เร็วนัก เมื่อวันก่อน ฉันได้พบกับนักพัฒนาซอฟต์แวร์คนหนึ่งถามว่าจะเป็นการลงทุนที่ดีหรือไม่ในการเป็นผู้เชี่ยวชาญด้านวิศวกรรมที่รวดเร็ว ฉันแสดงความกังวลเกี่ยวกับแผนดังกล่าว การทำความคุ้นเคยกับแมชชีนเลิร์นนิงโดยรวมจะฉลาดกว่าและปลอดภัยกว่ามาก เนื่องจากแนวคิดเหล่านี้ครอบคลุมปัญหาที่หลากหลายมากขึ้น รวมถึงวิศวกรรมที่รวดเร็วด้วย และการเริ่มต้นไม่เคยง่ายอย่างนี้มาก่อน ด้วย Hugging Face..

แนวทางแก้ไขที่เป็นไปได้สำหรับปัญหาความเป็นส่วนตัวของข้อมูลของโมเดลขนาดใหญ่ด้วยการเรียนรู้แบบสมาพันธ์

การถอดรหัสการทำงานร่วมกันของ Federated LLMs: ข้อดี ความท้าทาย และเส้นทางข้างหน้าในยุคที่ขับเคลื่อนด้วยข้อมูล ทฤษฎีการเรียนรู้ในอุดมคติเมื่อนำไปใช้กับโลกแห่งความเป็นจริง มักจะเผชิญกับความท้าทายมากมาย ตั้งแต่การปรับใช้โมเดลไปจนถึงการบีบอัดโมเดล และจากการเข้าถึงข้อมูลไปจนถึงข้อกังวลด้านความเป็นส่วนตัวของข้อมูล เนื่องจากข้อมูลสาธารณสมบัติขาดแคลนและปัญหาความเป็นส่วนตัวของข้อมูลโดเมนส่วนตัว การเรียนรู้แบบสหพันธ์ซึ่งเป็นเฟรมเวิร์กการเรียนรู้ของเครื่องแบบกระจายจึงได้รับความสนใจอย่างมาก..

โมเดลภาษาขนาดใหญ่: AI รุ่นต่อไป

โมเดลภาษาขนาดใหญ่ (LLM) คืออะไร โมเดลภาษาขนาดใหญ่เป็นปัญญาประดิษฐ์ประเภทหนึ่งที่ได้รับการฝึกฝนเกี่ยวกับข้อมูลข้อความจำนวนมหาศาล ข้อมูลนี้อาจรวมถึงหนังสือ บทความ เว็บไซต์ และแม้แต่โพสต์บนโซเชียลมีเดีย ด้วยการฝึกอบรมข้อมูลจำนวนมาก LLM สามารถเรียนรู้ความสัมพันธ์ทางสถิติระหว่างคำและวลีได้ ซึ่งช่วยให้พวกเขาสามารถสร้างข้อความ แปลภาษา เขียนเนื้อหาสร้างสรรค์ประเภทต่างๆ และตอบคำถามของคุณในลักษณะที่ให้ข้อมูล LLM ยังอยู่ระหว่างการพัฒนา แต่ได้เรียนรู้การทำงานหลายประเภทแล้ว ตัวอย่างเช่น..

การเพิ่มประสิทธิภาพพร้อมท์อัตโนมัติของ Microsoft ปรับปรุงพร้อมท์เพื่อเพิ่มประสิทธิภาพ LLM

การเพิ่มขึ้นของโมเดลภาษาขนาดใหญ่ (LLM) อันทรงพลังเมื่อเร็ว ๆ นี้ ได้ปฏิวัติสาขาการประมวลผลภาษาธรรมชาติ (NLP) ประสิทธิภาพของโมเดลกำเนิดเหล่านี้ส่วนใหญ่ขึ้นอยู่กับการแจ้งเตือนของผู้ใช้ซึ่งมีรายละเอียดและซับซ้อนมากขึ้น การค้นหาใน Google Trends เผยความนิยมเพิ่มขึ้นร้อยเท่าสำหรับคำว่า “prompt…

การปรับตัวระดับต่ำ (LoRa) คืออะไร

LLM ถูกมองว่าเป็นเทคโนโลยีที่สำคัญสำหรับการพัฒนาผลิตภัณฑ์และบริการที่เป็นนวัตกรรม บริษัทชั้นนำกำลังทำการลงทุนที่สำคัญในพวกเขาเพื่อใช้ประโยชน์จากเทคโนโลยีใหม่นี้ในผลิตภัณฑ์/บริการของตน และมอบมูลค่าที่ดีขึ้นให้กับผู้ใช้ของพวกเขา อย่างไรก็ตาม มีปัญหาใหญ่ในการฝึกอบรมและให้บริการโมเดลภาษาขนาดใหญ่เหล่านี้ มีค่าใช้จ่ายสูง ตามบทความบางบทความ [ 1 ] [ 2 ] ค่าใช้จ่ายในการฝึกอบรมโมเดลขนาดใหญ่เหล่านี้อาจมีตั้งแต่หลายล้านถึงพันล้านดอลลาร์ แพงใช่มั้ยล่ะ! แต่ทำไมไม่ใช้รุ่นที่มีอยู่แล้วล่ะ?..

ความสัมพันธ์ของฉันกับ Google Bard

เราเพิ่งออกเดทกันจริงๆ แต่มันก็ผ่านไปได้ด้วยดี Google Bard คืออะไร ฉันจะให้เบิร์ดเล่าให้ฟัง… Google Bard เป็นโมเดลภาษาขนาดใหญ่หรือที่เรียกว่า AI การสนทนาหรือแชทบอต ที่สร้างโดย Google AI ได้รับการฝึกฝนเกี่ยวกับข้อมูลข้อความจำนวนมหาศาล และสามารถสื่อสารและสร้าง...