- โมเดลใหม่ครองอันดับ 1 ใน Hugging Face Leaderboard ของโมเดลภาษาขนาดใหญ่แบบโอเพ่นซอร์ส
- โมเดลที่มีพารามิเตอร์ 180 พันล้านได้รับการฝึกฝนบนชุดข้อมูล 3.5 ล้านล้านโทเค็น พร้อมทรัพยากรการประมวลผลของ LLaMA 2 ของ Meta ถึง 4 เท่า
- Falcon 180B เป็นโมเดลที่เข้าถึงได้แบบโอเพ่นซอร์สสำหรับนักวิจัยและผู้ใช้เชิงพาณิชย์
อาบูดาบี สหรัฐอาหรับเอมิเรตส์–(BUSINESS WIRE )–6 กันยายน 2023
Technology Innovation Institute (TII) ในสหรัฐอาหรับเอมิเรตส์ (UAE) กำลังก้าวข้ามขีดจำกัดของ Generative AI อีกครั้งด้วยการเปิดตัว Falcon 180B ซึ่งเป็นโมเดลภาษาขนาดใหญ่ (LLM) ขั้นสูงที่เป็นรุ่นเรือธงของพวกเขา การเปิดตัวที่ล้ำสมัยนี้ช่วยเสริมความเป็นผู้นำของสหรัฐอาหรับเอมิเรตส์ (UAE) ในด้าน AI โดยนำเสนอ Falcon 180B ให้เป็นโมเดลการเข้าถึงแบบโอเพ่นซอร์สสำหรับการวิจัยและการใช้เชิงพาณิชย์
เกณฑ์มาตรฐาน Falcon 180B (รูปภาพ: AETOSWire)
หลังจากความสำเร็จอันน่าทึ่งของ Falcon 40B ซึ่งเป็นโมเดล AI แบบโอเพ่นซอร์สที่ทะยานขึ้นสู่อันดับสูงสุดใน Hugging Face Leaderboard ของโมเดลภาษาขนาดใหญ่เมื่อเดือนพฤษภาคม 2023 TII ซึ่งเป็นเสาหลักการวิจัยประยุกต์ของ Advanced Technology Research Council (ATRC) ของอาบูดาบียังคงเป็นผู้นำในการพัฒนา Generative AI Falcon 40B ถือเป็นตัวอย่างแรกๆ ของโมเดลโอเพ่นซอร์สสำหรับทั้งนักวิจัยและผู้ใช้เชิงพาณิชย์ และถือเป็นการก้าวกระโดดของการบุกเบิกในสาขานี้
H.E. Faisal Al Bannai เลขาธิการของ Advanced Technology Research Council เน้นย้ำถึงผลกระทบเชิงบวกของ Falcon ที่มีต่อภูมิทัศน์ของ AI และกล่าวว่า "เรามองเห็นอนาคตที่พลังการเปลี่ยนแปลงของ AI อยู่ไม่ไกลเกินเอื้อมของทุกคน เรามุ่งมั่นที่จะส่งเสริมการเข้าถึง AI ขั้นสูงให้เป็นประชาธิปไตยมากขึ้น เนื่องจากความเป็นส่วนตัวและผลกระทบที่อาจเกิดขึ้นของ AI ต่อมนุษยชาติไม่ควรถูกควบคุมโดยคนเพียงไม่กี่คน แม้ว่าเราอาจไม่มีคำตอบทั้งหมด แต่ความมุ่งมั่นของเรายังคงแน่วแน่ นั่นคือการทำงานร่วมกันและมีส่วนร่วมในชุมชนโอเพ่นซอร์ส เพื่อให้มั่นใจว่าทุกคนจะได้แบ่งปันประโยชน์ของ AI"
ด้วยพารามิเตอร์ที่น่าทึ่งถึง 180 พันล้านพารามิเตอร์และฝึกฝนบนชุดข้อมูล 3.5 ล้านล้านโทเค็น Falcon 180B ทะยานขึ้นสู่อันดับสูงสุดของ Hugging Face Leaderboard ของโมเดลภาษาขนาดใหญ่ที่ผ่านการฝึกฝนมาแล้ว โมเดลนี้มีประสิทธิภาพเหนือกว่าคู่แข่งที่มีชื่อเสียงอย่าง LLaMA 2 ของ Meta ในเกณฑ์มาตรฐานต่างๆ รวมถึงการทดสอบการใช้เหตุผล การเขียนโค้ด ความชำนาญ และการทดสอบความรู้
ในบรรดาโมเดลภาษาขนาดใหญ่แบบปิดที่ดีที่สุด Falcon 180B อยู่ในอันดับที่ตามหลัง GPT 4 ล่าสุดของ OpenAI และทัดเทียมกับประสิทธิภาพของ PaLM 2 Large ของ Google ซึ่งเป็นโมเดลที่ขับเคลื่อน Bard แม้ว่าจะมีขนาดเพียงครึ่งหนึ่งของโมเดลก็ตาม กรอบการอนุญาตใช้งานสำหรับโมเดลนี้กำหนดขึ้นโดยใช้ "Falcon 180B TII License" ซึ่งอิงตาม Apache 2.0
Dr. Ebtesam Almazrouei กรรมการบริหารและรักษาการหัวหน้านักวิจัยของ AI Cross-Center Unit ของ TII กล่าวว่า "การเปิดตัว Falcon 180B เป็นตัวอย่างของการอุทิศตนของเราในการพัฒนาขอบเขตของ AI และเรารู้สึกตื่นเต้นที่ได้แบ่งปันศักยภาพอันไร้ขีดจำกัดของมันกับโลก Falcon 180B ประกาศศักราชใหม่ของ Generative AI โดยสร้างศักยภาพของความก้าวหน้าทางวิทยาศาสตร์ผ่านการเข้าถึงแบบโอเพ่นซอร์สเพื่อเป็นแรงขับเคลื่อนนวัตกรรมแห่งอนาคต ขณะที่เราเจาะลึกขอบเขตของวิทยาศาสตร์และเทคโนโลยี วิสัยทัศน์ของเราขยายไปไกลกว่านวัตกรรม นั่นคือการรักษาความสัมพันธ์อันลึกซึ้งเพื่อรับมือกับความท้าทายระดับโลกผ่านความก้าวหน้าทางการทำงานร่วมกัน"
ด้วยนักพัฒนามากกว่า 12 ล้านคนที่ยอมรับและปรับใช้ Falcon รุ่นแรก การอัปเกรดครั้งสำคัญนี้จึงพร้อมที่จะกลายเป็นโมเดลชั้นนำสำหรับโดเมนต่างๆ ตั้งแต่แชทบอทไปจนถึงการสร้างโค้ด และอื่นๆ อีกมากมาย
Falcon 180B เข้ากันได้กับภาษาหลักต่อไปนี้: อังกฤษ เยอรมัน สเปน และฝรั่งเศส โดยมีความสามารถจำกัดในภาษาอิตาลี โปรตุเกส โปแลนด์ ดัตช์ โรมาเนีย เช็ก และสวีเดน
สำหรับข้อมูลเพิ่มเติม โปรดไปที่ FalconLLM.tii.ae
ที่มา: AETOSWire
เนื้อหาใจความในภาษาต้นฉบับของข่าวประชาสัมพันธ์ฉบับนี้เป็นฉบับที่เชื่อถือได้และเป็นทางการ การแปลต้นฉบับนี้จึงมีจุดประสงค์เพื่ออำนวยความสะดวกเท่านั้น และควรนำไปเทียบเคียงอ้างอิงกับเนื้อหาในภาษาต้นฉบับ ซึ่งเป็นฉบับเดียวที่มีผลทางกฎหมาย
สามารถรบั ชมภาพในรูปแบบมลัติมีเดียได้ที่: https://www.businesswire.com/news/home/20230906583274/en
รายชื่อผู้ติดต่อ
Jennifer Dewan ผู้อำนวยการอาวุโสฝ่ายสื่อสาร
jennifer.dewan@tii.ae
ที่มา: The Technology Innovation Institute
You must be logged in to post a comment.