Google DeepMind ประกาศเปิดตัวโมเดลปัญญาประดิษฐ์ (Large-Language Model : LLM) Gemini 1.0 อย่างเป็นทางการ มาพร้อมกันถึง 3 รุ่นย่อย รุ่นใหญ่สุด Ultra ชนะคู่แข่ง GPT-4 เกือบทุกด้าน
Gemini เป็นโมเดล AI ใหม่ “ที่ใหญ่ที่สุดและมีความสามารถมากที่สุด” สามารถสรุปและทำความเข้าใจข้อมูลประเภทต่าง ๆ ทั้งข้อความ รูปภาพ เสียง วิดีโอ และโค้ดได้ในเวลาเดียวกัน ช่วยให้แยกวิเคราะห์ความแตกต่างได้ดีขึ้น และตอบคำถามที่เกี่ยวข้องกับหัวข้อที่ซับซ้อนได้ดีขึ้นด้วย..
Gemini 1.0 เป็นโมเดลภาษาขนาดใหญ่แบบ Multimodel ที่สามารถรับอินพุตข้อมูลประเภทต่าง ๆ ที่หลากหลายเช่น ข้อความ, โค้ด, เสียง, รูปภาพ และวิดีโอ
โดยทาง Google DeepMind ได้บอกว่า Gemini 1.0 เป็นโมเดล AI ที่มีขนาดใหญ่ที่สุด, เพรียบพร้อมไปด้วยความสามารถรอบด้าน และสามารถรันโมเดล Gemini 1.0 บน Data Center ขนาดใหญ่จนไปถึงอุปกรณ์สมาร์ทโฟนได้ด้วย
โดย Gemini 1.0 มาด้วยกัน 3 ขนาดคือ
1.Gemini Ultra — โมเดลที่ใหญ่ที่สุดและมีความสามารถมากที่สุดสำหรับงานที่มีความซับซ้อนสูง
2.Gemini Pro — โมเดลกลางสำหรับงานที่หลากหลาย
3.Gemini Nano — โมเดลเล็กจัดการได้ดีสำหรับงานบนอุปกรณ์พกพา
โมเดล Gemini 1.0 ก็มีการทดสอบมาตรฐานวิชาการด้านต่าง ๆ ที่ใช้วัดความสามารถการของโมเดลภาษาขนาดใหญ่ทั้งหมด 32 รายการ โดย Gemini Ultra ก็สามารถผ่านการทดสอบไปได้ 30 รายการด้วยคะแนน 90.0% ซึ่งการทดสอบนั้นครอบคลุมทั้ง ชุดคำถามรอบด้าน MMLU, GSM8K คณิตศาสตร์, HumanEval โค้ด Python และอื่น ๆ
Google ก็ได้บอกว่าโมเดล Gemini 1.0 ตัวนี้ถูกเทรนด์ AI โดยใช้ชิป Tensor Processing Units (TPU) v4 และ v5e ที่มีการออกแบบเองใน In-house
ตอนนี้โมเดล Gemini 1.0 ก็พร้อมใช้งานแล้วในผลิตภัณฑ์แรกของ Google ก็คือ Google Bard ดึงความสามารถต่าง ๆ ของ Gemini Pro รองรับภาษาอังกฤษก่อนในช่วงแรก 170 ประเทศทั่วโลก และจะมีการอัปเดตรองรับภาษาอื่น ๆ ในอนาคต
นอกจากนี้ปีหน้า 2024 Google Bard จะมาพร้อมกับตัวเลือกใหม่ Bard Advance ที่จะดึงความสามารถ Genimi Ultra โดยจะมีการเปิดให้เข้าทดสอบภายในต้นปี 2024
—
ขอบคุณhttps://www.beartai.com/news/itnews/1338511
https://www.google.com/..9%80%E0%B8%9B%E0%…