هفته گذشته، پیشرفتهترین مدل خود به نام Gemini 1.0 Ultra را معرفی کردیم و با Gemini Advanced گامی اساسی به سمت مفیدتر کردن محصولات گوگل برداشتیم. امروز، توسعهدهندگان و مشتریان ابری نیز میتوانند با API Gemini ما در AI Studio و Vertex AI با 1.0 Ultra شروع به ساختوساز کنند.
تیمهای ما با تمرکز بر امنیت به پیشرفت مرزهای مدلهای جدید ما ادامه میدهند. آنها پیشرفتهای سریعی داشتهاند. در واقع، ما آماده معرفی نسل بعدی هستیم: Gemini 1.5. این مدل در چندین بعد پیشرفت چشمگیری نشان میدهد و 1.5 Pro با استفاده از محاسبات کمتر به کیفیتی مشابه 1.0 Ultra دست مییابد.
این نسل جدید همچنین پیشرفتی در درک زمینه طولانی ارائه میکند. توانستهایم مقدار اطلاعاتی را که مدلهای ما میتوانند پردازش کنند تا حد زیادی افزایش دهیم – تا 1 میلیون توکن را به طور مداوم اجرا کنیم و به طولانیترین پنجره زمینه در بین هر مدل پایه مقیاس بزرگ برسیم.
پنجرههای زمینه طولانیتر به ما وعدههای ممکن را نشان میدهد. آنها توانمندیهای کاملاً جدیدی را فعال میکنند و به توسعهدهندگان کمک میکنند تا مدلها و برنامههای کاربردی بسیار مفیدتری بسازند. ما بسیار هیجانزدهایم که پیشنمایش محدودی از این ویژگی آزمایشی را به توسعهدهندگان و مشتریان سازمانی ارائه دهیم. Demis در زیر اطلاعات بیشتری در مورد قابلیتها، ایمنی و دردسترسبودن ارائه میکند.
معرفی Gemini 1.5
توسط Demis Hassabis، مدیرعامل Google DeepMind، به نمایندگی از تیم Gemini
این زمان هیجانانگیزی برای هوش مصنوعی است. پیشرفتهای جدید در این زمینه پتانسیل مفیدتر کردن هوش مصنوعی برای میلیاردها نفر در سالهای آینده را دارد. از زمان معرفی Gemini 1.0، ما در حال آزمایش، اصلاح و ارتقای قابلیتهای آن بودهایم.
امروز، مدل نسل بعدی خود را معرفی میکنیم: Gemini 1.5.
Gemini 1.5 عملکرد بسیار بهبودیافتهای را ارائه میدهد. این یک گام مهم در رویکرد ما است که بر اساس تحقیق و نوآوریهای مهندسی در تقریباً تمام بخشهای توسعه و زیرساخت مدل پایه ما ساخته شده است. این شامل کارآمدتر کردن آموزش و ارائه Gemini 1.5 با معماری Mixture-of-Experts (MoE) جدید است.
اولین مدل Gemini 1.5 که برای آزمایش اولیه منتشر میکنیم Gemini 1.5 Pro است. این یک مدل چندحالته متوسط است که برای مقیاسگذاری در طیف وسیعی از کارها بهینه شده است و عملکردی مشابه 1.0 Ultra، بزرگترین مدل ما تا به امروز، دارد. همچنین یک ویژگی آزمایشی پیشرفته در درک زمینه طولانی معرفی میکند.
Gemini 1.5 Pro با یک پنجره زمینه استاندارد ۱۲۸۰۰۰ تکهای عرضه میشود. اما از امروز، یک گروه محدود از توسعهدهندگان و مشتریان سازمانی میتوانند آن را با پنجره زمینه تا ۱ میلیون توکن از طریق AI Studio و Vertex AI در پیشنمایش خصوصی امتحان کنند.
همانطور که پنجره زمینه کامل ۱ میلیون تکهای را ارائه میکنیم، به طور فعال روی بهینهسازیها برای بهبود تأخیر، کاهش نیازهای محاسباتی و افزایش تجربه کاربری کار میکنیم. ما از اینکه مردم این قابلیت پیشرفته را امتحان کنند هیجانزده هستیم و جزئیات بیشتری در مورد دردسترسبودن آینده در زیر به اشتراک میگذاریم.
این پیشرفتهای مداوم در مدلهای نسل بعدی ما، فرصتهای جدیدی را برای افراد، توسعهدهندگان و شرکتها برای ایجاد، کشف و ساخت با استفاده از هوش مصنوعی باز خواهد کرد.
ویژگیهای کلیدی Gemini 1.5:
- عملکرد بسیار بهبودیافته: Gemini 1.5 در چندین بعد پیشرفت چشمگیری نشان میدهد و 1.5 Pro با استفاده از محاسبات کمتر به کیفیتی مشابه 1.0 Ultra دست مییابد.
- درک زمینه طولانی: این نسل جدید همچنین پیشرفتی در درک زمینه طولانی ارائه میکند. توانستهایم مقدار اطلاعاتی را که مدلهای ما میتوانند پردازش کنند تا حد زیادی افزایش دهیم – تا 1 میلیون توکن را به طور مداوم اجرا کنیم و به طولانیترین پنجره زمینه در بین هر مدل پایه مقیاس بزرگ برسیم.
- معماری کارآمد: Gemini 1.5 بر اساس تحقیقات پیشرو ما در مورد معماری Transformer و MoE ساخته شده است. مدلهای MoE به طور قابلتوجهی کارآمدتر از مدلهای Transformer سنتی هستند، زیرا فقط بخشهای مرتبط شبکه عصبی را برای هر ورودی فعال میکنند.
قابلیتهای جدید Gemini 1.5 Pro:
- تجزیهوتحلیل و طبقهبندی محتوای حجیم: 1.5 Pro میتواند به طور یکپارچه حجم عظیمی از محتوا را در یک درخواست معین تجزیهوتحلیل، طبقهبندی و خلاصه کند. بهعنوانمثال، میتواند 402 صفحه متن رونویسی شده از ماموریت آپولو ۱۱ به ماه را پردازش کند و درباره مکالمات، رویدادها و جزئیات موجود در سراسر سند استدلال کند.
- درک و استدلال بهتر در میان مدالیتیها: 1.5 Pro میتواند وظایف درک و استدلال بسیار پیچیدهای را برای مدالیتیهای مختلف، از جمله ویدئو، انجام دهد. بهعنوانمثال، میتواند یک فیلم ۴۴ دقیقهای صامت از Buster Keaton را به طور دقیق تجزیهوتحلیل کند و حتی درباره جزئیات کوچک فیلم که بهراحتی میتوان از آنها غافل شد، استدلال کند.
- حل مسئله مرتبط با بلوکهای طولانیتر کد: 1.5 Pro میتواند وظایف حل مسئله مرتبطتر را در بلوکهای طولانیتر کد انجام دهد. با ارائه یک درخواست با بیش از ۱۰۰۰۰۰ خط کد، میتواند به طور بهتری در میان مثالها استدلال کند، اصلاحات مفید