مدل هوش مصنوعی گوگل Gemini که مدتها در انتظارش بودیم، بالاخره آمد، اما آیا میتواند GPT-4 شرکت OpenAI را از سلطه بر هوش مصنوعی کنار بگذارد؟
موارد کلیدی
- مدلGemini، هوش مصنوعی گوگل دارای سه نوعِ Ultra، Pro و Nano است که بر روی وظایف و سطوح پیچیدگی مختلف تمرکز دارد.
- Gemini Ultra نتایج امیدوارکنندهای را در معیارهای کلیدی هوش مصنوعی نشان میدهد، اما تا دسامبر 2023، برای استفاده عمومی در دسترس نیست. گوگل میگوید باید در ژانویه 2024 در دسترس باشد.
- Gemini Pro در دسترس است و در حالیکه عملکرد بسیار خوبی دارد، در حال حاضر نتوانسته GPT-4 را از سلطنت کنار بکشد.
گوگل بهطور مداوم قول داده است که مدل هوش مصنوعی Gemini آن بهتر از GPT-4 OpenAI است، مدلی که ChatGPT Plus را تقویت میکند. اکنون که Google Gemini راهاندازی شده است، میتوانیم در نهایت آن را آزمایش کنیم و ببینیم Gemini چگونه با GPT-4 مقایسه میشود.
وقتی این شرکت Google Bard را در مارس 2023 راهاندازی کرد، دلایل زیادی برای هیجانزده شدن وجود داشت. در نهایت، انحصار ChatGPT OpenAI شکسته خواهد شد بنابراین ما شاهد رقابت شایستهای خواهیم بود.
اما Bard هرگز از آن غولهایی نبود که مردم به آن امید داشتند و GPT-4 همچنان پلتفرم چت ربات هوش مصنوعی، مولد غالب و محبوب است. اکنون Google Gemini اینجاست، اما آیا مدل هوش مصنوعی مورد انتظار بهتر از ChatGPT است یا نه؟
مدل هوش مصنوعی Google Gemini چیست؟
Gemini تواناترین مدل هوش مصنوعی مولد گوگل است که قادر به درک و عملکرد در قالبهای مختلف داده: از جمله متن، صدا، تصویر و ویدئو است. این تلاش گوگل برای ایجاد یک مدل هوش مصنوعی یکپارچه از قابلیتهای ترسیمی از توانمندترین فناوریهای هوش مصنوعی برخوردار است.
- Gemini Ultra: بزرگترین و تواناترین نوع طراحی شده برای انجام کارهای بسیار پیچیده.
- Gemini Pro: بهترین مدل برای مقیاسبندی و ارائه عملکرد بالا در طیف وسیعی از وظایف، اما نسبت به Ultra توانایی کمتری دارد.
- Gemini Nano: کارآمدترین مدل طراحی شده برای استقرار وظایف بر روی دستگاه است. بهعنوان مثال، توسعهدهندگان و برنامهنویسان میتوانند از Gemini Nano برای ساخت اپلیکیشنهای تلفن همراه یا سیستمهای یکپارچه استفاده کنند و هوش مصنوعی قدرتمند را وارد فضای موبایل کنند.
گوگل در وبلاگ رسمی خود، میگوید که Gemini Ultra در چندین معیار از پیشرفتهترین فناوریها بهتر عمل میکند. گوگل ادعا میکند که Gemini Ultra در چندین معیار کلیدی، GPT-4 پیشرو در صنعت را شکست میدهد.
گوگل میگوید Gemini Ultra با امتیاز بیسابقه ۹۰ درصدی در معیار دقیق MMLU، اولین مدلی است که در این آزمایش چند وجهی که ۵۷ سوژه را در بر میگیرد، از عملکرد سطح انسانی پیشی گرفته است.
Gemini Ultra همچنین میتواند کدهای پیچیده و با کیفیت بالا را در برخی از محبوبترین زبانهای برنامهنویسی جهان از جمله Go، JavaScript، Python، Java و ++C درک کند، توضیح دهد و تولید کند. روی کاغذ و به ظاهر، همه این نتایج عالی هستند. اما اینها همه آمار هستند و آمارها همیشه کل داستان را بیان نمیکنند. بنابراین، Gemini در دنیای واقعی چقدر خوب عمل میکند؟
نحوه استفاده از هوش مصنوعی Google Gemini
از بین سه نوع مدل Gemini AI، میتوانید از همین الان استفاده از Gemini Pro را شروع کنید. Gemini Pro در حال حاضر در چت ربات Bard Google در دسترس است. برای استفاده از Gemini Pro با Bard، به bard.google.com بروید و با حساب Google خود وارد شوید.
Gemini Pro در حال حاضر در ربات چت Bard Google در دسترس است. برای استفاده از Gemini Pro با Bard، به bard.google.com بروید و با حساب Google خود وارد شوید.
چگونه Gemini با GPT-3.5 و GPT-4 مقایسه میشود
هنگامی که هر مدل هوش مصنوعی جدیدی راه اندازی میشود، در برابر مدلهای هوش مصنوعی GPT OpenAI آزمایش میشود، که بهطور کلی بهعنوان مدلی پیشرفته پذیرفته شده است که سایر مدلها باید با آن رقابت کنند.
بنابراین، با استفاده از Bard و ChatGPT، توانایی Gemini را در ریاضیات، نوشتار خلاقانه، تولید کد و پردازش دقیق ورودیهای تصویر آزمایش کردیم. از سادهترین سوال ریاضی که به ذهنمان رسید شروع کردیم، از هر دو چتربات خواستیم تا حل کنند: 1-1x-1x-
ما دو بار سوال را تکرار کردیم، هر بار با پاسخهای اشتباه مواجه شدیم اما در تلاش سوم جواب درست را گرفتیم، ولی نمیتوانیم روی این مورد زیاد حساب کنیم.
ما مساله را روی ChatGPT GPT-3.5 اجرا کردیم. اولین آزمایش درست انجام شد.
برای آزمایش تواناییهای Gemini در تفسیر تصاویر، ما آن را به تفسیر برخی از الگوهای رفتاری محبوب واداشتیم. آن را رد کرد و گفت که نمیتواند تصاویر با عناصر موجود در آن را تفسیر کند. ChatGPT که GPT-4V را اجرا میکرد، خواست و توانست این کار را بدون نقص انجام دهد.
ما آزمایش دیگری انجام دادیم تا تصویری را تفسیر کنیم و در عین حال توانایی حل مسئله و کدگذاری را بسنجیم. ما به Bard که Gemini Pro را اجرا میکرد، یک اسکرینشات دادیم و از آن خواستیم کدهای HTML و CSS را تحلیل کند و بنویسد و اسکرینشات را تکرار کند.
این منبع اسکرین شات است:
در زیر تلاش Gemini Pro برای تفسیر و تکرار اسکرینشات با استفاده از HTML و CSS آمده است.
و در اینجا تلاش GPT-4 برای تکرار اسکرینشات است. نتیجه تعجب آور نیست، با توجه به اینکه GPT-4 از لحاظ تاریخی در کدنویسی قوی بوده است. ما قبلا استفاده از GPT-4 را برای ساختن یک برنامه وب از ابتدا نشان دادهایم.
ما از Gemini Pro خواستیم شعری در مورد تسلا (برند خودروهای الکتریکی) بسازد. این پیشرفتهای جزئی را نسبت به آزمایشهای قبلی که در گذشته انجام دادهایم نشان داد. نتیجه این است:
در این مرحله، ما فکر کردیم که مقایسه نتایج با GPT-3.5 به جای GPT-4 سوپرشارژ مناسبتر باشد. بنابراین، ما از ChatGPT که GPT-3.5 را اجرا میکند، درخواست کردیم تا شعری مشابه بسازد.
ممکن است این یک سلیقه شخصی باشد، اما برداشت Gemini Pro در این مورد بهتر بهنظر میرسد. اما ما به شما اجازه قضاوت میدهیم.
آیا Gemini بهتر از ChatGPT است؟
قبل از اینکه گوگل، Bard را راهاندازی کند، فکر میکردیم که این رقابتی با ChatGPT خواهد بود که نتیجه اینطور نبود. اکنون، Gemini اینجاست، و تا کنون بهنظر نمیرسد Gemini Pro مدلی باشد که به ChatGPT ضربه ناک اوت بزند.
گوگل میگوید Gemini Ultra بسیار بهتر خواهد بود. ما واقعاً امیدواریم که اینطور باشد و با ادعاهای مطرح شده در اعلامیه Gemini Ultra مطابقت داشته باشد یا از آن فراتر رود. اما تا زمانی که بهترین نسخه ابزار هوش مصنوعی مولد گوگل را نبینیم و آزمایش نکنیم، نمیدانیم که آیا این ابزار میتواند سایر رقبای مدل هوش مصنوعی را شکست دهد یا خیر. همانطور که مطرح میشود، تا کنون GPT-4 قهرمان بی چون و چرای مدل هوش مصنوعی باقی مانده است.