پرش به محتوا
خانه » بلاگ » GPT4 چیست و چه فرقی با نسخه های قبلی خود دارد؟

GPT4 چیست و چه فرقی با نسخه های قبلی خود دارد؟

OpenAI به تازگی GPT4، مدل جدید زبان ChatGPT را پیاده سازی کرده است. این نسخه نسبت GPT3.5 و 3 GPT  در پاسخ‌های دقیق‌تر  است البته باید گفت که مدل جدید Chatbot را از طریق ChatGPT Plus باید با هزینه 20 دلار در ماه تهیه کرد.  اما برخلاف راه‌اندازی ChatGPT در نوامبر گذشته، GPT-4 فقط یک برنامه وب نیست که هر کسی می‌تواند به صورت رایگان آن را امتحان کند. بنابراین GPT4 چیست و چگونه از آن استفاده می کنید؟ ما همه چیز را به شما می گوییم.

🤔 GPT4 چیست؟

OpenAI از سال 2018 مدل‌های زبان GPT را توسعه و منتشر می‌کند. GPT-3، نسخه سوم، پیشرفته‌ترین مدل زمانی بود که ChatGPT، چت بات معروف، در پایان سال 2022 منتشر شد. بنابراین GPT 4 مدل جدید زبان بزرگ است. برای OpenAI. ‘OpenAI. اما در حال حاضر، اگر فقط به ChatGPT دسترسی آزاد داشته باشید، همچنان با GPT-3 (به طور دقیق GPT-3.5) تعامل خواهید داشت.

OpenAI در پست وبلاگ خود که GPT-4 را اعلام کرد، نوشت که GPT4 قابل اعتمادتر، خلاقانه تر و قادر به مدیریت دستورالعمل های بسیار ظریف تر از GPT-3.5 است. این می تواند حداکثر 25000 کلمه متن را بخواند، تجزیه و تحلیل یا تولید کند که نسبت به نسخه های قبلی پیشرفت قابل توجهی دارد.

در مقایسه با GPT 3، GPT 4 قادر است تصاویر، متون پیچیده و غیره را خلاصه و نظر دهد. او حتی بر اساس گزارش‌ها موفق به قبولی در یک آزمون وکالت در ایالات متحده و چندین آزمون استاندارد شده است، اگرچه هنوز از کامل بودن و کاملاً منصفانه فاصله دارد.

👉 چگونه از GPT-4 با ChatGPT استفاده کنیم؟

اگر می‌خواهید متن بیشتر و بهتر با GPT 4 تولید کنید، به اشتراک پولی ChatGPT Plus، نسخه پولی ChatGPT نیاز دارید. در اینجا نحوه دریافت آن و استفاده از GPT 4 آمده است:

به chat.openai.com بروید.
یک حساب OpenAI ایجاد کنید یا به حساب خود وارد شوید.
در سمت چپ، Upgrade to Plus را انتخاب کنید.
برنامه ارتقا را انتخاب کنید.
مشخصات بانکی خود را وارد کنید و برای اشتراک پرداخت کنید.البته برای کاربران ایرانی که حساب های کارت بین المللی را ندارند نمی توانند مستقیم این کار را انجام دهند.

GPT4 چیست

مزیا چت GPT4

هنگامی که مشتری هستید، دسترسی شما به ChatGPT در GPT-4 فوری خواهد بود. لیست انتظار برای شما وجود ندارد.
هنگام شروع یک چت جدید، یک منوی کشویی به شما این امکان را می دهد که از یکی از مدل های قدیمی یا GPT-4 استفاده کنید. شما باید به هشدار OpenAI توجه کنید که GPT-4 به اندازه سایرین سریع نیست، زیرا تفاوت سرعت قابل توجه است.

به عنوان یادآوری، ChatGPT Plus ماهانه 24 دلار (با احتساب مالیات بر ارزش افزوده) یا حدود 22 یورو هزینه دارد.

اگر قبلاً از ChatGPT استفاده می کنید، ممکن است از شما خواسته شود که به GPT-4 ارتقا دهید. اگر این کار را انجام دهید، یک نوار متنی در وسط چت موجود شما اضافه می‌شود که می‌گوید «الگوی قبلی استفاده شده در این چت در دسترس نیست. ما شما را به آخرین الگوی پیش فرض تغییر داده ایم.”

جلسات چت GPT-3 لوگوی سبز قدیمی OpenAI را در سمت چپ خود نشان می دهد، در حالی که جلسات پشتیبانی شده از GPT-4 دارای یک لوگوی سیاه رنگ جدید است.

🧐 آیا می توان از GPT-4 به صورت رایگان استفاده کرد؟

خیر، در حال حاضر نمی توانید با نسخه رایگان ChatGPT به GPT-4 دسترسی پیدا کنید. با این حال، میلیون‌ها کاربر بینگ می‌توانند در حال حاضر به چت ربات جدید در مرورگر دسترسی داشته باشند. اگر در این گروه انتخابی هستید، مایکروسافت تأیید کرده است که GPT-4 در حال حاضر تعاملات شما را با ChatGPT در Bing تقویت می کند.

به زودی ممکن است چاره ای جز استفاده از GPT-4 در زندگی روزمره خود نداشته باشید، زیرا طبق پست وبلاگ OpenAI در مورد کاربردهای آن، GPT-4 در حال حاضر توسط برخی از مشتریان استفاده می شود (Khan Academy، Stripe، Morgan Stanley، دولت ایسلند و غیره). به عبارت دیگر، احتمال زیادی وجود دارد که به زودی با GPT-4 تعامل داشته باشید، پس صبور باشید.

قابلیت های چندوجهی GPT-4

این یکی از سوالات بزرگ در مورد GPT-4 بود. آیا مدل جدید OpenAI قادر به تفسیر یا تولید قالبی غیر از متن خواهد بود؟

 GPT-4 قادر است یک دستور متشکل از یک متن و یک تصویر را ادغام کند. از سوی دیگر، نتایج ارائه شده توسط GPT-4 به فرمت متن محدود خواهد شد. شایعات اخیر که توسط یکی از مدیران مایکروسافت منتشر شده است، امید به احتمالات دیگر مربوط به تولید ویدیو را افزایش داد. اما ترکیب تصویر و متن از قبل یک تازگی چشمگیر است…

اندازه مدل: GPT-4 باید کوچکتر از GPT-3 باشد

بر خلاف تصور عمومی، GPT-4 بزرگترین مدل زبان نخواهد بود. نباید بزرگتر از GPT-3 باشد. این مدل مطمئناً بزرگتر از نسل های قبلی شبکه های عصبی خواهد بود، اما اندازه مشخصه آن نخواهد بود. احتمالاً جایی بین GPT-3 و Gopher (بین 175 تا 280 میلیارد پارامتر) خواهد بود. به گفته آلتمن، مدل بزرگتر همیشه به معنای مدل توانمندتر نیست. وجود مدل های کوچکتر که بهتر هستند دو مفهوم دارد.

اولاً، شرکت‌ها متوجه شده‌اند که استفاده از اندازه مدل به عنوان یک پروکسی برای بهبود عملکرد، تنها یا بهترین راه برای انجام این کار نیست. در سال 2020، جارد کاپلان از OpenAI و همکارانش به این نتیجه رسیدند که وقتی افزایش بودجه محاسباتی به دنبال یک رابطه قدرت-قانون اختصاص داده شود، عملکرد بیشترین بهبود را دارد. گوگل، انویدیا، مایکروسافت، OpenAI، DeepMind و سایر شرکت‌هایی که مدل‌های زبانی را توسعه می‌دهند، این دستورالعمل‌ها را به‌عنوان ارزش واقعی در نظر گرفته‌اند.

اما MT-NLG (مگاترون تورینگ NLG، شبکه عصبی ساخته شده توسط انویدیا و مایکروسافت در سال گذشته با 530 میلیارد پارامتر)، به همان اندازه که بزرگ است، از نظر عملکرد بهترین نیست. در واقع، در هیچ رده معیاری بهترین رتبه بندی نشده است. مدل های کوچکتر مانند Gopher یا Chinchilla (70 میلیارد پارامتر) – که به سختی کسری از اندازه آن هستند – در همه کارها بسیار بهتر از MT-NLG خواهند بود. بنابراین، مشخص شد که اندازه مدل تنها عاملی نیست که منجر به درک بهتر زبان می شود.

که منجر به دلالت دوم می شود. طبق گزارش‌ها، شرکت‌ها شروع به رد دگم کرده‌اند: بزرگتر بهتر است. داشتن پارامترهای بیشتر تنها یکی از عواملی است که می تواند عملکرد را بهبود بخشد. و آسیب جانبی (به عنوان مثال رد پای کربن، هزینه های محاسباتی یا موانع ورود) آن را به یکی از بدترین عواملی تبدیل می کند که باید در نظر گرفته شود، علیرغم اجرای بسیار ساده. شرکت‌ها قبل از ساختن یک مدل غول‌پیکر دو بار فکر می‌کنند که می‌توانند با مدل کوچک‌تر به نتایج مشابه یا حتی بهتری دست یابند.

بهینه بودن: OpenAI می خواهد بیشترین بهره را از GPT-4 داشته باشد

به گفته آلتمن، مدل‌های زبانی از محدودیت‌های اساسی در بهینه‌سازی رنج می‌برند. آموزش آنقدر گران است که شرکت ها باید بین دقت و هزینه سازش کنند. این اغلب منجر به بهینه سازی کامل مدل ها می شود. مدیر عامل گزارش داد که GPT-3 تنها یک بار آموزش داده شد، علیرغم برخی خطاها که در موارد دیگر منجر به آموزش مجدد می شد. به همین دلیل، گزارش شده است که OpenAI به دلیل هزینه غیرقابل مقرون به صرفه بودن، تصمیم به مخالفت با آن گرفت و محققان را از یافتن بهترین مجموعه هایپرپارامترها برای مدل باز داشت.

پیامد دیگر هزینه های آموزشی بالا این است که تحلیل رفتار مدل محدود می شود. بر اساس گزارشی، وقتی محققان هوش مصنوعی به این نتیجه رسیدند که اندازه مدل مرتبط‌ترین متغیر برای بهبود عملکرد است، تعداد نشانه‌های آموزشی را در نظر نگرفتند، یعنی مقدار داده‌های ارائه شده به مدل‌ها را در نظر نگرفتند. این امر به مقادیر خارق‌العاده‌ای از منابع محاسباتی نیاز داشت. طبق گزارش‌ها، شرکت‌های فناوری یافته‌های محققان را دنبال کردند، زیرا بهترین چیزی بود که آنها داشتند.

اما تحلیلگران می‌گویند گوگل، مایکروسافت، فیس‌بوک و دیگران میلیون‌ها دلار را برای مدل‌های بزرگ‌تر و بزرگ‌تر «هدر داده‌اند» – بنابراین مقادیر زیادی آلودگی ایجاد می‌کنند – دقیقاً ناشی از محدودیت‌های اقتصادی. امروزه، شرکت‌ها با پیشروی DeepMind و OpenAI، رویکردهای دیگری را بررسی خواهند کرد. آنها سعی می کنند مدل های بهینه را به جای مدل های بزرگتر بیابند.

مدل های زبان بزرگ چندوجهی

نکته مهم این اعلامیه این است که GPT-4 چند وجهی است (SEJ پیش بینی کرد GPT-4 در ژانویه 2023 چند وجهی است).

Modality اشاره ای به نوع ورودی است که (در این مورد) یک مدل زبان بزرگ به آن می پردازد.

چند وجهی می تواند متن، گفتار، تصاویر و ویدئو را در بر گیرد. GPT-3 و GPT-3.5 فقط در یک حالت، متن کار می کنند. بر اساس گزارش خبری آلمان، GPT-4 ممکن است حداقل در چهار حالت، تصویر، صدا (شنیداری)، متن و ویدئو کار کند.

به نقل از دکتر آندریاس براون، مدیر ارشد فناوری مایکروسافت آلمان:

“ما این هفته GPT-4 را معرفی کردیم، در آنجا مدل های چندوجهی خواهیم داشت که امکانات کاملا متفاوتی را ارائه می دهند – به عنوان مثال ویدئوها…”

در این این گزارش به اشتراک گذاشته شده مشخص است:

 که هوش مصنوعی چندوجهی در مورد چیست، که می تواند متن را نه تنها به عکس، بلکه به موسیقی و ویدئو نیز ترجمه کند.

واقعیت جالب دیگر این است که مایکروسافت در حال کار بر روی “معیارهای اطمینان” تا هوش مصنوعی خود را با حقایق ثابت کنند تا قابل اعتمادتر شود.

مایکروسافت Kosmos-1

چیزی که ظاهراً در ایالات متحده کمتر گزارش شده است این است که مایکروسافت یک مدل زبان چندوجهی به نام Kosmos-1 را در ابتدای مارس 2023 منتشر کرد.

به گزارش پایگاه خبری آلمان Heise.de:

این تیم مدل از پیش آموزش‌دیده‌شده را تحت آزمایش‌های مختلفی قرار داد، با نتایج خوبی در طبقه‌بندی تصاویر، پاسخ‌گویی به سؤالات در مورد محتوای تصویر، برچسب‌گذاری خودکار تصاویر، تشخیص متن نوری و وظایف تولید گفتار.

… استدلال بصری، یعنی نتیجه گیری در مورد تصاویر بدون استفاده از زبان به عنوان یک مرحله میانی،

Kosmos-1 یک مدال چندوجهی است که حالت‌های متن و تصاویر را ادغام می‌کند.

GPT-4 فراتر از Kosmos-1 است زیرا حالت سومی را اضافه می کند، ویدیو، و همچنین به نظر می رسد که مدالیته صدا را نیز شامل می شود.

GPT4 در چندین زبان کار می کند

GPT-4 در همه زبان ها کار می کند. توضیح داده شده است که می توانید یک سؤال را به زبان فارسی دریافت کنید و به زبان انگلیسی پاسخ دهید.

ما معتقدیم که نقطه پیشرفت این است که این مدل با توانایی خود در انتقال دانش به زبان های مختلف از زبان فراتر می رود. بنابراین اگر پاسخ به زبان  انگلیسی باشد، آن را می داند و می تواند پاسخ را به زبانی که سوال پرسیده شده است ارائه دهد.

این امر آن را شبیه به هدف هوش مصنوعی چندوجهی گوگل به نام MUM می کند. گفته می‌شود که می‌تواند پاسخ‌هایی را به زبان انگلیسی ارائه کند که داده‌ها فقط به زبان دیگری مانند ژاپنی وجود دارد.

برنامه های کاربردی GPT-4

گوگل در تلاش است تا با ادغام یک فناوری رقیب در موتور جستجوی خود به مایکروسافت برسد. این پیشرفت این تصور را تشدید می کند که گوگل در حال عقب ماندن و عدم رهبری در زمینه هوش مصنوعی  است.

گوگل در حال حاضر هوش مصنوعی را در چندین محصول مانند Google Lens، Google Maps و سایر مناطقی که کاربران با Google در تعامل هستند، ادغام کرده است. این رویکرد استفاده از هوش مصنوعی به عنوان یک فناوری کمکی برای کمک به افراد در کارهای کوچک است.

روشی که مایکروسافت آن را پیاده‌سازی می‌کند بیشتر قابل مشاهده است و در نتیجه تمام توجه را به خود جلب می‌کند و تصویری از گوگل را تقویت می‌کند که در حال شکست و تلاش برای رسیدن به عقب است.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

حسین میخک

حسین میخک