سرانجام شرکت OpenAI نسل تازهای از مدلهای زبانی خود را معرفی کرد. GPT-5 که به گفته این شرکت پیشرفتهترین مدل هوش مصنوعی آنهاست، از امروز بهعنوان مدل پیشفرض ChatGPT در دسترس قرار گرفته و کاربران رایگان هم میتوانند آن را تجربه کنند.
سم آلتمن، مدیرعامل OpenAI، در مراسم رونمایی، GPT-5 را یک جهش بزرگ نسبت به نسلهای قبلی دانست و تجربه کار با آن را مشابه لحظهای توصیف کرد که کاربران برای نخستینبار آیفون مجهز به نمایشگر رتینا را دیدند؛ بعد از آن دیگر تمایلی به بازگشت به مدلهای قدیمی نداشتند.
«احساس گفتوگو با یک دکترای متخصص»
آلتمن در توضیح پیشرفت مدلها گفت:
«GPT-3 مثل صحبت با یک دانشآموز دبیرستانی بود؛ ممکن بود جواب درست بدهد یا پاسخی عجیب تحویلتان دهد. GPT-4 شبیه یک دانشجوی دانشگاه بود. اما GPT-5 واقعاً حس گفتوگو با یک متخصص دکترا را منتقل میکند.»
این نسخه جدید هوشمندتر، سریعتر و کمتر دچار خطاهای رایج مدلهای قبلی است. یکی از تغییرات مهم، حذف انتخاب دستی مدلها در رابط ChatGPT است؛ اکنون سیستم بر اساس پیچیدگی سؤال یا دستور «think hard» بهطور خودکار از نسخه مناسب استفاده میکند.
دسترسی برای همه، با محدودیتهای استفاده
GPT-5 برای تمام کاربران ChatGPT فعال شده اما مانند همیشه، کاربران رایگان سقف استفاده مشخصی دارند. پس از رسیدن به این حد، سیستم به نسخه سادهتر Mini سوئیچ میکند. با خرید اشتراک، میتوان بدون محدودیت به نسخه کامل GPT-5 دسترسی داشت.
برای توسعهدهندگان نیز سه نسخه GPT-5، GPT-5 Mini و GPT-5 Nano ارائه میشود که هر کدام قیمت متفاوتی در API دارند. همچنین یک نسخه Pro با قابلیتهای بیشتر برای مشترکان طرح ماهانه ۲۰۰ دلاری در دسترس است. کاربران ChatGPT Plus هم نسبت به نسخه رایگان، مدتزمان بیشتری میتوانند از مدل اصلی استفاده کنند.
شخصیسازی بیشتر و استایلهای جدید پاسخدهی
OpenAI چهار حالت شخصیتی تازه به ChatGPT اضافه کرده: بدبین (Cynic)، رباتیک (Robot)، شنونده (Listener) و Nerd. کاربران همچنین امکان تغییر رنگ محیط گفتوگو را خواهند داشت تا تجربه کاربری شخصیتری داشته باشند.
پیشرفت بزرگ در کدنویسی
به گفته آلتمن، GPT-5 میتواند آغازگر عصر «نرمافزار بر حسب تقاضا» باشد. در آزمایشها، این مدل در بنچمارکهای SWE-Bench، SWE-Lancer و Aider Polyglot عملکردی بهتر از رقبا داشته است.
مایکل ترول، مدیرعامل شرکت Cursor، درباره تجربهاش گفت:
«GPT-5 باهوشترین مدلی است که تا به حال در کدنویسی استفاده کردهایم. اشکالات پیچیده را بهراحتی پیدا میکند، پروژههای چندمرحلهای را کامل اجرا میکند و حتی شخصیت منحصربهفردی دارد.»
در آزمون SWE-bench Verified، GPT-5 امتیاز ۷۴.۹٪ را بهدست آورد که بالاتر از Claude Opus 4.1 (۷۴.۵٪) و Gemini 2.5 Pro (۵۹.۶٪) است.
عملکرد در آزمونهای علمی
در تست Humanity’s Last Exam، نسخه Pro از GPT-5 توانست امتیاز ۴۲٪ را کسب کند که کمی پایینتر از Grok 4 Heavy (۴۴.۴٪) است. اما در آزمون GPQA Diamond که شامل سؤالات علمی در سطح دکتراست، امتیاز ۸۹.۴٪ را بهدست آورد و از رقبایی مثل Claude Opus 4.1 و Grok 4 Heavy پیشی گرفت.
امنیت و پاسخهای هوشمندانهتر
OpenAI بیش از ۵ هزار تست امنیتی روی GPT-5 انجام داده است. الکس بیوتل، مدیر تحقیقات ایمنی، میگوید تمرکز اصلی آنها کاهش «دروغگویی مدل» بوده و نرخ پاسخهای نادرست این نسخه نسبت به مدل o3 کاهش چشمگیری داشته است.
همچنین ویژگی جدیدی به نام Safe Completions معرفی شده که در شرایط مشکوک، پاسخهای بیخطر و کلی ارائه میدهد. این قابلیت در حوزه سلامت هم مفید است؛ بهطوری که در آزمون HealthBench Hard Hallucinations، میزان خطای GPT-5 تنها ۱.۶٪ بوده است.








