ChatGPT حالا می‌تواند با مدل GPT-4o تصاویر بهتری تولید کند

ChatGPT اکنون می‌تواند با مدل GPT-4o تصاویر بهتری تشکیل کند_دانستنی

مارس 26, 2025مارس 26, 2025 مریم ملکی ChatGpt,OpenAI

[ad_1]
نوشته و ویرایش شده توسط مجله ی دانستنی

OpenAI ویژگی جدیدی را با نام «Images in ChatGPT» به چت‌بات خود اضافه کرده است که از GPT-4o برای تشکیل عکس در داخل این چت‌بات منفعت گیری می‌کند. این قابلیت دقت رنگ‌های تصاویر و رندر متن در تصاویر را تا حد قابل‌ توجهی بهبود می‌دهد.

به‌حرف های «تارا کریستینسن»، سخنگوی OpenAI ویژگی تازه از امروز در دسترس همه کاربران قرار می‌گیرد. او افزود کاربران نسخه عادی ChatGPT باوجود برخی محدودیت‌ها، از لحاظ تعداد تصاویر درخواستی محدودیتی ندارند. یقیناً امکان پذیر این محدودیت‌ها نیز به مرور زمان بر پایه تقاضا یا استقبال کاربران تحول کند.

قابلیت تازه ChatGPT تصاویر را یکپارچه‌تر می‌کند

«گابریل گو»، مدیر تیم تحقیقاتی OpenAI در او مباحثه با Verge از نتایج مثبت این ویژگی او گفت. او اشاره کرد که از مدل «GPT-4o omnimodal» برای پردازش و گسترش این قابلیت منفعت گیری شده است؛ مدلی که توانایی پردازش انواع گوناگون داده‌‌ها را دارد.

او این چنین از بهبود قابل دقت ویژگی «Binding» در ساخت تصاویر او گفت: «مدل‌های قدیمی زیاد تر در نگه داری انسجام تصاویر مشکل داشتند، مخصوصاً وقتی که عناصر بیشتری را به عکس‌ها اضافه می‌کردیم.» برای مثالً ممکن می بود مدل هوش مصنوعی به‌جای ساخت یک ستاره آبی و یک مثلث قرمز، یک ستاره قرمز و یک مثلث آبی بسازد.

[elementor-template id="2666"]

اما اکنون این مشکل در ChatGPT از بین بردن شده و مدل تازه می‌تواند بین ۱۵ تا ۲۰ عنصر را به درستی در عکس قرار دهد. این درحالی است که مدل‌های قدیمی فقط می‌توانستند 5 تا 8 عنصر را بدون نادرست تشکیل کنند.

عکس ساخته‌شده با Images in ChatGPT

گابریل گو افزود ویژگی بالا از رویکرد «Autoregressive» منفعت گیری می‌کند؛ یعنی ChatGPT همانند نوشتن متون تصاویر را تدریجاً از بالا به پایین و از چپ به راست می‌سازد. درحالی‌که مدل‌های قبلی همانند DALL·E بر پایه روش Diffusion model کل عکس را همزمان پردازش و طراحی می‌کردند. همین نوشته به گمان زیادً علتشده تا یکپارچگی تصاویر بهبود یابد.

مدیر تیم تحقیقاتی OpenAI قابلیت تازه ChatGPT را حاصل تست‌های متعدد و بعضاً تکراری تیمش در ماه‌های تازه می‌داند. یقیناً او اظهار داشت این ویژگی تا این مدت در پردازش متون ریز و کوچک در تصاویر مشکل دارد، اما در کل کیفیت متن و تصاویر را به‌طور همزمان نگه داری می‌کند.

دسته بندی مطالب

[ad_2]