ChatGPT اکنون میتواند با مدل GPT-4o تصاویر بهتری تشکیل کند_دانستنی
نوشته و ویرایش شده توسط مجله ی دانستنی
OpenAI ویژگی جدیدی را با نام «Images in ChatGPT» به چتبات خود اضافه کرده است که از GPT-4o برای تشکیل عکس در داخل این چتبات منفعت گیری میکند. این قابلیت دقت رنگهای تصاویر و رندر متن در تصاویر را تا حد قابل توجهی بهبود میدهد.
بهحرف های «تارا کریستینسن»، سخنگوی OpenAI ویژگی تازه از امروز در دسترس همه کاربران قرار میگیرد. او افزود کاربران نسخه عادی ChatGPT باوجود برخی محدودیتها، از لحاظ تعداد تصاویر درخواستی محدودیتی ندارند. یقیناً امکان پذیر این محدودیتها نیز به مرور زمان بر پایه تقاضا یا استقبال کاربران تحول کند.
قابلیت تازه ChatGPT تصاویر را یکپارچهتر میکند
«گابریل گو»، مدیر تیم تحقیقاتی OpenAI در او مباحثه با Verge از نتایج مثبت این ویژگی او گفت. او اشاره کرد که از مدل «GPT-4o omnimodal» برای پردازش و گسترش این قابلیت منفعت گیری شده است؛ مدلی که توانایی پردازش انواع گوناگون دادهها را دارد.
او این چنین از بهبود قابل دقت ویژگی «Binding» در ساخت تصاویر او گفت: «مدلهای قدیمی زیاد تر در نگه داری انسجام تصاویر مشکل داشتند، مخصوصاً وقتی که عناصر بیشتری را به عکسها اضافه میکردیم.» برای مثالً ممکن می بود مدل هوش مصنوعی بهجای ساخت یک ستاره آبی و یک مثلث قرمز، یک ستاره قرمز و یک مثلث آبی بسازد.
اما اکنون این مشکل در ChatGPT از بین بردن شده و مدل تازه میتواند بین ۱۵ تا ۲۰ عنصر را به درستی در عکس قرار دهد. این درحالی است که مدلهای قدیمی فقط میتوانستند ۵ تا ۸ عنصر را بدون نادرست تشکیل کنند.
گابریل گو افزود ویژگی بالا از رویکرد «Autoregressive» منفعت گیری میکند؛ یعنی ChatGPT همانند نوشتن متون تصاویر را تدریجاً از بالا به پایین و از چپ به راست میسازد. درحالیکه مدلهای قبلی همانند DALL·E بر پایه روش Diffusion model کل عکس را همزمان پردازش و طراحی میکردند. همین نوشته به گمان زیادً علتشده تا یکپارچگی تصاویر بهبود یابد.
مدیر تیم تحقیقاتی OpenAI قابلیت تازه ChatGPT را حاصل تستهای متعدد و بعضاً تکراری تیمش در ماههای تازه میداند. یقیناً او اظهار داشت این ویژگی تا این مدت در پردازش متون ریز و کوچک در تصاویر مشکل دارد، اما در کل کیفیت متن و تصاویر را بهطور همزمان نگه داری میکند.
دسته بندی مطالب
