همراه اول از سه مدل زبانی فارسی در الکامپ رونمایی کرد_دانستنی
نوشته و ویرایش شده توسط مجله ی دانستنی
مدلهای زبانی فارسی گسترشیافته از سوی «همراه اول» که با هوش مصنوعی قادر به تحلیل و یادگیری حجم بسیاری از دادههای متنی می باشند، با وجود وزیر ارتباطات در نمایشگاه الکامپ ۱۴۰۳ رونمایی شدند.
به نقل از شرکت ارتباطات سیار ایران، گروه MCINext همراه اول در نخستین روز برگزاری نمایشگاه بینالمللی الکامپ، تعدادی از مدلهای زبانی گسترشیافته خود شامل «سیلک» (با ۱.۳میلیارد پارامتر)، «آهوران» (با ۸ میلیارد پارامتر) و «آوا» (با ۱۳ میلیارد پارامتر) را با وجود «عیسی زارع پور»، وزیر ارتباطات و فناوری اطلاعات در سالن اختصاصی همراه اول (سالن ۳۵)، رونمایی کرد.
مدل زبانی بزرگ (LLM)، به سیستمهای هوش مصنوعی حرف های میبشود که با تحلیل و یادگیری از حجم بسیاری از دادههای متنی، قادر به تشکیل متن، ترجمه، جواب به سؤالات و انجام ماموریت های گوناگون زبانی می باشند.
مدل زبانی سیلک که از پایه (from scratch) با مجموعه دادگان فارسی در این شرکت آموزش داده شده، با وجود تعداد پارامتر نسبتاً کم، قابلیت زبانی خوبی را به نمایش میگذارد که با ادامه فرآیند آموزش در آینده، از لحاظ دانش نیز بهتر خواهد شد.
مدل آهوران بر پایه مدل چند زبانه Llama3 شرکت Meta و بهصورت آموزش ادامهدار (continual pretraining) بر روی یک مجموعه دادگان فارسی گسترش داده شده است. با دقت به قابلیتهای زیاد مدل پایه، ادامه آموزش، علتتقویت تشکیل متن به زبان فارسی شده درحالیکه قابلیتهای دیگر مدل تا حد بسیاری نگه داری شده است.
کاربردهای تجاری این مدلها زیاد گسترده و نظیر تشکیل محتوای متنی خودکار، حمایتمشتریان از طریق چتباتها، تحلیل احساسات و نظرات کاربران در شبکههای اجتماعی و تشکیل ابزارهای کمکی برای نویسندگان و مترجمان است. این مدلها می توانند به شرکتها در افزایش منفعتوری، افت هزینهها و بهبود توانایی مشتری پشتیبانی کنند.
مدل آوا نیز به منظور پاسخگویی از داخل یک متن داده شده (context) و بر پایه مدل aya از شرکت Cohere گسترش داده شده است.
بنا به اظهار همراه اول، تلاش شده است علاوهبر آموزش این مدلها، به پشتیبانی راه حلهای همترازسازی RLHF و DPO از تشکیل محتوای صدمهزا نیز جلوگیری بشود.
گروه MCINext همراه اول تصمیم دارد در آینده نزدیک امکان منفعت گیری عمومی از این مدلها را فراهم کند.
دسته بندی مطالب