پردازش
مدلهای زبان
مدلهای زبان سیستمهای هوش مصنوعی پیشرفتهای هستند که میتوانند زبان انسانی را درک، تفسیر و تولید کنند. این مدلها بر روی مجموعه دادههای عظیم از متن آموزش میبینند و الگوها، ترکیبات واژهای، ساختار جملات و حتی ظرائف زبانها و کاربردهای مختلف زبان را یاد میگیرند. هسته بسیاری از مدلهای زبان مدرن معماری ترنسفورمر است، که از مکانیسمهای توجه به خود برای تعیین اینکه کدام بخشهای متن در یک زمینه داده شده اهمیت بیشتری دارند، بهره میبرد.
در پردازش زبان، این مدلها از روشهای آماری برای پیشبینی محتملترین کلمه بعدی یا جمله بعدی محتمل در یک متن استفاده میکنند. آنها میتوانند به متن طولانیContext درک کنند و بدین ترتیب نه تنها متنهای گرامری بلکه متنی با معنا و ارتباطی مربوط به محتوا را تولید کنند.
وقتی از یک مدل زبان برای مثال یک چتبات یا مولّد متن استفاده میشود، مدل با برخی پرامپتها یا دادههای اولیه مشخص میشود و بر اساس آن ورودی، متنی تولید میکند که به لحاظ منطقی از زمینه داده شده پیروی میکند. هدف این مدلها تولید متنی است که تا حد امکان شبیه به انسان به نظر برسد، هم از نظر محتوا و هم از نظر سبک.
مدلهای متن-به-تصویر
مدلهای متن-به-تصویر سیستمهای هوش مصنوعی هستند که قادرند از توصیفهای کتبی متنی، نمایشهای بصری ایجاد کنند، مانند عکسها، تصاویر یا انواع دیگر تصاویر. این مدلها از شبکههای عصبی پیشرفته استفاده میکنند و بهطور خاص از شبکههای مولدِ خصمانه (GANها) یا نسخههای مشابه مانند مدلهای انتشار (diffusion) استفاده میکنند.
فرآیند با یک توصیف متنی وارد شده توسط کاربر آغاز میشود. مدل این متن را ارزیابی کرده و سعی میکند معنی و زمینه آن را درک کند. سپس مدل تصاویری تولید میکند که با توصیف متنی مطابقت دارند، از آنچه در طول آموزش آموخته است استفاده میکند و با آموزش بر روی مجموعههای داده عظیم از زوجهای متن-تصویر، آموزش میبیند.
در طول آموزش، مدل ارتباطهای بین توصیفهای متنی و ویژگیهای بصری را یاد میگیرد. به عنوان مثال، اگر مدل بارها ترکیب کلمۀ «یک خورشید زرد بالای دریاچه آبی» را همراه با تصاویر مشابه این صحنه ببیند، یاد میگیرد این عناصر را تشخیص داده و در ایجاد تصاویر آینده بازتولید کند.
نتیجه معمولاً تصاویر دقیق و با جزئیات بالا است که با توصیف ورودی مطابقت دارند. این مدلها به مرور دقیقتر میشوند و قادرند سناریوهای پیچیده با چندین شیء و مفاهیم انتزاعی را نمایش دهند. آنها در طیف وسیعی از کاربردها مورد استفاده قرار میگیرند، از خلق هنری، طراحی بازی، واقعیت مجازی و بیشتر.
مدلهای منتشرشده AI-Public
مهم است که بدانیم AI-Public چندین مدل هوش مصنوعی را که توسط شرکتهای بزرگ فناوری از طریق API ارائه میشود، منتشر میکند. یک API یا رابط برنامهنویسی کاربردی، مجموعهای از قوانین و تعاریفی است که به نرمافزارها اجازه تعامل با یکدیگر را میده د. این عمل مانند یک «زبان» است که توسط برنامهها برای تبادل اطلاعات و فراخوانی عملکردها درک میشود. AI-Public خود دارای مدلهای زبان یا مدلهای متن-به-تصویر نیست.
ما مسئول نتایج مدلهای مختلف نیستیم. با این حال، به انتخاب بهترین و جذابترین مدلها برای سازمانها توجه کردهایم.
رویه پردازش
برای تولید پاسخ، روال زیر دنبال میشود:
- کاربر یک پرِمپ ایجاد میکند.
- برنامه وب فرانتاند آن را به چت فعال اضافه کرده و یک پیام چت با وضعیت "ابتدای کار" اضافه میکند.
- در سرورهای AI-Public، یک عملکرد فراخوانی میشود با افزودن پیام چت.
- وضعیت پیام چت به "در حال پردازش" تغییر میکند.
- در صورت انتخاب چت با اسناد، سرور ابتدا درخواست به بانک برداری برداری Firestore برای انتخاب متنها از اسناد میفرستد.
- سپس سرور درخواست را از طریق یک اتصال API به مدل زبان انتخابشده میفرستد.
- اگر تنظیمات جریانی فعال باشد، ما پیام را پس از هر 10 بخش دریافتی و پس از هر 25 بخش پس از دریافت 100 بخش نگه میداریم.
- به محض اینکه کل پاسخ دریافت شد، وضعیت به "پایان" تغییر میکند.
- برنامه فرانتاند پس از هر بهروزرسانی پایگاه داده تازه میشود.
- در صورت وجود خطا، وضعیت به "خطا" تغییر میکند و پیغام خطا نمایش داده میشود.
ما هیچ داده شخصی را با هر درخواست API ارسال نمیکنیم. با این حال، ممکن است کاربر در پرامپت یا اسناد آپلود شده اطلاعات شخصی درج کرده باشد.