ALIGNING TEXT-TO-IMAGE DIFFUSION MODELS WITH REWARD BACKPROPAGATION
کلمات تخصصی و توضیحات: Downstream tasks: وظایف یا کاربردهایی که پس از آموزش مدل اصلی به آن پرداخته میشوند، مانند تطبیق متن و تصویر یا بهبود کیفیت تصویر. این وظایف معمولاً نیازمند تنظیم دقیق مدل (fine-tuning) هستند. Gradient estimators: ابزارهای محاسباتی برای برآورد گرادیان در مدلهای یادگیری، که در یادگیری تقویتی نقش مهمی ایفا میکنند. […]
محمدرضا شعبانی
Academic Writer