هزینه ایجاد پاسخ در هر مکالمه، پیام به پیام افزایش پیدا میکند
مدلهای زبانی برای تولید هر پاسخ جدید، نیاز دارند تمامی پیامهای قبلی مکالمه، از جمله پیامهای کاربر و پاسخهای خودش را مرور کنند. این باعث میشود که با افزایش تعداد پیامها، مقدار دادههایی که باید پردازش شوند بیشتر شود و در نتیجه مصرف توکنها و هزینهها افزایش پیدا کند.
بهعنوان مثال:
پیام اول: وقتی پیام اول را ارسال میکنید، مدل تنها نیاز دارد به همین یک پیام پاسخ دهد. فرض کنیم که این مکالمه 100 توکن مصرف میکند.
پاسخ به پیام اول: مدل پاسخی به پیام شما میدهد که خودش نیز مثلاً 150 توکن مصرف میکند.
پیام دوم: حالا که پیام دوم را میفرستید، مدل باید هم پیام اول شما و هم پاسخ خودش به آن را مرور کند تا پاسخی مناسب به پیام جدیدتان ارائه دهد. به این ترتیب، مجموع توکنهایی که مصرف میشود، مثلاً 350 توکن است (100 توکن پیام اول + 150 توکن پاسخ اول + 100 توکن پیام دوم).
پاسخ به پیام دوم: وقتی مدل به پیام دوم پاسخ میدهد، خودش نیز یک پیام جدید تولید میکند که به مصرف توکن اضافه میکند.
این روند با افزایش پیامها ادامه مییابد و هرچه تعداد پیامهای ارسالشده و پاسخهای مدل بیشتر شوند، سیستم نیاز به پردازش دادههای بیشتری دارد، که در نتیجه هزینه نهایی بیشتر خواهد شد.
راهنما:
پیشنهاد میکنیم اگر مرور و بررسی پیامهای قبلی در یک مکالمه برای شما اهمیتی ندارد، موضوعات جدید خود را به همراه فایلها و اطلاعات مرتبط، در یک مکالمه جدید ادامه دهید. این کار باعث میشود مصرف توکنها کاهش یابد و هزینه کمتری برای شما به همراه داشته باشد.
هزینه آپلود
اپلود تصاویر فقط با استفاده از مدل GPT-4o قابل انجام است. هزینه آپلود هر عکس براساس اندازه آن محاسبه می شود. به این شکل که عکس به مربع های 512 در 512 پیکسل تقسیم می شود که هر کدام از این مربع ها هزینه ثابتی دارند. برای مثال، اگر عکسی به اندازه 1024 در 1024 پیکسل آپلود کنید، به 4 مربع تقسیم خواهد شد و هزینه 4x1000 تومان به پیام شما اضافه خواهد شد.
هزینه به تومان | نام مدل |
---|
۱۰۰۰ تومان | Vision |