Ağırlık Ön Çekme
Weight prefetch, deployment yaratmadan önce model ağırlıklarını Parel depolamasına stream eder. Deployment daha sonra oluşturulduğunda cache’teki ağırlıklar cold start süresini kısaltabilir.
Başlat
Section titled “Başlat”curl https://api.parel.cloud/v1/deployments/prefetch \ -H "Authorization: Bearer pk-dev-YOUR_KEY" \ -H "Content-Type: application/json" \ -d '{"huggingface_id": "Qwen/Qwen2.5-7B-Instruct"}'Durum sorgula
Section titled “Durum sorgula”curl https://api.parel.cloud/v1/deployments/prefetch/Qwen%2FQwen2.5-7B-Instruct \ -H "Authorization: Bearer pk-dev-YOUR_KEY"İptal et
Section titled “İptal et”curl -X POST https://api.parel.cloud/v1/deployments/prefetch/Qwen%2FQwen2.5-7B-Instruct/cancel \ -H "Authorization: Bearer pk-dev-YOUR_KEY"| Kısıt | Değer |
|---|---|
| Model başı boyut limiti | 50 GB |
| Kullanılmayan prefetch TTL | 10 dakika |
| Storage lifecycle | 30 gün |