İçeriğe geç

Ağırlık Ön Çekme

Weight prefetch, deployment yaratmadan önce model ağırlıklarını Parel depolamasına stream eder. Deployment daha sonra oluşturulduğunda cache’teki ağırlıklar cold start süresini kısaltabilir.

Terminal window
curl https://api.parel.cloud/v1/deployments/prefetch \
-H "Authorization: Bearer pk-dev-YOUR_KEY" \
-H "Content-Type: application/json" \
-d '{"huggingface_id": "Qwen/Qwen2.5-7B-Instruct"}'
Terminal window
curl https://api.parel.cloud/v1/deployments/prefetch/Qwen%2FQwen2.5-7B-Instruct \
-H "Authorization: Bearer pk-dev-YOUR_KEY"
Terminal window
curl -X POST https://api.parel.cloud/v1/deployments/prefetch/Qwen%2FQwen2.5-7B-Instruct/cancel \
-H "Authorization: Bearer pk-dev-YOUR_KEY"
KısıtDeğer
Model başı boyut limiti50 GB
Kullanılmayan prefetch TTL10 dakika
Storage lifecycle30 gün