Installazione su NPU Ascend#

Xinference può essere eseguito su Ascend NPU. Installare utilizzando il seguente comando.

Avvertimento

La versione open source dipende da Transformers per l’inferenza, il che può causare problemi di lentezza su chip come il 310p3. Forniamo una versione enterprise che supporta il motore MindIE, con prestazioni più elevate e migliore compatibilità per supportare Ascend NPU. Per maggiori dettagli, consulta Xinference versione enterprise

Installa PyTorch e l’estensione Ascend#

Installa la versione CPU di PyTorch e l’estensione Ascend corrispondente.

Prendendo PyTorch v2.1.0 come esempio.

pip3 install torch==2.1.0 torchvision==0.16.0 --index-url https://download.pytorch.org/whl/cpu

Successivamente, installare l” estensione PyTorch di Ascend.

pip3 install 'numpy<2.0'
pip3 install decorator
pip3 install torch-npu==2.1.0.post3

Esegui il seguente comando per verificare; se funziona correttamente, verrà stampato il numero di NPU Ascend.

python -c "import torch; import torch_npu; print(torch.npu.device_count())"

Installa Xinference#

pip3 install xinference

Ora puoi fare riferimento alla documentazione per utilizzare Xinference. Transformers è l’unico motore open source che supporta l’NPU Ascend.

Supporto aziendale#

Se riscontri problemi di performance o di altro tipo con Ascend NPU, ti invitiamo a contattare Xinference Enterprise Edition. Puoi contattarci qui.