Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Jenis dan Kerangka Instance yang Didukung
Amazon SageMaker Neo mendukung kerangka pembelajaran mendalam yang populer untuk kompilasi dan penerapan. Anda dapat menerapkan model Anda ke instans cloud, jenis instans AWS Inferentia, atau akselerator Amazon Elastic Inference.
Berikut ini menjelaskan kerangka kerja yang didukung SageMaker Neo dan instance cloud target yang dapat Anda kompilasi dan terapkan. Untuk informasi tentang cara menerapkan model yang dikompilasi ke instans cloud atau Inferentia, lihat Menerapkan Model dengan Instans Cloud. Untuk informasi tentang cara menerapkan model yang dikompilasi dengan akselerator Elastic Inference, lihat. Gunakan EI di Titik Akhir yang SageMaker Dihosting Amazon
Instans Cloud
SageMaker Neo mendukung kerangka kerja pembelajaran mendalam berikut untuk instance cloud CPU dan GPU:
Kerangka Kerja | Versi Kerangka | Versi Model | Model | Format Model (dikemas dalam*.tar.gz) | Toolkit |
---|---|---|---|---|---|
MXNet | 1.8.0 | Mendukung 1.8.0 atau sebelumnya | Klasifikasi Gambar, Deteksi Objek, Segmentasi Semantik, Estimasi Pose, Pengenalan Aktivitas | Satu file simbol (.json) dan satu file parameter (.params) | GluonCV v0.8.0 |
ONNX | 1.7.0 | Mendukung 1.7.0 atau sebelumnya | Klasifikasi Gambar, SVM | Satu file model (.onnx) | |
Keras | 2.2.4 | Mendukung 2.2.4 atau sebelumnya | Klasifikasi Gambar | Satu file definisi model (.h5) | |
PyTorch | 1.4, 1.5, 1.6, 1.7, 1.8, 1.12, 1.13, atau 2.0 | Mendukung 1.4, 1.5, 1.6, 1.7, 1.8, 1.12, 1.13, dan 2.0 |
Klasifikasi Gambar Versi 1.13 dan 2.0 mendukung Object Detection, Vision Transformer, dan HuggingFace |
Satu file definisi model (.pt atau.pth) dengan input dtype float32 | |
TensorFlow | 1.15.3 atau 2.9 | Mendukung 1.15.3 dan 2.9 | Klasifikasi Gambar | Untuk model yang disimpan, satu file.pb atau satu file.pbtxt dan direktori variabel yang berisi variabel Untuk model beku, hanya satu file.pb atau .pbtxt |
|
XGBoost | 1.3.3 | Mendukung 1.3.3 atau sebelumnya | Pohon Keputusan | Satu file model XGBoost (.model) di mana jumlah node dalam pohon kurang dari 2 ^ 31 |
catatan
“Versi Model” adalah versi kerangka kerja yang digunakan untuk melatih dan mengekspor model.
Tipe instans
Anda dapat menerapkan model yang SageMaker dikompilasi ke salah satu instance cloud yang tercantum di bawah ini:
Instans | Jenis Komputasi |
---|---|
|
Standar |
|
Standar |
|
Standar |
|
Standar |
|
Komputasi yang dipercepat |
|
Komputasi yang dipercepat |
|
Komputasi yang dipercepat |
Untuk informasi tentang vCPU, memori, dan harga per jam yang tersedia untuk setiap jenis instans, lihat Harga Amazon SageMaker
catatan
Saat mengompilasi ml_*
instance menggunakan PyTorch framework, gunakan bidang opsi Compiler di Output Configuration untuk memberikan tipe data (dtype
) yang benar dari input model.
Default diatur ke "float32"
.
AWS Inferensia
SageMaker Neo mendukung kerangka kerja pembelajaran mendalam berikut untuk Inf1:
Kerangka Kerja | Versi Kerangka | Versi Model | Model | Format Model (dikemas dalam*.tar.gz) | Toolkit |
---|---|---|---|---|---|
MXNet | 1.5 atau 1.8 | Mendukung 1.8, 1.5 dan sebelumnya | Klasifikasi Gambar, Deteksi Objek, Segmentasi Semantik, Estimasi Pose, Pengenalan Aktivitas | Satu file simbol (.json) dan satu file parameter (.params) | GluonCV v0.8.0 |
PyTorch | 1.7, 1.8 atau 1.9 | Mendukung 1.9 dan sebelumnya | Klasifikasi Gambar | Satu file definisi model (.pt atau.pth) dengan input dtype float32 | |
TensorFlow | 1.15 atau 2.5 | Mendukung 2.5, 1.15 dan sebelumnya | Klasifikasi Gambar | Untuk model yang disimpan, satu file.pb atau satu file.pbtxt dan direktori variabel yang berisi variabel Untuk model beku, hanya satu file.pb atau .pbtxt |
catatan
“Versi Model” adalah versi kerangka kerja yang digunakan untuk melatih dan mengekspor model.
Anda dapat menerapkan model yang SageMaker dikompilasi NEO ke instans Amazon EC2 Inf1 AWS berbasis Inferensia. AWS Inferentia adalah chip silikon khusus pertama Amazon yang dirancang untuk mempercepat pembelajaran mendalam. Saat ini, Anda dapat menggunakan ml_inf1
instance untuk menerapkan model yang dikompilasi.
AWS Inferensia2 dan Trainium AWS
Saat ini, Anda dapat menerapkan model yang SageMaker dikompilasi NEO ke instans Amazon EC2 AWS Inf2 berbasis Inferensia2 (di Wilayah AS Timur (Ohio)), dan AWS ke instans Amazon EC2 Trn1 berbasis Trinium (di Wilayah AS Timur (Virginia N.)). Untuk informasi lebih lanjut tentang model yang didukung pada instance ini, lihat Panduan Kesesuaian Arsitektur Model
Amazon Elastic Inference
SageMaker Neo mendukung kerangka pembelajaran mendalam berikut untuk Elastic Inference:
Kerangka Kerja | Versi Kerangka | Versi Model | Model | Format Model (dikemas dalam*.tar.gz) |
---|---|---|---|---|
TensorFlow | 2.3.2 | Mendukung 2.3 | Klasifikasi Gambar, Deteksi Objek, Segmentasi Semantik, Estimasi Pose, Pengenalan Aktivitas | Untuk model yang disimpan, satu file.pb atau satu file.pbtxt dan direktori variabel yang berisi variabel. Untuk model beku, hanya satu file.pb atau .pbtxt. |
Anda dapat menerapkan model yang SageMaker dikompilasi NEO Anda ke Akselerator Elastic Inference. Lihat informasi yang lebih lengkap di Gunakan EI di Titik Akhir yang SageMaker Dihosting Amazon.