Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Jenis dan Kerangka Instance yang Didukung

Amazon SageMaker Neo mendukung kerangka pembelajaran mendalam yang populer untuk kompilasi dan penerapan. Anda dapat menerapkan model Anda ke instans cloud, jenis instans AWS Inferentia, atau akselerator Amazon Elastic Inference.

Berikut ini menjelaskan kerangka kerja yang didukung SageMaker Neo dan instance cloud target yang dapat Anda kompilasi dan terapkan. Untuk informasi tentang cara menerapkan model yang dikompilasi ke instans cloud atau Inferentia, lihat Menerapkan Model dengan Instans Cloud. Untuk informasi tentang cara menerapkan model yang dikompilasi dengan akselerator Elastic Inference, lihat. Gunakan EI di Titik Akhir yang SageMaker Dihosting Amazon

Instans Cloud

SageMaker Neo mendukung kerangka kerja pembelajaran mendalam berikut untuk instance cloud CPU dan GPU:

Kerangka Kerja Versi Kerangka Versi Model Model Format Model (dikemas dalam*.tar.gz) Toolkit
MXNet 1.8.0 Mendukung 1.8.0 atau sebelumnya Klasifikasi Gambar, Deteksi Objek, Segmentasi Semantik, Estimasi Pose, Pengenalan Aktivitas Satu file simbol (.json) dan satu file parameter (.params) GluonCV v0.8.0
ONNX 1.7.0 Mendukung 1.7.0 atau sebelumnya Klasifikasi Gambar, SVM Satu file model (.onnx)
Keras 2.2.4 Mendukung 2.2.4 atau sebelumnya Klasifikasi Gambar Satu file definisi model (.h5)
PyTorch 1.4, 1.5, 1.6, 1.7, 1.8, 1.12, 1.13, atau 2.0 Mendukung 1.4, 1.5, 1.6, 1.7, 1.8, 1.12, 1.13, dan 2.0

Klasifikasi Gambar

Versi 1.13 dan 2.0 mendukung Object Detection, Vision Transformer, dan HuggingFace

Satu file definisi model (.pt atau.pth) dengan input dtype float32
TensorFlow 1.15.3 atau 2.9 Mendukung 1.15.3 dan 2.9 Klasifikasi Gambar

Untuk model yang disimpan, satu file.pb atau satu file.pbtxt dan direktori variabel yang berisi variabel

Untuk model beku, hanya satu file.pb atau .pbtxt

XGBoost 1.3.3 Mendukung 1.3.3 atau sebelumnya Pohon Keputusan Satu file model XGBoost (.model) di mana jumlah node dalam pohon kurang dari 2 ^ 31
catatan

“Versi Model” adalah versi kerangka kerja yang digunakan untuk melatih dan mengekspor model.

Tipe instans

Anda dapat menerapkan model yang SageMaker dikompilasi ke salah satu instance cloud yang tercantum di bawah ini:

Instans Jenis Komputasi

ml_c4

Standar

ml_c5

Standar

ml_m4

Standar

ml_m5

Standar

ml_p2

Komputasi yang dipercepat

ml_p3

Komputasi yang dipercepat

ml_g4dn

Komputasi yang dipercepat

Untuk informasi tentang vCPU, memori, dan harga per jam yang tersedia untuk setiap jenis instans, lihat Harga Amazon SageMaker .

catatan

Saat mengompilasi ml_* instance menggunakan PyTorch framework, gunakan bidang opsi Compiler di Output Configuration untuk memberikan tipe data (dtype) yang benar dari input model.

Default diatur ke "float32".

AWS Inferensia

SageMaker Neo mendukung kerangka kerja pembelajaran mendalam berikut untuk Inf1:

Kerangka Kerja Versi Kerangka Versi Model Model Format Model (dikemas dalam*.tar.gz) Toolkit
MXNet 1.5 atau 1.8 Mendukung 1.8, 1.5 dan sebelumnya Klasifikasi Gambar, Deteksi Objek, Segmentasi Semantik, Estimasi Pose, Pengenalan Aktivitas Satu file simbol (.json) dan satu file parameter (.params) GluonCV v0.8.0
PyTorch 1.7, 1.8 atau 1.9 Mendukung 1.9 dan sebelumnya Klasifikasi Gambar Satu file definisi model (.pt atau.pth) dengan input dtype float32
TensorFlow 1.15 atau 2.5 Mendukung 2.5, 1.15 dan sebelumnya Klasifikasi Gambar

Untuk model yang disimpan, satu file.pb atau satu file.pbtxt dan direktori variabel yang berisi variabel

Untuk model beku, hanya satu file.pb atau .pbtxt

catatan

“Versi Model” adalah versi kerangka kerja yang digunakan untuk melatih dan mengekspor model.

Anda dapat menerapkan model yang SageMaker dikompilasi NEO ke instans Amazon EC2 Inf1 AWS berbasis Inferensia. AWS Inferentia adalah chip silikon khusus pertama Amazon yang dirancang untuk mempercepat pembelajaran mendalam. Saat ini, Anda dapat menggunakan ml_inf1 instance untuk menerapkan model yang dikompilasi.

AWS Inferensia2 dan Trainium AWS

Saat ini, Anda dapat menerapkan model yang SageMaker dikompilasi NEO ke instans Amazon EC2 AWS Inf2 berbasis Inferensia2 (di Wilayah AS Timur (Ohio)), dan AWS ke instans Amazon EC2 Trn1 berbasis Trinium (di Wilayah AS Timur (Virginia N.)). Untuk informasi lebih lanjut tentang model yang didukung pada instance ini, lihat Panduan Kesesuaian Arsitektur Model dalam dokumentasi AWS Neuron, dan contoh di repositori Neuron Github.

Amazon Elastic Inference

SageMaker Neo mendukung kerangka pembelajaran mendalam berikut untuk Elastic Inference:

Kerangka Kerja Versi Kerangka Versi Model Model Format Model (dikemas dalam*.tar.gz)
TensorFlow 2.3.2 Mendukung 2.3 Klasifikasi Gambar, Deteksi Objek, Segmentasi Semantik, Estimasi Pose, Pengenalan Aktivitas

Untuk model yang disimpan, satu file.pb atau satu file.pbtxt dan direktori variabel yang berisi variabel.

Untuk model beku, hanya satu file.pb atau .pbtxt.

Anda dapat menerapkan model yang SageMaker dikompilasi NEO Anda ke Akselerator Elastic Inference. Lihat informasi yang lebih lengkap di Gunakan EI di Titik Akhir yang SageMaker Dihosting Amazon.