Instans Cloud Tipe instans AWS Inferensia Amazon Elastic Inference

Jenis dan Kerangka Instance yang Didukung

Amazon SageMaker Neo mendukung kerangka pembelajaran mendalam yang populer untuk kompilasi dan penerapan. Anda dapat menerapkan model Anda ke instans cloud, jenis instans AWS Inferentia, atau akselerator Amazon Elastic Inference.

Berikut ini menjelaskan kerangka kerja yang didukung SageMaker Neo dan instance cloud target yang dapat Anda kompilasi dan terapkan. Untuk informasi tentang cara menerapkan model yang dikompilasi ke instans cloud atau Inferentia, lihat Menerapkan Model dengan Instans Cloud. Untuk informasi tentang cara menerapkan model yang dikompilasi dengan akselerator Elastic Inference, lihat. Gunakan EI di Titik Akhir yang SageMaker Dihosting Amazon

Instans Cloud

SageMaker Neo mendukung kerangka kerja pembelajaran mendalam berikut untuk instance cloud CPU dan GPU:

Kerangka Kerja	Versi Kerangka	Versi Model	Model	Format Model (dikemas dalam*.tar.gz)	Toolkit
MXNet	1.8.0	Mendukung 1.8.0 atau sebelumnya	Klasifikasi Gambar, Deteksi Objek, Segmentasi Semantik, Estimasi Pose, Pengenalan Aktivitas	Satu file simbol (.json) dan satu file parameter (.params)	GluonCV v0.8.0
ONNX	1.7.0	Mendukung 1.7.0 atau sebelumnya	Klasifikasi Gambar, SVM	Satu file model (.onnx)
Keras	2.2.4	Mendukung 2.2.4 atau sebelumnya	Klasifikasi Gambar	Satu file definisi model (.h5)
PyTorch	1.4, 1.5, 1.6, 1.7, 1.8, 1.12, 1.13, atau 2.0	Mendukung 1.4, 1.5, 1.6, 1.7, 1.8, 1.12, 1.13, dan 2.0	Klasifikasi Gambar Versi 1.13 dan 2.0 mendukung Object Detection, Vision Transformer, dan HuggingFace	Satu file definisi model (.pt atau.pth) dengan input dtype float32
TensorFlow	1.15.3 atau 2.9	Mendukung 1.15.3 dan 2.9	Klasifikasi Gambar	Untuk model yang disimpan, satu file.pb atau satu file.pbtxt dan direktori variabel yang berisi variabel Untuk model beku, hanya satu file.pb atau .pbtxt
XGBoost	1.3.3	Mendukung 1.3.3 atau sebelumnya	Pohon Keputusan	Satu file model XGBoost (.model) di mana jumlah node dalam pohon kurang dari 2 ^ 31

catatan

“Versi Model” adalah versi kerangka kerja yang digunakan untuk melatih dan mengekspor model.

Tipe instans

Anda dapat menerapkan model yang SageMaker dikompilasi ke salah satu instance cloud yang tercantum di bawah ini:

Instans	Jenis Komputasi
`ml_c4`	Standar
`ml_c5`	Standar
`ml_m4`	Standar
`ml_m5`	Standar
`ml_p2`	Komputasi yang dipercepat
`ml_p3`	Komputasi yang dipercepat
`ml_g4dn`	Komputasi yang dipercepat

Untuk informasi tentang vCPU, memori, dan harga per jam yang tersedia untuk setiap jenis instans, lihat Harga Amazon SageMaker .

catatan

Saat mengompilasi ml_* instance menggunakan PyTorch framework, gunakan bidang opsi Compiler di Output Configuration untuk memberikan tipe data (dtype) yang benar dari input model.

Default diatur ke "float32".

AWS Inferensia

SageMaker Neo mendukung kerangka kerja pembelajaran mendalam berikut untuk Inf1:

Kerangka Kerja	Versi Kerangka	Versi Model	Model	Format Model (dikemas dalam*.tar.gz)	Toolkit
MXNet	1.5 atau 1.8	Mendukung 1.8, 1.5 dan sebelumnya	Klasifikasi Gambar, Deteksi Objek, Segmentasi Semantik, Estimasi Pose, Pengenalan Aktivitas	Satu file simbol (.json) dan satu file parameter (.params)	GluonCV v0.8.0
PyTorch	1.7, 1.8 atau 1.9	Mendukung 1.9 dan sebelumnya	Klasifikasi Gambar	Satu file definisi model (.pt atau.pth) dengan input dtype float32
TensorFlow	1.15 atau 2.5	Mendukung 2.5, 1.15 dan sebelumnya	Klasifikasi Gambar	Untuk model yang disimpan, satu file.pb atau satu file.pbtxt dan direktori variabel yang berisi variabel Untuk model beku, hanya satu file.pb atau .pbtxt

Kerangka Kerja

Versi Kerangka

Versi Model

Model

Format Model (dikemas dalam*.tar.gz)

Toolkit

MXNet

1.5 atau 1.8

Mendukung 1.8, 1.5 dan sebelumnya

Klasifikasi Gambar, Deteksi Objek, Segmentasi Semantik, Estimasi Pose, Pengenalan Aktivitas

Satu file simbol (.json) dan satu file parameter (.params)

GluonCV v0.8.0

PyTorch

1.7, 1.8 atau 1.9

Mendukung 1.9 dan sebelumnya

Klasifikasi Gambar

Satu file definisi model (.pt atau.pth) dengan input dtype float32

TensorFlow

1.15 atau 2.5

Mendukung 2.5, 1.15 dan sebelumnya

Klasifikasi Gambar

Untuk model yang disimpan, satu file.pb atau satu file.pbtxt dan direktori variabel yang berisi variabel

Untuk model beku, hanya satu file.pb atau .pbtxt

catatan

“Versi Model” adalah versi kerangka kerja yang digunakan untuk melatih dan mengekspor model.

Anda dapat menerapkan model yang SageMaker dikompilasi NEO ke instans Amazon EC2 Inf1 AWS berbasis Inferensia. AWS Inferentia adalah chip silikon khusus pertama Amazon yang dirancang untuk mempercepat pembelajaran mendalam. Saat ini, Anda dapat menggunakan ml_inf1 instance untuk menerapkan model yang dikompilasi.

AWS Inferensia2 dan Trainium AWS

Saat ini, Anda dapat menerapkan model yang SageMaker dikompilasi NEO ke instans Amazon EC2 AWS Inf2 berbasis Inferensia2 (di Wilayah AS Timur (Ohio)), dan AWS ke instans Amazon EC2 Trn1 berbasis Trinium (di Wilayah AS Timur (Virginia N.)). Untuk informasi lebih lanjut tentang model yang didukung pada instance ini, lihat Panduan Kesesuaian Arsitektur Model dalam dokumentasi AWS Neuron, dan contoh di repositori Neuron Github.

Amazon Elastic Inference

SageMaker Neo mendukung kerangka pembelajaran mendalam berikut untuk Elastic Inference:

Kerangka Kerja	Versi Kerangka	Versi Model	Model	Format Model (dikemas dalam*.tar.gz)
TensorFlow	2.3.2	Mendukung 2.3	Klasifikasi Gambar, Deteksi Objek, Segmentasi Semantik, Estimasi Pose, Pengenalan Aktivitas	Untuk model yang disimpan, satu file.pb atau satu file.pbtxt dan direktori variabel yang berisi variabel. Untuk model beku, hanya satu file.pb atau .pbtxt.

Kerangka Kerja

Versi Kerangka

Versi Model

Model

Format Model (dikemas dalam*.tar.gz)

TensorFlow

2.3.2

Mendukung 2.3

Klasifikasi Gambar, Deteksi Objek, Segmentasi Semantik, Estimasi Pose, Pengenalan Aktivitas

Untuk model yang disimpan, satu file.pb atau satu file.pbtxt dan direktori variabel yang berisi variabel.

Untuk model beku, hanya satu file.pb atau .pbtxt.

Anda dapat menerapkan model yang SageMaker dikompilasi NEO Anda ke Akselerator Elastic Inference. Lihat informasi yang lebih lengkap di Gunakan EI di Titik Akhir yang SageMaker Dihosting Amazon.

Konvensi Dokumen

Instans Cloud

Menerapkan Model