Build Serving Image with Batching Inference Request and How to check if its worked

gabbygab1233 · October 5, 2021, 7:00am

How to test if the batching request work?

Create Serving Image

docker run -d --name serving_base tensorflow/serving

Batchin_Parameters txt file

max_batch_size { value: 32 }
batch_timeout_micros { value: 5000 }
pad_variable_length_inputs: true

Copy SavedModel

docker cp /home/Desktop/tf/models/my_model serving_base:/models/my_model

docker cp /home/Desktop/tf/batch_config/batching_parameters.txt serving_base:/server_config

Commit

docker commit --change "ENV MODEL_NAME my_model" serving_base acnet

Stop Serving Base

docker kill serving base

Checking Docker image and running
Screenshot from 2021-10-05 14-48-18

docker run --rm --name serve -p8500:8500 -p8501:8501 -d acnet

curl http://localhost:8501/v1/models/model

{
 "model_version_status": [
  {
   "version": "1",
   "state": "AVAILABLE",
   "status": {
    "error_code": "OK",
    "error_message": ""
   }
  }
 ]
}

Topic		Replies	Views
Build Serving Image with Multiple Models General Discussion models , serving , tfx , help_request , tf-serving	5	2954	October 4, 2021
Cannot get to work Tensorflow Serving REST API General Discussion tf-serving	0	303	September 26, 2023
Tf-serving with tensorrt seems compress batchs to 1 General Discussion models , help_request	1	596	October 3, 2024
Issue Calling Predict on Transfer-Learned Model [Docker, React] General Discussion tf-serving	8	986	April 19, 2023
Tensorflow serving in Kubernetes deployment fails to predict based on input json (text based messages) - Output exceeds the size limit error General Discussion models , serving , keras , help_request , tf-serving	3	1927	November 7, 2022

Build Serving Image with Batching Inference Request and How to check if its worked

Create Serving Image

Batchin_Parameters txt file

Copy SavedModel

Commit

Stop Serving Base

Related topics