fix bert bug using trt6 when compile with CUDA_ARCH_NAME=All (PaddlePaddle#24576)

cryoco · NHZlX · web-flow · commit 32f07216e0dd · 2020-05-15T18:07:53.000+08:00
test=develop

Co-authored-by: nhzlx &lt;nhzlx.dragon@gmail.com&gt;
diff --git a/paddle/fluid/inference/tensorrt/convert/emb_eltwise_layernorm.cc b/paddle/fluid/inference/tensorrt/convert/emb_eltwise_layernorm.cc
@@ -91,9 +91,9 @@ class EmbEltwiseLayerNormOpConverter : public OpConverter {
             input_embs, bias, scale, emb_sizes, bias_size, scale_size, hidden,
             eps);
 #else
-        PADDLE_THROW(
-            platform::errors::Fatal("use EmbEltwiseLayernormPluginDynamic "
-                                    "FP16, but GPU doesn't have FP16."));
+        plugin = new plugin::EmbEltwiseLayernormPluginDynamic<float>(
+            input_embs, bias, scale, emb_sizes, bias_size, scale_size, hidden,
+            eps);
 #endif
       } else {
         plugin = new plugin::EmbEltwiseLayernormPluginDynamic<float>(
diff --git a/paddle/fluid/inference/tensorrt/op_teller.cc b/paddle/fluid/inference/tensorrt/op_teller.cc
@@ -29,7 +29,6 @@ struct SimpleOpTypeSetTeller : public Teller {
     teller_set.insert("fused_embedding_eltwise_layernorm");
     teller_set.insert("multihead_matmul");
     teller_set.insert("skip_layernorm");
-    teller_set.insert("slice");
 #endif
   }
 
diff --git a/paddle/fluid/inference/tests/api/trt_dynamic_shape_ernie_test.cc b/paddle/fluid/inference/tests/api/trt_dynamic_shape_ernie_test.cc
@@ -120,7 +120,7 @@ void trt_ernie(bool with_fp16, std::vector<float> result) {
   if (with_fp16) {
     precision = AnalysisConfig::Precision::kHalf;
   }
-  config.EnableTensorRtEngine(1 << 30, 1, 1, precision, false, true);
+  config.EnableTensorRtEngine(1 << 30, 1, 5, precision, false, true);
   config.SetTRTDynamicShapeInfo(min_input_shape, max_input_shape,
                                 opt_input_shape);
   std::vector<float> out_data;

Original file line number	Diff line number	Diff line change
`@@ -29,7 +29,6 @@ struct SimpleOpTypeSetTeller : public Teller {`
`29`	`29`	`teller_set.insert("fused_embedding_eltwise_layernorm");`
`30`	`30`	`teller_set.insert("multihead_matmul");`
`31`	`31`	`teller_set.insert("skip_layernorm");`
`32`		`- teller_set.insert("slice");`
`33`	`32`	`#endif`
`34`	`33`	`}`
`35`	`34`
Original file line number	Diff line number	Diff line change
`@@ -120,7 +120,7 @@ void trt_ernie(bool with_fp16, std::vector<float> result) {`
`120`	`120`	`if (with_fp16) {`
`121`	`121`	`precision = AnalysisConfig::Precision::kHalf;`
`122`	`122`	`}`
`123`		`- config.EnableTensorRtEngine(1 << 30, 1, 1, precision, false, true);`
	`123`	`+ config.EnableTensorRtEngine(1 << 30, 1, 5, precision, false, true);`
`124`	`124`	`config.SetTRTDynamicShapeInfo(min_input_shape, max_input_shape,`
`125`	`125`	`opt_input_shape);`
`126`	`126`	`std::vector<float> out_data;`