software-mansion · NorbertKlockiewicz · Mar 7, 2025 · Mar 7, 2025 · Mar 7, 2025 · Mar 7, 2025
diff --git a/android/src/main/java/com/swmansion/rnexecutorch/VerticalOCR.kt b/android/src/main/java/com/swmansion/rnexecutorch/VerticalOCR.kt
@@ -155,7 +155,7 @@ class VerticalOCR(reactContext: ReactApplicationContext) :
 
         resMap.putString("text", text)
         resMap.putArray("bbox", box.toWritableArray())
-        resMap.putDouble("confidence", confidenceScore)
+        resMap.putDouble("score", confidenceScore)
 
         predictions.pushMap(resMap)
       }

diff --git a/android/src/main/java/com/swmansion/rnexecutorch/models/ocr/RecognitionHandler.kt b/android/src/main/java/com/swmansion/rnexecutorch/models/ocr/RecognitionHandler.kt
@@ -104,7 +104,7 @@ class RecognitionHandler(
 
       resMap.putString("text", decodedTexts[0])
       resMap.putArray("bbox", box.toWritableArray())
-      resMap.putDouble("confidence", confidenceScore)
+      resMap.putDouble("score", confidenceScore)
 
       res.pushMap(resMap)
     }

diff --git a/...ision/node_modules/react-native-executorch/ios/RnExecutorch/models/ocr/VerticalDetector.h b/...ision/node_modules/react-native-executorch/ios/RnExecutorch/models/ocr/VerticalDetector.h
diff --git a/...sion/node_modules/react-native-executorch/ios/RnExecutorch/models/ocr/VerticalDetector.mm b/...sion/node_modules/react-native-executorch/ios/RnExecutorch/models/ocr/VerticalDetector.mm
diff --git a/ios/RnExecutorch/OCR.mm b/ios/RnExecutorch/OCR.mm
@@ -1,8 +1,8 @@
 #import "OCR.h"
 #import "models/ocr/Detector.h"
 #import "models/ocr/RecognitionHandler.h"
-#import "utils/ImageProcessor.h"
 #import "models/ocr/utils/Constants.h"
+#import "utils/ImageProcessor.h"
 #import <ExecutorchLib/ETModel.h>
 #import <React/RCTBridgeModule.h>
 
@@ -80,14 +80,11 @@ of different sizes (e.g. large - 512x64, medium - 256x64, small - 128x64).
   @try {
     cv::Mat image = [ImageProcessor readImage:input];
     NSArray *result = [detector runModel:image];
-    cv::Size detectorSize = [detector getModelImageSize];
-    const CGFloat recognizerRatio = recognizerImageSize / detectorSize.width;
     cv::cvtColor(image, image, cv::COLOR_BGR2GRAY);
-    result = [self->recognitionHandler
-            recognize:result
-              imgGray:image
-         desiredWidth:detectorSize.width * recognizerRatio
-        desiredHeight:detectorSize.height * recognizerRatio];
+    result = [self->recognitionHandler recognize:result
+                                         imgGray:image
+                                    desiredWidth:recognizerImageSize
+                                   desiredHeight:recognizerImageSize];
     resolve(result);
   } @catch (NSException *exception) {
     reject(@"forward_error",

diff --git a/ios/RnExecutorch/models/ocr/Detector.mm b/ios/RnExecutorch/models/ocr/Detector.mm
@@ -21,7 +21,7 @@ @implementation Detector {
   NSArray *inputShape = [module getInputShape:@0];
   NSNumber *widthNumber = inputShape[inputShape.count - 2];
   NSNumber *heightNumber = inputShape.lastObject;
-
+  
   const int height = [heightNumber intValue];
   const int width = [widthNumber intValue];
   modelSize = cv::Size(height, width);

diff --git a/ios/RnExecutorch/models/ocr/Recognizer.mm b/ios/RnExecutorch/models/ocr/Recognizer.mm
@@ -14,8 +14,8 @@ @implementation Recognizer {
 
 - (cv::Size)getModelImageSize {
   NSArray *inputShape = [module getInputShape:@0];
-  NSNumber *widthNumber = inputShape[inputShape.count - 2];
-  NSNumber *heightNumber = inputShape.lastObject;
+  NSNumber *widthNumber = inputShape.lastObject;
+  NSNumber *heightNumber = inputShape[inputShape.count - 2];
 
   const int height = [heightNumber intValue];
   const int width = [widthNumber intValue];
@@ -24,8 +24,8 @@ @implementation Recognizer {
 
 - (cv::Size)getModelOutputSize {
   NSArray *outputShape = [module getOutputShape:@0];
-  NSNumber *widthNumber = outputShape[outputShape.count - 2];
-  NSNumber *heightNumber = outputShape.lastObject;
+  NSNumber *widthNumber = outputShape.lastObject;
+  NSNumber *heightNumber = outputShape[outputShape.count - 2];
 
   const int height = [heightNumber intValue];
   const int width = [widthNumber intValue];

diff --git a/ios/RnExecutorch/models/ocr/utils/RecognizerUtils.mm b/ios/RnExecutorch/models/ocr/utils/RecognizerUtils.mm
@@ -251,17 +251,17 @@ + (double)computeConfidenceScore:(NSArray<NSNumber *> *)valuesArray
 
     points.emplace_back(cv::Point2f(point.x, point.y));
   }
-
+  
   cv::Rect rect = cv::boundingRect(points);
   cv::Mat croppedImage = img(rect);
+  cv::cvtColor(croppedImage, croppedImage, cv::COLOR_BGR2GRAY);
+  cv::resize(croppedImage, croppedImage, cv::Size(smallVerticalRecognizerWidth, recognizerHeight), 0, 0,
+               cv::INTER_AREA);
+  cv::medianBlur(img, img, 1);
   return croppedImage;
 }
 
 + (cv::Mat)cropSingleCharacter:(cv::Mat)img {
-  cv::cvtColor(img, img, cv::COLOR_BGR2GRAY);
-  cv::resize(img, img, cv::Size(smallVerticalRecognizerWidth, recognizerHeight), 0, 0,
-             cv::INTER_AREA);
-  cv::medianBlur(img, img, 1);
 
   cv::Mat histogram;