sil-org · Praveenraj-K · Sep 23, 2025 · Sep 24, 2025 · Sep 24, 2025 · Sep 24, 2025
@@ -7,6 +7,7 @@
 from decimal import Decimal
 import logging
 from datetime import datetime
+import base64
 import re
 
 # Set up logging
@@ -279,6 +280,24 @@ def get_export_data_files(s3_client, s3_bucket, export_info):
         logger.error(f"Failed to get export data files for {export_info.get('table_name', 'unknown')}: {str(e)}")
         raise
 
+def decode_binary(item):
+    if isinstance(item, dict):
+        if len(item) == 1:
+            key, value = next(iter(item.items()))
+            if key == 'B':
+                try:
+                    return base64.b64decode(value)
+                except Exception as e:
+                    logger.warning(f"Failed to decode binary attribute: {e}")
+                    return value
+            return item
+        else:
+            return {k: decode_binary(v) for k, v in item.items()}
+    elif isinstance(item, list):
+        return [decode_binary(v) for v in item]
+    else:
+        return item
+
 
 def parse_dynamodb_json_file(s3_client, s3_bucket, s3_key):
     """Parse a single DynamoDB JSON export file from S3"""
@@ -303,13 +322,16 @@ def parse_dynamodb_json_file(s3_client, s3_bucket, s3_key):
                 try:
                     item_data = json.loads(line)
                     if 'Item' in item_data:
-                        items.append(item_data['Item'])
+                        item = item_data['Item']
                     elif isinstance(item_data, dict):
-                        # Handle case where the line is already the item
-                        items.append(item_data)
+                        item = item_data
+                    else:
+                        continue
+                    item = decode_binary(item)
+                    items.append(item)
                 except json.JSONDecodeError as e:
                     error_count += 1
-                    if error_count <= 5:  # Log first 5 errors only
+                    if error_count <= 5:
                         logger.warning(f"JSON decode error on line {line_count}: {str(e)}")
 
         if error_count > 0: