AbsaOSS · yruslan · May 12, 2026 · May 7, 2026 · May 11, 2026 · May 11, 2026
@@ -22,6 +22,7 @@ import java.time.Instant
 
 case class PipelineInfo(
                          pipelineName: String,
+                         pipelineDefinitionId: String,
                          environment: String,
                          runtimeInfo: RuntimeInfo,
                          startedAt: Instant,

@@ -75,6 +75,22 @@ trait Pramen {
     * @return An instance of the TokenLockFactory, which allows for token-based locking functionality.
     */
   def tokenLockFactory: TokenLockFactory
+
+  def setComputeEngineId(computeEngineId: String): Unit
+
+  def setNumberOfExecutorsMin(n: Int): Unit
+
+  def setNumberOfExecutorsMax(n: Int): Unit
+
+  def setExecutorType(executorType: String): Unit
+
+  def setNumberOfRecordsIngested(count: Long): Unit
+
+  def addNumberOfRecordsIngested(count: Long): Unit
+
+  def setMaximumNumberOfColumns(count: Long): Unit
+
+  def setExecutionAdditionalOption(key: String, value: String): Unit
 }
 
 object Pramen {

@@ -19,8 +19,16 @@ package za.co.absa.pramen.api.status
 sealed trait PipelineStatus
 
 object PipelineStatus {
-  case object Success extends PipelineStatus
-  case object Warning extends PipelineStatus
-  case object PartialSuccess extends PipelineStatus
-  case object Failure extends PipelineStatus
+  case object Success extends PipelineStatus {
+    override def toString: String = "succeeded"
+  }
+  case object Warning extends PipelineStatus{
+    override def toString: String = "succeeded with warnings"
+  }
+  case object PartialSuccess extends PipelineStatus{
+    override def toString: String = "partially succeeded"
+  }
+  case object Failure extends PipelineStatus{
+    override def toString: String = "failed"
+  }
 }
@@ -40,4 +40,20 @@ class DummyPramen extends Pramen {
   override def setWarningFlag(): Unit = null
 
   override def tokenLockFactory: TokenLockFactory = null
+
+  override def setComputeEngineId(computeEngineId: String): Unit = {}
+
+  override def setNumberOfExecutorsMin(n: Int): Unit = {}
+
+  override def setNumberOfExecutorsMax(n: Int): Unit = {}
+
+  override def setExecutorType(executorType: String): Unit = {}
+
+  override def setNumberOfRecordsIngested(count: Long): Unit = {}
+
+  override def addNumberOfRecordsIngested(count: Long): Unit = {}
+
+  override def setMaximumNumberOfColumns(count: Long): Unit = {}
+
+  override def setExecutionAdditionalOption(key: String, value: String): Unit = {}
 }
@@ -86,6 +86,22 @@ class PramenImpl extends Pramen {
     throw new IllegalStateException("Token lock factory is not available at the context.")
   )
 
+  override def setComputeEngineId(computeEngineId: String): Unit = _pipelineState.foreach(_.setComputeEngineId(computeEngineId))
+
+  override def setNumberOfExecutorsMin(n: Int): Unit = _pipelineState.foreach(_.setNumberOfExecutorsMin(n))
+
+  override def setNumberOfExecutorsMax(n: Int): Unit = _pipelineState.foreach(_.setNumberOfExecutorsMax(n))
+
+  override def setExecutorType(executorType: String): Unit = _pipelineState.foreach(_.setExecutorType(executorType))
+
+  override def setNumberOfRecordsIngested(count: Long): Unit = _pipelineState.foreach(_.setNumberOfRecordsIngested(count))
+
+  override def addNumberOfRecordsIngested(count: Long): Unit = _pipelineState.foreach(_.addNumberOfRecordsIngested(count))
+
+  override def setMaximumNumberOfColumns(count: Long): Unit = _pipelineState.foreach(_.setMaximumNumberOfColumns(count))
+
+  override def setExecutionAdditionalOption(key: String, value: String): Unit = _pipelineState.foreach(_.setExecutionAdditionalOption(key, value))
+
   private[core] def setWorkflowConfig(config: Config): Unit = synchronized {
     _workflowConfig = Option(config)
   }

@@ -48,7 +48,8 @@ case class RuntimeConfig(
                           sparkAppDescriptionTemplate: Option[String],
                           attempt: Int, // Current attempt number for the pipeline run (for auto-retry automation)
                           maxAttempts: Int, // Maximum number of attempts allowed for the pipeline run
-                          forceReCreateHiveTables: Boolean
+                          forceReCreateHiveTables: Boolean,
+                          executionOptions: Map[String, String]
                         )
 
 object RuntimeConfig {
@@ -78,6 +79,7 @@ object RuntimeConfig {
   val ATTEMPT = "pramen.runtime.attempt"
   val MAX_ATTEMPTS = "pramen.runtime.max.attempts"
   val FORCE_RECREATE_HIVE_TABLES = "pramen.runtime.hive.force.recreate"
+  val EXECUTION_EXTRA_OPTIONS_PREFIX = "pramen.execution.option"
 
   def fromConfig(conf: Config): RuntimeConfig = {
     val infoDateFormat = conf.getString(INFORMATION_DATE_FORMAT_APP)
@@ -144,6 +146,7 @@ object RuntimeConfig {
     val sparkAppDescriptionTemplate = ConfigUtils.getOptionString(conf, SPARK_APP_DESCRIPTION_TEMPLATE)
     val attempt = ConfigUtils.getOptionInt(conf, ATTEMPT).getOrElse(1)
     val maxAttempts = ConfigUtils.getOptionInt(conf, MAX_ATTEMPTS).getOrElse(1)
+    val executionOptions = ConfigUtils.getExtraOptions(conf, EXECUTION_EXTRA_OPTIONS_PREFIX)
 
     RuntimeConfig(
       isDryRun = isDryRun,
@@ -166,7 +169,8 @@ object RuntimeConfig {
       sparkAppDescriptionTemplate,
       attempt,
       maxAttempts,
-      forceReCreateHiveTables =  ConfigUtils.getOptionBoolean(conf, FORCE_RECREATE_HIVE_TABLES).getOrElse(false)
+      forceReCreateHiveTables =  ConfigUtils.getOptionBoolean(conf, FORCE_RECREATE_HIVE_TABLES).getOrElse(false),
+      executionOptions
     )
   }
 
@@ -192,7 +196,8 @@ object RuntimeConfig {
       sparkAppDescriptionTemplate = None,
       attempt = 1,
       maxAttempts = 1,
-      forceReCreateHiveTables = false
+      forceReCreateHiveTables = false,
+      Map.empty
     )
   }
 }
@@ -201,13 +201,15 @@ object Bookkeeper {
             case HadoopFormat.Delta =>
               bookkeepingConfig.deltaTablePrefix match {
                 case Some(tablePrefix) =>
-                  val fullTableName = JournalHadoopDeltaTable.getFullTableName(bookkeepingConfig.deltaDatabase, tablePrefix)
-                  log.info(s"Using Delta Lake managed table '$fullTableName' for the journal.")
+                  val journalTableName = JournalHadoopDeltaTable.getFullTableName(bookkeepingConfig.deltaDatabase, tablePrefix, "journal")
+                  val executionsTableName = JournalHadoopDeltaTable.getFullTableName(bookkeepingConfig.deltaDatabase, tablePrefix, "executions")
+                  log.info(s"Using Delta Lake managed table '$journalTableName' and '$executionsTableName' for the journal.")
                   new JournalHadoopDeltaTable(bookkeepingConfig.deltaDatabase, tablePrefix)
                 case None =>
-                  val path = bookkeepingConfig.bookkeepingLocation.get + "/journal"
-                  log.info(s"Using Delta Lake for the journal at $path")
-                  new JournalHadoopDeltaPath(path)
+                  val journalPath = bookkeepingConfig.bookkeepingLocation.get + "/journal"
+                  val executionsPath = bookkeepingConfig.bookkeepingLocation.get + "/executions"
+                  log.info(s"Using Delta Lake for the journal at '$journalPath' and '$executionsPath'")
+                  new JournalHadoopDeltaPath(journalPath, executionsPath)
               }
           }
 

@@ -792,20 +792,20 @@ object BookkeeperDynamoDb {
   val DEFAULT_TABLE_PREFIX = "pramen"
 
   // Attribute names for bookkeeping table
-  val ATTR_TABLE_NAME = "tableName"
-  val ATTR_INFO_DATE = "infoDate"
-  val ATTR_INFO_DATE_SORT_KEY = "infoDateSortKey"  // Composite: "infoDate#jobFinished"
-  val ATTR_INFO_DATE_BEGIN = "infoDateBegin"
-  val ATTR_INFO_DATE_END = "infoDateEnd"
-  val ATTR_INPUT_RECORD_COUNT = "inputRecordCount"
-  val ATTR_OUTPUT_RECORD_COUNT = "outputRecordCount"
-  val ATTR_JOB_STARTED = "jobStarted"
-  val ATTR_JOB_FINISHED = "jobFinished"
-  val ATTR_BATCH_ID = "batchId"
-  val ATTR_APPENDED_RECORD_COUNT = "appendedRecordCount"
+  val ATTR_TABLE_NAME = "table_name"
+  val ATTR_INFO_DATE = "info_date"
+  val ATTR_INFO_DATE_SORT_KEY = "info_date_sort_key"  // Composite: "infoDate#jobFinished"
+  val ATTR_INFO_DATE_BEGIN = "info_date_begin"
+  val ATTR_INFO_DATE_END = "info_date_end"
+  val ATTR_INPUT_RECORD_COUNT = "input_record_count"
+  val ATTR_OUTPUT_RECORD_COUNT = "output_record_count"
+  val ATTR_JOB_STARTED = "job_started"
+  val ATTR_JOB_FINISHED = "job_finished"
+  val ATTR_BATCH_ID = "batch_id"
+  val ATTR_APPENDED_RECORD_COUNT = "appended_record_count"
 
   // Attribute names for schema table
-  val ATTR_SCHEMA_JSON = "schemaJson"
+  val ATTR_SCHEMA_JSON = "schema_json"
 
   val MODEL_VERSION = 1
 

@@ -555,15 +555,15 @@ object OffsetManagerDynamoDb {
   val DEFAULT_TABLE_PREFIX = "pramen"
 
   // Attribute names for offset table
-  val ATTR_PRAMEN_TABLE_NAME = "pramenTableName"
-  val ATTR_COMPOSITE_KEY = "compositeKey"  // Format: "infoDate#createdAtMilli"
-  val ATTR_INFO_DATE = "infoDate"
-  val ATTR_DATA_TYPE = "dataType"
-  val ATTR_MIN_OFFSET = "minOffset"
-  val ATTR_MAX_OFFSET = "maxOffset"
-  val ATTR_BATCH_ID = "batchId"
-  val ATTR_CREATED_AT = "createdAt"
-  val ATTR_COMMITTED_AT = "committedAt"
+  val ATTR_PRAMEN_TABLE_NAME = "pramen_table_name"
+  val ATTR_COMPOSITE_KEY = "composite_key"  // Format: "infoDate#createdAtMilli"
+  val ATTR_INFO_DATE = "info_date"
+  val ATTR_DATA_TYPE = "data_type"
+  val ATTR_MIN_OFFSET = "min_offset"
+  val ATTR_MAX_OFFSET = "max_offset"
+  val ATTR_BATCH_ID = "batch_id"
+  val ATTR_CREATED_AT = "created_at"
+  val ATTR_COMMITTED_AT = "committed_at"
 
   /**
     * Builder for creating OffsetManagerDynamoDb instances.

@@ -17,6 +17,8 @@
 package za.co.absa.pramen.core.config
 
 object Keys {
+  val PIPELINE_DEFINITION_ID = "pramen.pipeline.definition.id"
+
   val INFORMATION_DATE_COLUMN = "pramen.information.date.column"
   val INFORMATION_DATE_FORMAT_APP = "pramen.information.date.format"
 

@@ -16,7 +16,7 @@
 
 package za.co.absa.pramen.core.journal
 
-import za.co.absa.pramen.core.journal.model.TaskCompleted
+import za.co.absa.pramen.core.journal.model.{Execution, TaskCompleted}
 
 import java.time.Instant
 
@@ -27,6 +27,8 @@ trait Journal extends AutoCloseable {
 
   def addEntry(entry: TaskCompleted): Unit
 
+  def addPipelineEntry(execution: Execution): Unit
+
   def getEntries(from: Instant, to: Instant): Seq[TaskCompleted]
 
   override def close(): Unit = {}