Refactor imatrix api, fix build shared libs

stduhpf · stduhpf · commit ae0fcc29603b · 2025-03-29T23:46:37.000+01:00
diff --git a/examples/cli/main.cpp b/examples/cli/main.cpp
@@ -22,10 +22,6 @@
 #define STB_IMAGE_RESIZE_STATIC
 #include "stb_image_resize.h"
 
-#define IMATRIX_IMPL
-#include "imatrix.hpp"
-static IMatrixCollector g_collector;
-
 const char* rng_type_to_str[] = {
     "std_default",
     "cuda",
@@ -663,7 +659,7 @@ void parse_args(int argc, const char** argv, SDParams& params) {
         }
     }
 
-    if (params.imatrix_out.size() > 0 && file_exists(params.imatrix_out)) {
+    if (params.imatrix_out.size() > 0 && std::ifstream(params.imatrix_out).good()) {
         // imatrix file already exists
         if (std::find(params.imatrix_in.begin(), params.imatrix_in.end(), params.imatrix_out) == params.imatrix_in.end()) {
             printf("\n IMPORTANT: imatrix file %s already exists, but wasn't found in the imatrix inputs.\n", params.imatrix_out.c_str());
@@ -823,10 +819,6 @@ void sd_log_cb(enum sd_log_level_t level, const char* log, void* data) {
     fflush(out_stream);
 }
 
-static bool collect_imatrix(struct ggml_tensor* t, bool ask, void* user_data) {
-    return g_collector.collect_imatrix(t, ask, user_data);
-}
-
 int main(int argc, const char* argv[]) {
     SDParams params;
 
@@ -840,13 +832,12 @@ int main(int argc, const char* argv[]) {
     }
 
     if (params.imatrix_out != "") {
-        sd_set_backend_eval_callback((sd_graph_eval_callback_t)collect_imatrix, &params);
+        enableImatrixCollection();
     }
     if (params.imatrix_out != "" || params.mode == CONVERT || params.wtype != SD_TYPE_COUNT) {
-        setConvertImatrixCollector((void*)&g_collector);
         for (const auto& in_file : params.imatrix_in) {
             printf("loading imatrix from '%s'\n", in_file.c_str());
-            if (!g_collector.load_imatrix(in_file.c_str())) {
+            if (!loadImatrix(in_file.c_str())) {
                 printf("Failed to load %s\n", in_file.c_str());
             }
         }
@@ -1165,7 +1156,7 @@ int main(int argc, const char* argv[]) {
         results[i].data = NULL;
     }
     if (params.imatrix_out != "") {
-        g_collector.save_imatrix(params.imatrix_out);
+        saveImatrix(params.imatrix_out.c_str());
     }
     free(results);
     free_sd_ctx(sd_ctx);
diff --git a/model.cpp b/model.cpp
@@ -29,7 +29,7 @@
 
 #define ST_HEADER_SIZE_LEN 8
 
-static IMatrixCollector* imatrix_collector = NULL;
+static IMatrixCollector imatrix_collector;
 
 uint64_t read_u64(uint8_t* buffer) {
     // little endian
@@ -1842,7 +1842,7 @@ bool ModelLoader::load_tensors(on_new_tensor_cb_t on_new_tensor_cb, ggml_backend
 
                     auto processed_name = convert_tensor_name(tensor_storage.name);
                     // LOG_DEBUG("%s",processed_name.c_str());
-                    std::vector<float> imatrix = imatrix_collector ? imatrix_collector->get_values(processed_name) : std::vector<float>{};
+                    std::vector<float> imatrix = imatrix_collector.get_values(processed_name);
 
                     convert_tensor((void*)read_buffer.data(), tensor_storage.type, dst_tensor->data,
                                    dst_tensor->type, (int)tensor_storage.nelements() / (int)tensor_storage.ne[0], (int)tensor_storage.ne[0], imatrix);
@@ -1869,7 +1869,7 @@ bool ModelLoader::load_tensors(on_new_tensor_cb_t on_new_tensor_cb, ggml_backend
                     // convert first, then copy to device memory
                     auto processed_name = convert_tensor_name(tensor_storage.name);
                     // LOG_DEBUG("%s",processed_name.c_str());
-                    std::vector<float> imatrix = imatrix_collector ? imatrix_collector->get_values(processed_name) : std::vector<float>{};
+                    std::vector<float> imatrix = imatrix_collector.get_values(processed_name);
 
                     convert_buffer.resize(ggml_nbytes(dst_tensor));
                     convert_tensor((void*)read_buffer.data(), tensor_storage.type,
@@ -2069,10 +2069,6 @@ int64_t ModelLoader::get_params_mem_size(ggml_backend_t backend, ggml_type type)
     return mem_size;
 }
 
-void setConvertImatrixCollector(void* collector) {
-    imatrix_collector = ((IMatrixCollector*)collector);
-}
-
 bool convert(const char* model_path, const char* clip_l_path, const char* clip_g_path, const char* t5xxl_path, const char* diffusion_model_path, const char* vae_path, const char* output_path, sd_type_t output_type) {
     ModelLoader model_loader;
 
@@ -2120,3 +2116,19 @@ bool convert(const char* model_path, const char* clip_l_path, const char* clip_g
     bool success = model_loader.save_to_gguf_file(output_path, (ggml_type)output_type);
     return success;
 }
+
+bool loadImatrix(const char* imatrix_path) {
+    return imatrix_collector.load_imatrix(imatrix_path);
+}
+void saveImatrix(const char* imatrix_path) {
+    imatrix_collector.save_imatrix(imatrix_path);
+}
+static bool collect_imatrix(struct ggml_tensor* t, bool ask, void* user_data) {
+    return imatrix_collector.collect_imatrix(t, ask, user_data);
+}
+void enableImatrixCollection() {
+    sd_set_backend_eval_callback((sd_graph_eval_callback_t)collect_imatrix, NULL);
+}
+void disableImatrixCollection() {
+    sd_set_backend_eval_callback(NULL, NULL);
+}
diff --git a/stable-diffusion.h b/stable-diffusion.h
@@ -230,7 +230,6 @@ SD_API void free_upscaler_ctx(upscaler_ctx_t* upscaler_ctx);
 
 SD_API sd_image_t upscale(upscaler_ctx_t* upscaler_ctx, sd_image_t input_image, uint32_t upscale_factor);
 
-SD_API void setConvertImatrixCollector(void * collector);
 SD_API bool convert(const char* model_path, const char* clip_l_path, const char* clip_g_path, const char* t5xxl_path, const char* diffusion_model_path, const char* vae_path, const char* output_path, enum sd_type_t output_type);
 
 SD_API uint8_t* preprocess_canny(uint8_t* img,
@@ -242,6 +241,11 @@ SD_API uint8_t* preprocess_canny(uint8_t* img,
                                  float strong,
                                  bool inverse);
 
+SD_API bool loadImatrix(const char * imatrix_path);
+SD_API void saveImatrix(const char * imatrix_path);
+SD_API void enableImatrixCollection();
+SD_API void disableImatrixCollection();
+
 #ifdef __cplusplus
 }
 #endif

Original file line number	Diff line number	Diff line change
`@@ -22,10 +22,6 @@`
`22`	`22`	`#define STB_IMAGE_RESIZE_STATIC`
`23`	`23`	`#include "stb_image_resize.h"`
`24`	`24`
`25`		`-#define IMATRIX_IMPL`
`26`		`-#include "imatrix.hpp"`
`27`		`-static IMatrixCollector g_collector;`
`28`		`-`
`29`	`25`	`const char* rng_type_to_str[] = {`
`30`	`26`	`"std_default",`
`31`	`27`	`"cuda",`
`@@ -663,7 +659,7 @@ void parse_args(int argc, const char** argv, SDParams& params) {`
`663`	`659`	`}`
`664`	`660`	`}`
`665`	`661`
`666`		`- if (params.imatrix_out.size() > 0 && file_exists(params.imatrix_out)) {`
	`662`	`+ if (params.imatrix_out.size() > 0 && std::ifstream(params.imatrix_out).good()) {`
`667`	`663`	`// imatrix file already exists`
`668`	`664`	`if (std::find(params.imatrix_in.begin(), params.imatrix_in.end(), params.imatrix_out) == params.imatrix_in.end()) {`
`669`	`665`	`printf("\n IMPORTANT: imatrix file %s already exists, but wasn't found in the imatrix inputs.\n", params.imatrix_out.c_str());`
`@@ -823,10 +819,6 @@ void sd_log_cb(enum sd_log_level_t level, const char* log, void* data) {`
`823`	`819`	`fflush(out_stream);`
`824`	`820`	`}`
`825`	`821`
`826`		`-static bool collect_imatrix(struct ggml_tensor* t, bool ask, void* user_data) {`
`827`		`- return g_collector.collect_imatrix(t, ask, user_data);`
`828`		`-}`
`829`		`-`
`830`	`822`	`int main(int argc, const char* argv[]) {`
`831`	`823`	`SDParams params;`
`832`	`824`
`@@ -840,13 +832,12 @@ int main(int argc, const char* argv[]) {`
`840`	`832`	`}`
`841`	`833`
`842`	`834`	`if (params.imatrix_out != "") {`
`843`		`- sd_set_backend_eval_callback((sd_graph_eval_callback_t)collect_imatrix, &params);`
	`835`	`+ enableImatrixCollection();`
`844`	`836`	`}`
`845`	`837`	`if (params.imatrix_out != "" \|\| params.mode == CONVERT \|\| params.wtype != SD_TYPE_COUNT) {`
`846`		`- setConvertImatrixCollector((void*)&g_collector);`
`847`	`838`	`for (const auto& in_file : params.imatrix_in) {`
`848`	`839`	`printf("loading imatrix from '%s'\n", in_file.c_str());`
`849`		`- if (!g_collector.load_imatrix(in_file.c_str())) {`
	`840`	`+ if (!loadImatrix(in_file.c_str())) {`
`850`	`841`	`printf("Failed to load %s\n", in_file.c_str());`
`851`	`842`	`}`
`852`	`843`	`}`
`@@ -1165,7 +1156,7 @@ int main(int argc, const char* argv[]) {`
`1165`	`1156`	`results[i].data = NULL;`
`1166`	`1157`	`}`
`1167`	`1158`	`if (params.imatrix_out != "") {`
`1168`		`- g_collector.save_imatrix(params.imatrix_out);`
	`1159`	`+ saveImatrix(params.imatrix_out.c_str());`
`1169`	`1160`	`}`
`1170`	`1161`	`free(results);`
`1171`	`1162`	`free_sd_ctx(sd_ctx);`