IntelPython · ndgrigorian · Jan 14, 2025 · Feb 22, 2025
@@ -46,10 +46,6 @@
 
 #include "integer_advanced_indexing.hpp"
 
-#define INDEXING_MODES 2
-#define WRAP_MODE 0
-#define CLIP_MODE 1
-
 namespace dpctl
 {
 namespace tensor
@@ -62,11 +58,15 @@ namespace td_ns = dpctl::tensor::type_dispatch;
 using dpctl::tensor::kernels::indexing::put_fn_ptr_t;
 using dpctl::tensor::kernels::indexing::take_fn_ptr_t;
 
-static take_fn_ptr_t take_dispatch_table[INDEXING_MODES][td_ns::num_types]
-                                        [td_ns::num_types];
+static take_fn_ptr_t take_wrap_dispatch_table[td_ns::num_types]
+                                             [td_ns::num_types];
+
+static take_fn_ptr_t take_clip_dispatch_table[td_ns::num_types]
+                                             [td_ns::num_types];
+
+static put_fn_ptr_t put_wrap_dispatch_table[td_ns::num_types][td_ns::num_types];
 
-static put_fn_ptr_t put_dispatch_table[INDEXING_MODES][td_ns::num_types]
-                                      [td_ns::num_types];
+static put_fn_ptr_t put_clip_dispatch_table[td_ns::num_types][td_ns::num_types];
 
 namespace py = pybind11;
 
@@ -244,13 +244,13 @@ std::vector<dpctl::tensor::usm_ndarray> parse_py_ind(const sycl::queue &q,
 }
 
 std::pair<sycl::event, sycl::event>
-usm_ndarray_take(const dpctl::tensor::usm_ndarray &src,
-                 const py::object &py_ind,
-                 const dpctl::tensor::usm_ndarray &dst,
-                 int axis_start,
-                 std::uint8_t mode,
-                 sycl::queue &exec_q,
-                 const std::vector<sycl::event> &depends)
+py_take(const dpctl::tensor::usm_ndarray &src,
+        const py::object &py_ind,
+        const dpctl::tensor::usm_ndarray &dst,
+        int axis_start,
+        std::uint8_t mode,
+        sycl::queue &exec_q,
+        const std::vector<sycl::event> &depends)
 {
     std::vector<dpctl::tensor::usm_ndarray> ind = parse_py_ind(exec_q, py_ind);
 
@@ -486,7 +486,8 @@ usm_ndarray_take(const dpctl::tensor::usm_ndarray &src,
                     std::end(pack_deps));
     all_deps.insert(std::end(all_deps), std::begin(depends), std::end(depends));
 
-    auto fn = take_dispatch_table[mode][src_type_id][ind_type_id];
+    auto fn = mode ? take_clip_dispatch_table[src_type_id][ind_type_id]
+                   : take_wrap_dispatch_table[src_type_id][ind_type_id];
 
     if (fn == nullptr) {
         sycl::event::wait(host_task_events);
@@ -515,13 +516,13 @@ usm_ndarray_take(const dpctl::tensor::usm_ndarray &src,
 }
 
 std::pair<sycl::event, sycl::event>
-usm_ndarray_put(const dpctl::tensor::usm_ndarray &dst,
-                const py::object &py_ind,
-                const dpctl::tensor::usm_ndarray &val,
-                int axis_start,
-                std::uint8_t mode,
-                sycl::queue &exec_q,
-                const std::vector<sycl::event> &depends)
+py_put(const dpctl::tensor::usm_ndarray &dst,
+       const py::object &py_ind,
+       const dpctl::tensor::usm_ndarray &val,
+       int axis_start,
+       std::uint8_t mode,
+       sycl::queue &exec_q,
+       const std::vector<sycl::event> &depends)
 {
     std::vector<dpctl::tensor::usm_ndarray> ind = parse_py_ind(exec_q, py_ind);
     int k = ind.size();
@@ -755,7 +756,8 @@ usm_ndarray_put(const dpctl::tensor::usm_ndarray &dst,
                     std::end(pack_deps));
     all_deps.insert(std::end(all_deps), std::begin(depends), std::end(depends));
 
-    auto fn = put_dispatch_table[mode][dst_type_id][ind_type_id];
+    auto fn = mode ? put_clip_dispatch_table[dst_type_id][ind_type_id]
+                   : put_wrap_dispatch_table[dst_type_id][ind_type_id];
 
     if (fn == nullptr) {
         sycl::event::wait(host_task_events);
@@ -790,20 +792,20 @@ void init_advanced_indexing_dispatch_tables(void)
     using dpctl::tensor::kernels::indexing::TakeClipFactory;
     DispatchTableBuilder<take_fn_ptr_t, TakeClipFactory, num_types>
         dtb_takeclip;
-    dtb_takeclip.populate_dispatch_table(take_dispatch_table[CLIP_MODE]);
+    dtb_takeclip.populate_dispatch_table(take_clip_dispatch_table);
 
     using dpctl::tensor::kernels::indexing::TakeWrapFactory;
     DispatchTableBuilder<take_fn_ptr_t, TakeWrapFactory, num_types>
         dtb_takewrap;
-    dtb_takewrap.populate_dispatch_table(take_dispatch_table[WRAP_MODE]);
+    dtb_takewrap.populate_dispatch_table(take_wrap_dispatch_table);
 
     using dpctl::tensor::kernels::indexing::PutClipFactory;
     DispatchTableBuilder<put_fn_ptr_t, PutClipFactory, num_types> dtb_putclip;
-    dtb_putclip.populate_dispatch_table(put_dispatch_table[CLIP_MODE]);
+    dtb_putclip.populate_dispatch_table(put_clip_dispatch_table);
 
     using dpctl::tensor::kernels::indexing::PutWrapFactory;
     DispatchTableBuilder<put_fn_ptr_t, PutWrapFactory, num_types> dtb_putwrap;
-    dtb_putwrap.populate_dispatch_table(put_dispatch_table[WRAP_MODE]);
+    dtb_putwrap.populate_dispatch_table(put_wrap_dispatch_table);
 }
 
 } // namespace py_internal

@@ -39,22 +39,22 @@ namespace py_internal
 {
 
 extern std::pair<sycl::event, sycl::event>
-usm_ndarray_take(const dpctl::tensor::usm_ndarray &,
-                 const py::object &,
-                 const dpctl::tensor::usm_ndarray &,
-                 int,
-                 std::uint8_t,
-                 sycl::queue &,
-                 const std::vector<sycl::event> & = {});
+py_take(const dpctl::tensor::usm_ndarray &,
+        const py::object &,
+        const dpctl::tensor::usm_ndarray &,
+        int,
+        std::uint8_t,
+        sycl::queue &,
+        const std::vector<sycl::event> & = {});
 
 extern std::pair<sycl::event, sycl::event>
-usm_ndarray_put(const dpctl::tensor::usm_ndarray &,
-                const py::object &,
-                const dpctl::tensor::usm_ndarray &,
-                int,
-                std::uint8_t,
-                sycl::queue &,
-                const std::vector<sycl::event> & = {});
+py_put(const dpctl::tensor::usm_ndarray &,
+       const py::object &,
+       const dpctl::tensor::usm_ndarray &,
+       int,
+       std::uint8_t,
+       sycl::queue &,
+       const std::vector<sycl::event> & = {});
 
 extern void init_advanced_indexing_dispatch_tables(void);
 

@@ -101,8 +101,8 @@ using dpctl::tensor::py_internal::usm_ndarray_full;
 using dpctl::tensor::py_internal::usm_ndarray_zeros;
 
 /* ============== Advanced Indexing ============= */
-using dpctl::tensor::py_internal::usm_ndarray_put;
-using dpctl::tensor::py_internal::usm_ndarray_take;
+using dpctl::tensor::py_internal::py_put;
+using dpctl::tensor::py_internal::py_take;
 
 using dpctl::tensor::py_internal::py_extract;
 using dpctl::tensor::py_internal::py_mask_positions;
@@ -324,7 +324,7 @@ PYBIND11_MODULE(_tensor_impl, m)
           py::arg("fill_value"), py::arg("dst"), py::arg("sycl_queue"),
           py::arg("depends") = py::list());
 
-    m.def("_take", &usm_ndarray_take,
+    m.def("_take", &py_take,
           "Takes elements at usm_ndarray indices `ind` and axes starting "
           "at axis `axis_start` from array `src` and copies them "
           "into usm_ndarray `dst` synchronously."
@@ -333,7 +333,7 @@ PYBIND11_MODULE(_tensor_impl, m)
           py::arg("mode"), py::arg("sycl_queue"),
           py::arg("depends") = py::list());
 
-    m.def("_put", &usm_ndarray_put,
+    m.def("_put", &py_put,
           "Puts elements at usm_ndarray indices `ind` and axes starting "
           "at axis `axis_start` into array `dst` from "
           "usm_ndarray `val` synchronously."