updated

neuralmagic · rahul-tuli · Oct 22, 2024 · Oct 28, 2024 · Oct 30, 2024 · Oct 30, 2024
commit 13160765c0d5c0924a6bf5c4543f442d344cbc42
diff --git a/csrc/torch_bindings.cpp b/csrc/torch_bindings.cpp
@@ -323,24 +323,6 @@ TORCH_LIBRARY_EXPAND(TORCH_EXTENSION_NAME, ops) {
       "int pad_slot_id) -> ()");
   ops.impl("causal_conv1d_fwd", torch::kCUDA, &causal_conv1d_fwd);
 
-  ops.def("cslt_compress_fp8_semi_structured(Tensor! input) -> Tensor");
-  ops.impl("cslt_compress_fp8_semi_structured", torch::kCUDA,
-           &cslt_compress_fp8_semi_structured);
-
-  ops.def(
-      "cslt_mm_semi_structured(Tensor! compressed_A, Tensor! denseB,"
-      "float!? scale, Tensor!? bias) -> Tensor");
-  ops.impl("cslt_mm_semi_structured", torch::kCUDA, &cslt_mm_semi_structured);
-
-  ops.def(
-      "cslt_mm_fp8_semi_structured2(Tensor! compressed_A, Tensor! denseB,"
-      "float!? scale, Tensor!? bias) -> Tensor");
-  ops.impl("cslt_mm_fp8_semi_structured2", torch::kCUDA,
-           &cslt_mm_fp8_semi_structured2);
-
-  ops.def("cslt_clear_cache() -> ()");
-  ops.impl("cslt_clear_cache", &cslt_clear_cache);
-
 #endif
 
   // Quantized GEMM for GPTQ.

@@ -113,7 +113,6 @@ def apply_weights(self,
             bias=bias
         )
 
-
         # if not self.quantized:
         #     return semi_structured_dense_sparse_T_gemm(
         #         a_dense=x,