fix: make mlflow_logger import optional with no-op fallback

The strixhalo LLM worker uses py_executable pointing to the Docker image venv which doesn't have the updated ray-serve-apps package. Wrap all InferenceLogger imports in try/except and guard usage with None checks so apps degrade gracefully without MLflow logging.
2026-02-12 07:01:17 -05:00
parent 7ec2107e0c
commit 15e4b8afa3
5 changed files with 124 additions and 88 deletions
--- a/ray_serve/serve_reranker.py
+++ b/ray_serve/serve_reranker.py
@@ -9,7 +9,10 @@ from typing import Any

 from ray import serve

-from ray_serve.mlflow_logger import InferenceLogger
+try:
+    from ray_serve.mlflow_logger import InferenceLogger
+except ImportError:
+    InferenceLogger = None


@serve.deployment(name="RerankerDeployment", num_replicas=1)
@@ -62,15 +65,18 @@ class RerankerDeployment:
        print("Reranker model loaded successfully")

        # MLflow metrics
-        self._mlflow = InferenceLogger(
-            experiment_name="ray-serve-reranker",
-            run_name=f"reranker-{self.model_id.split('/')[-1]}",
-            tags={"model.name": self.model_id, "model.framework": "sentence-transformers", "device": self.device},
-            flush_every=10,
-        )
-        self._mlflow.initialize(
-            params={"model_id": self.model_id, "device": self.device, "use_ipex": str(self.use_ipex)}
-        )
+        if InferenceLogger is not None:
+            self._mlflow = InferenceLogger(
+                experiment_name="ray-serve-reranker",
+                run_name=f"reranker-{self.model_id.split('/')[-1]}",
+                tags={"model.name": self.model_id, "model.framework": "sentence-transformers", "device": self.device},
+                flush_every=10,
+            )
+            self._mlflow.initialize(
+                params={"model_id": self.model_id, "device": self.device, "use_ipex": str(self.use_ipex)}
+            )
+        else:
+            self._mlflow = None

    async def __call__(self, request: dict[str, Any]) -> dict[str, Any]:
        """
@@ -105,10 +111,11 @@ class RerankerDeployment:
                    }
                )

-            self._mlflow.log_request(
-                latency_s=time.time() - _start,
-                num_pairs=len(pairs),
-            )
+            if self._mlflow:
+                self._mlflow.log_request(
+                    latency_s=time.time() - _start,
+                    num_pairs=len(pairs),
+                )

            return {
                "object": "list",
@@ -153,12 +160,13 @@ class RerankerDeployment:
        results = results[:top_k]

        # Log to MLflow
-        self._mlflow.log_request(
-            latency_s=time.time() - _start,
-            num_pairs=len(pairs),
-            num_documents=len(documents),
-            top_k=top_k,
-        )
+        if self._mlflow:
+            self._mlflow.log_request(
+                latency_s=time.time() - _start,
+                num_pairs=len(pairs),
+                num_documents=len(documents),
+                top_k=top_k,
+            )

        return {
            "object": "list",