browser-use · ssseVennn · Apr 14, 2025 · Apr 14, 2025 · mrge-io · Apr 14, 2025
diff --git a/.env.example b/.env.example
@@ -30,6 +30,10 @@ UNBOUND_API_KEY=
 SiliconFLOW_ENDPOINT=https://api.siliconflow.cn/v1/
 SiliconFLOW_API_KEY=
 
+XINFERENCE_OPENAI_ENDPOINT=https://api.xinference.com/v1
+XINFERENCE_API_KEY=
+XINFERENCE_MODEL=
+
 # Set to false to disable anonymized telemetry
 ANONYMIZED_TELEMETRY=false
 

diff --git a/src/utils/utils.py b/src/utils/utils.py
@@ -24,7 +24,8 @@
     "google": "Google",
     "alibaba": "Alibaba",
     "moonshot": "MoonShot",
-    "unbound": "Unbound AI"
+    "unbound": "Unbound AI",
+    "xinference": "XInference",
 }
 
 
@@ -183,6 +184,27 @@ def get_llm_model(provider: str, **kwargs):
             model_name=kwargs.get("model_name", "Qwen/QwQ-32B"),
             temperature=kwargs.get("temperature", 0.0),
         )
+    elif provider == "xinference":
+        if not kwargs.get("base_url", ""):
+            base_url = os.getenv("XINFERENCE_OPENAI_ENDPOINT", "https://api.xinference.com/v1")
+        else:
+            base_url = kwargs.get("base_url")
+
+        if not kwargs.get("api_key", ""):
+            api_key = os.getenv("XINFERENCE_API_KEY", "")
+        else:
+            api_key = kwargs.get("api_key")
+
+        if not kwargs.get("model_name", ""):
+            model_name = os.getenv("XINFERENCE_MODEL", "qwen2.5-instruct")
+        else:
+            model_name = kwargs.get("model_name")
+        return ChatOpenAI(
+            model=model_name,
+            temperature=kwargs.get("temperature", 0.0),
+            base_url=base_url,
+            api_key=api_key,
+        )
     else:
         raise ValueError(f"Unsupported provider: {provider}")
 
@@ -234,6 +256,10 @@ def get_llm_model(provider: str, **kwargs):
         "Pro/THUDM/chatglm3-6b",
         "Pro/THUDM/glm-4-9b-chat",
     ],
+    "xinference": ["qwen2.5-instruct", "qwen2.5", "qwen2.5-coder", "qwen2.5-coder-instruct", "qwen2.5-instruct-1m",
+                   "qwen2.5-vl-instruct", "deepseek", "deepseek-chat", "deepseek-coder", "deepseek-coder-instruct",
+                   "deepseek-r1", "deepseek-v2", "deepseek-v2-chat", "deepseek-v2-chat-0628", "deepseek-v2.5",
+                   "deepseek-v3", "deepseek-vl-chat", "deepseek-vl2"]
 }