Refactor genai (#22752)

* Switch to a feature-based roles so it is easier to choose models for different tasks * Fallback and try llama-swap format * List models supported by provider * Cleanup * Add frontend * Improve model loading * Make it possible to update genai without restarting * Cleanup * Cleanup * Mypy
2026-04-05 14:47:40 +03:00 · 2026-04-03 17:13:52 -06:00 · 2026-04-03 17:13:52 -06:00 · 9cb76d0bd9
commit 9cb76d0bd9
parent bb77a01779
20 changed files with 363 additions and 140 deletions
--- a/frigate/api/app.py
+++ b/frigate/api/app.py
@ -125,6 +125,16 @@ def metrics(request: Request):
    return Response(content=content, media_type=content_type)


+@router.get(
+    "/genai/models",
+    dependencies=[Depends(allow_any_authenticated())],
+    summary="List available GenAI models",
+    description="Returns available models for each configured GenAI provider.",
+)
+def genai_models(request: Request):
+    return JSONResponse(content=request.app.genai_manager.list_models())
+
+
@router.get("/config", dependencies=[Depends(allow_any_authenticated())])
 def config(request: Request):
    config_obj: FrigateConfig = request.app.frigate_config
--- a/frigate/api/chat.py
+++ b/frigate/api/chat.py
@ -520,45 +520,14 @@ async def _execute_get_live_context(
            "detections": list(tracked_objects_dict.values()),
        }

-        # Grab live frame and handle based on provider configuration
+        # Grab live frame when the chat model supports vision
        image_url = await _get_live_frame_image_url(request, camera, allowed_cameras)
        if image_url:
-            genai_manager = request.app.genai_manager
-            if genai_manager.tool_client is genai_manager.vision_client:
-                # Same provider handles both roles — pass image URL so it can
-                # be injected as a user message (images can't be in tool results)
+            chat_client = request.app.genai_manager.chat_client
+            if chat_client is not None and chat_client.supports_vision:
+                # Pass image URL so it can be injected as a user message
+                # (images can't be in tool results)
                result["_image_url"] = image_url
-            elif genai_manager.vision_client is not None:
-                # Separate vision provider — have it describe the image,
-                # providing detection context so it knows what to focus on
-                frame_bytes = _decode_data_url(image_url)
-                if frame_bytes:
-                    detections = result.get("detections", [])
-                    if detections:
-                        detection_lines = []
-                        for d in detections:
-                            parts = [d.get("label", "unknown")]
-                            if d.get("sub_label"):
-                                parts.append(f"({d['sub_label']})")
-                            if d.get("zones"):
-                                parts.append(f"in {', '.join(d['zones'])}")
-                            detection_lines.append(" ".join(parts))
-                        context = (
-                            "The following objects are currently being tracked: "
-                            + "; ".join(detection_lines)
-                            + "."
-                        )
-                    else:
-                        context = "No objects are currently being tracked."
-
-                    description = genai_manager.vision_client._send(
-                        f"Describe what you see in this security camera image. "
-                        f"{context} Focus on the scene, any visible activity, "
-                        f"and details about the tracked objects.",
-                        [frame_bytes],
-                    )
-                    if description:
-                        result["image_description"] = description

        return result

@ -609,17 +578,6 @@ async def _get_live_frame_image_url(
        return None


-def _decode_data_url(data_url: str) -> Optional[bytes]:
-    """Decode a base64 data URL to raw bytes."""
-    try:
-        # Format: data:image/jpeg;base64,<data>
-        _, encoded = data_url.split(",", 1)
-        return base64.b64decode(encoded)
-    except (ValueError, Exception) as e:
-        logger.debug("Failed to decode data URL: %s", e)
-        return None
-
-
 async def _execute_set_camera_state(
    request: Request,
    arguments: Dict[str, Any],
@ -734,9 +692,9 @@ async def _execute_start_camera_watch(
    await require_camera_access(camera, request=request)

    genai_manager = request.app.genai_manager
-    vision_client = genai_manager.vision_client or genai_manager.tool_client
-    if vision_client is None:
-        return {"error": "No vision/GenAI provider configured."}
+    chat_client = genai_manager.chat_client
+    if chat_client is None or not chat_client.supports_vision:
+        return {"error": "VLM watch requires a chat model with vision support."}

    try:
        job_id = start_vlm_watch_job(
@ -1070,7 +1028,7 @@ async def chat_completion(
    6. Repeats until final answer
    7. Returns response to user
    """
-    genai_client = request.app.genai_manager.tool_client
+    genai_client = request.app.genai_manager.chat_client
    if not genai_client:
        return JSONResponse(
            content={
@ -1381,12 +1339,12 @@ async def start_vlm_monitor(

    await require_camera_access(body.camera, request=request)

-    vision_client = genai_manager.vision_client or genai_manager.tool_client
-    if vision_client is None:
+    chat_client = genai_manager.chat_client
+    if chat_client is None or not chat_client.supports_vision:
        return JSONResponse(
            content={
                "success": False,
-                "message": "No vision/GenAI provider configured.",
+                "message": "VLM watch requires a chat model with vision support.",
            },
            status_code=400,
        )
--- a/frigate/api/review.py
+++ b/frigate/api/review.py
@ -746,7 +746,7 @@ async def set_not_reviewed(
    description="Use GenAI to summarize review items over a period of time.",
 )
 def generate_review_summary(request: Request, start_ts: float, end_ts: float):
-    if not request.app.genai_manager.vision_client:
+    if not request.app.genai_manager.description_client:
        return JSONResponse(
            content=(
                {
--- a/frigate/config/camera/genai.py
+++ b/frigate/config/camera/genai.py
@ -18,8 +18,8 @@ class GenAIProviderEnum(str, Enum):


 class GenAIRoleEnum(str, Enum):
-    tools = "tools"
-    vision = "vision"
+    chat = "chat"
+    descriptions = "descriptions"
    embeddings = "embeddings"


@ -49,11 +49,11 @@ class GenAIConfig(FrigateBaseModel):
    roles: list[GenAIRoleEnum] = Field(
        default_factory=lambda: [
            GenAIRoleEnum.embeddings,
-            GenAIRoleEnum.vision,
-            GenAIRoleEnum.tools,
+            GenAIRoleEnum.descriptions,
+            GenAIRoleEnum.chat,
        ],
        title="Roles",
-        description="GenAI roles (tools, vision, embeddings); one provider per role.",
+        description="GenAI roles (chat, descriptions, embeddings); one provider per role.",
    )
    provider_options: dict[str, Any] = Field(
        default={},
--- a/frigate/data_processing/post/object_descriptions.py
+++ b/frigate/data_processing/post/object_descriptions.py
@ -16,7 +16,7 @@ from frigate.config import CameraConfig, FrigateConfig
 from frigate.const import CLIPS_DIR, UPDATE_EVENT_DESCRIPTION
 from frigate.data_processing.post.semantic_trigger import SemanticTriggerProcessor
 from frigate.data_processing.types import PostProcessDataEnum
-from frigate.genai import GenAIClient
+from frigate.genai.manager import GenAIClientManager
 from frigate.models import Event
 from frigate.types import TrackedObjectUpdateTypesEnum
 from frigate.util.builtin import EventsPerSecond, InferenceSpeed
@ -41,7 +41,7 @@ class ObjectDescriptionProcessor(PostProcessorApi):
        embeddings: "Embeddings",
        requestor: InterProcessRequestor,
        metrics: DataProcessorMetrics,
-        client: GenAIClient,
+        genai_manager: GenAIClientManager,
        semantic_trigger_processor: SemanticTriggerProcessor | None,
    ):
        super().__init__(config, metrics, None)
@ -49,7 +49,7 @@ class ObjectDescriptionProcessor(PostProcessorApi):
        self.embeddings = embeddings
        self.requestor = requestor
        self.metrics = metrics
-        self.genai_client = client
+        self.genai_manager = genai_manager
        self.semantic_trigger_processor = semantic_trigger_processor
        self.tracked_events: dict[str, list[Any]] = {}
        self.early_request_sent: dict[str, bool] = {}
@ -198,6 +198,9 @@ class ObjectDescriptionProcessor(PostProcessorApi):
        if data_type != PostProcessDataEnum.tracked_object:
            return

+        if self.genai_manager.description_client is None:
+            return
+
        state: str | None = frame_data.get("state", None)

        if state is not None:
@ -329,7 +332,12 @@ class ObjectDescriptionProcessor(PostProcessorApi):
        """Embed the description for an event."""
        start = datetime.datetime.now().timestamp()
        camera_config = self.config.cameras[str(event.camera)]
-        description = self.genai_client.generate_object_description(
+        client = self.genai_manager.description_client
+
+        if client is None:
+            return
+
+        description = client.generate_object_description(
            camera_config, thumbnails, event
        )

--- a/frigate/data_processing/post/review_descriptions.py
+++ b/frigate/data_processing/post/review_descriptions.py
@ -22,6 +22,7 @@ from frigate.config.camera.review import GenAIReviewConfig, ImageSourceEnum
 from frigate.const import CACHE_DIR, CLIPS_DIR, UPDATE_REVIEW_DESCRIPTION
 from frigate.data_processing.types import PostProcessDataEnum
 from frigate.genai import GenAIClient
+from frigate.genai.manager import GenAIClientManager
 from frigate.models import Recordings, ReviewSegment
 from frigate.util.builtin import EventsPerSecond, InferenceSpeed
 from frigate.util.image import get_image_from_recording
@ -41,12 +42,12 @@ class ReviewDescriptionProcessor(PostProcessorApi):
        config: FrigateConfig,
        requestor: InterProcessRequestor,
        metrics: DataProcessorMetrics,
-        client: GenAIClient,
+        genai_manager: GenAIClientManager,
    ):
        super().__init__(config, metrics, None)
        self.requestor = requestor
        self.metrics = metrics
-        self.genai_client = client
+        self.genai_manager = genai_manager
        self.review_desc_speed = InferenceSpeed(self.metrics.review_desc_speed)
        self.review_desc_dps = EventsPerSecond()
        self.review_desc_dps.start()
@ -63,7 +64,12 @@ class ReviewDescriptionProcessor(PostProcessorApi):
        Estimates ~1 token per 1250 pixels. Targets 98% context utilization with safety margin.
        Capped at 20 frames.
        """
-        context_size = self.genai_client.get_context_size()
+        client = self.genai_manager.description_client
+
+        if client is None:
+            return 3
+
+        context_size = client.get_context_size()
        camera_config = self.config.cameras[camera]

        detect_width = camera_config.detect.width
@ -111,6 +117,9 @@ class ReviewDescriptionProcessor(PostProcessorApi):
        if data_type != PostProcessDataEnum.review:
            return

+        if self.genai_manager.description_client is None:
+            return
+
        camera = data["after"]["camera"]
        camera_config = self.config.cameras[camera]

@ -200,7 +209,7 @@ class ReviewDescriptionProcessor(PostProcessorApi):
                target=run_analysis,
                args=(
                    self.requestor,
-                    self.genai_client,
+                    self.genai_manager.description_client,
                    self.review_desc_speed,
                    camera_config,
                    final_data,
@ -316,7 +325,12 @@ class ReviewDescriptionProcessor(PostProcessorApi):
                    os.path.join(CLIPS_DIR, "genai-requests", f"{start_ts}-{end_ts}")
                ).mkdir(parents=True, exist_ok=True)

-            return self.genai_client.generate_review_summary(
+            client = self.genai_manager.description_client
+
+            if client is None:
+                return None
+
+            return client.generate_review_summary(
                start_ts,
                end_ts,
                events_with_context,
--- a/frigate/embeddings/maintainer.py
+++ b/frigate/embeddings/maintainer.py
@ -202,15 +202,13 @@ class EmbeddingMaintainer(threading.Thread):
        # post processors
        self.post_processors: list[PostProcessorApi] = []

-        if self.genai_manager.vision_client is not None and any(
-            c.review.genai.enabled_in_config for c in self.config.cameras.values()
-        ):
+        if any(c.review.genai.enabled_in_config for c in self.config.cameras.values()):
            self.post_processors.append(
                ReviewDescriptionProcessor(
                    self.config,
                    self.requestor,
                    self.metrics,
-                    self.genai_manager.vision_client,
+                    self.genai_manager,
                )
            )

@ -248,16 +246,14 @@ class EmbeddingMaintainer(threading.Thread):
            )
            self.post_processors.append(semantic_trigger_processor)

-        if self.genai_manager.vision_client is not None and any(
-            c.objects.genai.enabled_in_config for c in self.config.cameras.values()
-        ):
+        if any(c.objects.genai.enabled_in_config for c in self.config.cameras.values()):
            self.post_processors.append(
                ObjectDescriptionProcessor(
                    self.config,
                    self.embeddings,
                    self.requestor,
                    self.metrics,
-                    self.genai_manager.vision_client,
+                    self.genai_manager,
                    semantic_trigger_processor,
                )
            )
--- a/frigate/genai/init.py
+++ b/frigate/genai/init.py
@ -320,6 +320,22 @@ Guidelines:
        """Submit a request to the provider."""
        return None

+    @property
+    def supports_vision(self) -> bool:
+        """Whether the model supports vision/image input.
+
+        Defaults to True for cloud providers. Providers that can detect
+        capability at runtime (e.g. llama.cpp) should override this.
+        """
+        return True
+
+    def list_models(self) -> list[str]:
+        """Return the list of model names available from this provider.
+
+        Providers should override this to query their backend.
+        """
+        return []
+
    def get_context_size(self) -> int:
        """Get the context window size for this provider in tokens."""
        return 4096
--- a/frigate/genai/azure-openai.py
+++ b/frigate/genai/azure-openai.py
@ -82,6 +82,14 @@ class OpenAIClient(GenAIClient):
            return str(result.choices[0].message.content.strip())
        return None

+    def list_models(self) -> list[str]:
+        """Return available model IDs from Azure OpenAI."""
+        try:
+            return sorted(m.id for m in self.provider.models.list().data)
+        except Exception as e:
+            logger.warning("Failed to list Azure OpenAI models: %s", e)
+            return []
+
    def get_context_size(self) -> int:
        """Get the context window size for Azure OpenAI."""
        return 128000
--- a/frigate/genai/gemini.py
+++ b/frigate/genai/gemini.py
@ -87,6 +87,14 @@ class GeminiClient(GenAIClient):
            return None
        return description

+    def list_models(self) -> list[str]:
+        """Return available model names from Gemini."""
+        try:
+            return sorted(m.name or "" for m in self.provider.models.list())
+        except Exception as e:
+            logger.warning("Failed to list Gemini models: %s", e)
+            return []
+
    def get_context_size(self) -> int:
        """Get the context window size for Gemini."""
        # Gemini Pro Vision has a 1M token context window
--- a/frigate/genai/llama_cpp.py
+++ b/frigate/genai/llama_cpp.py
@ -101,15 +101,26 @@ class LlamaCppClient(GenAIClient):
                e,
            )

-        # Query /props for context size, modalities, and tool support
+        # Query /props for context size, modalities, and tool support.
+        # The standard /props?model=<name> endpoint works with llama-server.
+        # If it fails, try the llama-swap per-model passthrough endpoint which
+        # returns props for a specific model without requiring it to be loaded.
        try:
-            response = requests.get(
-                f"{base_url}/props",
-                params={"model": configured_model},
-                timeout=10,
-            )
-            response.raise_for_status()
-            props = response.json()
+            try:
+                response = requests.get(
+                    f"{base_url}/props",
+                    params={"model": configured_model},
+                    timeout=10,
+                )
+                response.raise_for_status()
+                props = response.json()
+            except Exception:
+                response = requests.get(
+                    f"{base_url}/upstream/{configured_model}/props",
+                    timeout=10,
+                )
+                response.raise_for_status()
+                props = response.json()

            # Context size from server runtime config
            default_settings = props.get("default_generation_settings", {})
@ -126,7 +137,7 @@ class LlamaCppClient(GenAIClient):
            chat_caps = props.get("chat_template_caps", {})
            self._supports_tools = chat_caps.get("supports_tools", False)

-            logger.debug(
+            logger.info(
                "llama.cpp model '%s' initialized — context: %s, vision: %s, audio: %s, tools: %s",
                configured_model,
                self._context_size or "unknown",
@ -225,6 +236,23 @@ class LlamaCppClient(GenAIClient):
        """Whether the loaded model supports tool/function calling."""
        return self._supports_tools

+    def list_models(self) -> list[str]:
+        """Return available model IDs from the llama.cpp server."""
+        if self.provider is None:
+            return []
+        try:
+            response = requests.get(f"{self.provider}/v1/models", timeout=10)
+            response.raise_for_status()
+            models = []
+            for m in response.json().get("data", []):
+                models.append(m.get("id", "unknown"))
+                for alias in m.get("aliases", []):
+                    models.append(alias)
+            return sorted(models)
+        except Exception as e:
+            logger.warning("Failed to list llama.cpp models: %s", e)
+            return []
+
    def get_context_size(self) -> int:
        """Get the context window size for llama.cpp.

--- a/frigate/genai/manager.py
+++ b/frigate/genai/manager.py
@ -1,15 +1,15 @@
 """GenAI client manager for Frigate.

-Manages GenAI provider clients from Frigate config. Configuration is read only
-in _update_config(); no other code should read config.genai. Exposes clients
-by role: tool_client, vision_client, embeddings_client.
+Manages GenAI provider clients from Frigate config. Clients are created lazily
+on first access so that providers whose roles are never used (e.g. chat when
+no chat feature is active) are never initialized.
 """

 import logging
 from typing import TYPE_CHECKING, Optional

 from frigate.config import FrigateConfig
-from frigate.config.camera.genai import GenAIRoleEnum
+from frigate.config.camera.genai import GenAIConfig, GenAIRoleEnum

 if TYPE_CHECKING:
    from frigate.genai import GenAIClient
@ -21,68 +21,98 @@ class GenAIClientManager:
    """Manages GenAI provider clients from Frigate config."""

    def __init__(self, config: FrigateConfig) -> None:
-        self._tool_client: Optional[GenAIClient] = None
-        self._vision_client: Optional[GenAIClient] = None
-        self._embeddings_client: Optional[GenAIClient] = None
+        self._configs: dict[str, GenAIConfig] = {}
+        self._role_map: dict[GenAIRoleEnum, str] = {}
+        self._clients: dict[str, "GenAIClient"] = {}
        self.update_config(config)

    def update_config(self, config: FrigateConfig) -> None:
-        """Build role clients from current Frigate config.genai.
+        """Store provider configs and build the role→name mapping.

        Called from __init__ and can be called again when config is reloaded.
-        Each role (tools, vision, embeddings) gets the client for the provider
-        that has that role in its roles list.
+        Clients are not created here; they are instantiated lazily on first
+        access via a role property or list_models().
        """
        from frigate.genai import PROVIDERS, load_providers

-        self._tool_client = None
-        self._vision_client = None
-        self._embeddings_client = None
+        self._configs = {}
+        self._role_map = {}
+        self._clients = {}

        if not config.genai:
            return

        load_providers()

-        for _name, genai_cfg in config.genai.items():
+        for name, genai_cfg in config.genai.items():
            if not genai_cfg.provider:
                continue
-            provider_cls = PROVIDERS.get(genai_cfg.provider)
-            if not provider_cls:
+            if genai_cfg.provider not in PROVIDERS:
                logger.warning(
                    "Unknown GenAI provider %s in config, skipping.",
                    genai_cfg.provider,
                )
                continue
-            try:
-                client = provider_cls(genai_cfg)
-            except Exception as e:
-                logger.exception(
-                    "Failed to create GenAI client for provider %s: %s",
-                    genai_cfg.provider,
-                    e,
-                )
-                continue
+
+            self._configs[name] = genai_cfg

            for role in genai_cfg.roles:
-                if role == GenAIRoleEnum.tools:
-                    self._tool_client = client
-                elif role == GenAIRoleEnum.vision:
-                    self._vision_client = client
-                elif role == GenAIRoleEnum.embeddings:
-                    self._embeddings_client = client
+                self._role_map[role] = name
+
+    def _get_client(self, name: str) -> "Optional[GenAIClient]":
+        """Return the client for *name*, creating it on first access."""
+        if name in self._clients:
+            return self._clients[name]
+
+        from frigate.genai import PROVIDERS
+
+        genai_cfg = self._configs.get(name)
+        if not genai_cfg:
+            return None
+
+        if not genai_cfg.provider:
+            return None
+
+        provider_cls = PROVIDERS.get(genai_cfg.provider)
+        if not provider_cls:
+            return None
+
+        try:
+            client: "GenAIClient" = provider_cls(genai_cfg)
+        except Exception as e:
+            logger.exception(
+                "Failed to create GenAI client for provider %s: %s",
+                genai_cfg.provider,
+                e,
+            )
+            return None
+
+        self._clients[name] = client
+        return client

    @property
-    def tool_client(self) -> "Optional[GenAIClient]":
-        """Client configured for the tools role (e.g. chat with function calling)."""
-        return self._tool_client
+    def chat_client(self) -> "Optional[GenAIClient]":
+        """Client configured for the chat role (e.g. chat with function calling)."""
+        name = self._role_map.get(GenAIRoleEnum.chat)
+        return self._get_client(name) if name else None

    @property
-    def vision_client(self) -> "Optional[GenAIClient]":
-        """Client configured for the vision role (e.g. review descriptions, object descriptions)."""
-        return self._vision_client
+    def description_client(self) -> "Optional[GenAIClient]":
+        """Client configured for the descriptions role (e.g. review descriptions, object descriptions)."""
+        name = self._role_map.get(GenAIRoleEnum.descriptions)
+        return self._get_client(name) if name else None

    @property
    def embeddings_client(self) -> "Optional[GenAIClient]":
        """Client configured for the embeddings role."""
-        return self._embeddings_client
+        name = self._role_map.get(GenAIRoleEnum.embeddings)
+        return self._get_client(name) if name else None
+
+    def list_models(self) -> dict[str, list[str]]:
+        """Return available models keyed by config entry name."""
+        result: dict[str, list[str]] = {}
+        for name in self._configs:
+            client = self._get_client(name)
+            if client:
+                result[name] = client.list_models()
+        return result
--- a/frigate/genai/ollama.py
+++ b/frigate/genai/ollama.py
@ -132,6 +132,19 @@ class OllamaClient(GenAIClient):
            logger.warning("Ollama returned an error: %s", str(e))
            return None

+    def list_models(self) -> list[str]:
+        """Return available model names from the Ollama server."""
+        if self.provider is None:
+            return []
+        try:
+            response = self.provider.list()
+            return sorted(
+                m.get("name", m.get("model", "")) for m in response.get("models", [])
+            )
+        except Exception as e:
+            logger.warning("Failed to list Ollama models: %s", e)
+            return []
+
    def get_context_size(self) -> int:
        """Get the context window size for Ollama."""
        return int(
--- a/frigate/genai/openai.py
+++ b/frigate/genai/openai.py
@ -86,6 +86,14 @@ class OpenAIClient(GenAIClient):
            logger.warning("OpenAI returned an error: %s", str(e))
            return None

+    def list_models(self) -> list[str]:
+        """Return available model IDs from the OpenAI-compatible API."""
+        try:
+            return sorted(m.id for m in self.provider.models.list().data)
+        except Exception as e:
+            logger.warning("Failed to list OpenAI models: %s", e)
+            return []
+
    def get_context_size(self) -> int:
        """Get the context window size for OpenAI."""
        if self.context_size is not None:
--- a/frigate/jobs/vlm_watch.py
+++ b/frigate/jobs/vlm_watch.py
@ -121,11 +121,12 @@ class VLMWatchRunner(threading.Thread):

    def _run_iteration(self) -> float:
        """Run one VLM analysis iteration. Returns seconds until next run."""
-        vision_client = (
-            self.genai_manager.vision_client or self.genai_manager.tool_client
-        )
-        if vision_client is None:
-            logger.warning("VLM watch job %s: no vision client available", self.job.id)
+        chat_client = self.genai_manager.chat_client
+        if chat_client is None or not chat_client.supports_vision:
+            logger.warning(
+                "VLM watch job %s: no chat client with vision support available",
+                self.job.id,
+            )
            return 30

        frame = self.frame_processor.get_current_frame(self.job.camera, {})
@ -163,7 +164,7 @@ class VLMWatchRunner(threading.Thread):
            }
        )

-        response = vision_client.chat_with_tools(
+        response = chat_client.chat_with_tools(
            messages=self.conversation,
            tools=None,
            tool_choice=None,
--- a/web/public/locales/en/views/settings.json
+++ b/web/public/locales/en/views/settings.json
@ -1485,7 +1485,12 @@
      "title": "Timestamp Settings"
    },
    "searchPlaceholder": "Search...",
-    "addCustomLabel": "Add custom label..."
+    "addCustomLabel": "Add custom label...",
+    "genaiModel": {
+      "placeholder": "Select model…",
+      "search": "Search models…",
+      "noModels": "No models available"
+    }
  },
  "globalConfig": {
    "title": "Global Configuration",
--- a/web/src/components/config-form/section-configs/genai.ts
+++ b/web/src/components/config-form/section-configs/genai.ts
@ -3,14 +3,6 @@ import type { SectionConfigOverrides } from "./types";
 const genai: SectionConfigOverrides = {
  base: {
    sectionDocs: "/configuration/genai/config",
-    restartRequired: [
-      "*.provider",
-      "*.api_key",
-      "*.base_url",
-      "*.model",
-      "*.provider_options",
-      "*.runtime_options",
-    ],
    advancedFields: ["*.base_url", "*.provider_options", "*.runtime_options"],
    hiddenFields: ["genai.enabled_in_config"],
    uiSchema: {
@ -37,6 +29,7 @@ const genai: SectionConfigOverrides = {
        "ui:options": { size: "lg" },
      },
      "*.model": {
+        "ui:widget": "genaiModel",
        "ui:options": { size: "xs" },
      },
      "*.provider": {
--- a/web/src/components/config-form/theme/frigateTheme.ts
+++ b/web/src/components/config-form/theme/frigateTheme.ts
@ -24,6 +24,7 @@ import { ReviewLabelSwitchesWidget } from "./widgets/ReviewLabelSwitchesWidget";
 import { ZoneSwitchesWidget } from "./widgets/ZoneSwitchesWidget";
 import { ArrayAsTextWidget } from "./widgets/ArrayAsTextWidget";
 import { FfmpegArgsWidget } from "./widgets/FfmpegArgsWidget";
+import { GenAIModelWidget } from "./widgets/GenAIModelWidget";
 import { GenAIRolesWidget } from "./widgets/GenAIRolesWidget";
 import { InputRolesWidget } from "./widgets/InputRolesWidget";
 import { TimezoneSelectWidget } from "./widgets/TimezoneSelectWidget";
@ -64,6 +65,7 @@ export const frigateTheme: FrigateTheme = {
    ArrayAsTextWidget: ArrayAsTextWidget,
    FfmpegArgsWidget: FfmpegArgsWidget,
    CameraPathWidget: CameraPathWidget,
+    genaiModel: GenAIModelWidget,
    genaiRoles: GenAIRolesWidget,
    inputRoles: InputRolesWidget,
    // Custom widgets
--- a/web/src/components/config-form/theme/widgets/GenAIModelWidget.tsx
+++ b/web/src/components/config-form/theme/widgets/GenAIModelWidget.tsx
@ -0,0 +1,125 @@
+// Combobox widget for genai *.model fields.
+// Fetches available models from the provider's backend and shows them in a dropdown.
+import { useState, useMemo } from "react";
+import type { WidgetProps } from "@rjsf/utils";
+import { useTranslation } from "react-i18next";
+import useSWR from "swr";
+import { Check, ChevronsUpDown } from "lucide-react";
+import { cn } from "@/lib/utils";
+import { Button } from "@/components/ui/button";
+import {
+  Command,
+  CommandGroup,
+  CommandInput,
+  CommandItem,
+  CommandList,
+} from "@/components/ui/command";
+import {
+  Popover,
+  PopoverContent,
+  PopoverTrigger,
+} from "@/components/ui/popover";
+import { getSizedFieldClassName } from "../utils";
+
+/**
+ * Extract the provider config entry name from the RJSF widget id.
+ * Widget ids look like "root_myProvider_model".
+ */
+function getProviderKey(widgetId: string): string | undefined {
+  const prefix = "root_";
+  const suffix = "_model";
+
+  if (!widgetId.startsWith(prefix) || !widgetId.endsWith(suffix)) {
+    return undefined;
+  }
+
+  return widgetId.slice(prefix.length, -suffix.length) || undefined;
+}
+
+export function GenAIModelWidget(props: WidgetProps) {
+  const { id, value, disabled, readonly, onChange, options } = props;
+  const { t } = useTranslation(["views/settings"]);
+  const [open, setOpen] = useState(false);
+
+  const fieldClassName = getSizedFieldClassName(options, "sm");
+  const providerKey = useMemo(() => getProviderKey(id), [id]);
+
+  const { data: allModels } = useSWR<Record<string, string[]>>("genai/models", {
+    revalidateOnFocus: false,
+  });
+
+  const models = useMemo(() => {
+    if (!allModels || !providerKey) return [];
+    return allModels[providerKey] ?? [];
+  }, [allModels, providerKey]);
+
+  const currentLabel = typeof value === "string" && value ? value : undefined;
+
+  return (
+    <Popover open={open} onOpenChange={setOpen}>
+      <PopoverTrigger asChild>
+        <Button
+          id={id}
+          type="button"
+          variant="outline"
+          role="combobox"
+          aria-expanded={open}
+          disabled={disabled || readonly}
+          className={cn(
+            "justify-between font-normal",
+            !currentLabel && "text-muted-foreground",
+            fieldClassName,
+          )}
+        >
+          {currentLabel ??
+            t("configForm.genaiModel.placeholder", {
+              ns: "views/settings",
+              defaultValue: "Select model…",
+            })}
+          <ChevronsUpDown className="ml-2 h-4 w-4 shrink-0 opacity-50" />
+        </Button>
+      </PopoverTrigger>
+      <PopoverContent className="w-[--radix-popover-trigger-width] p-0">
+        <Command>
+          <CommandInput
+            placeholder={t("configForm.genaiModel.search", {
+              ns: "views/settings",
+              defaultValue: "Search models…",
+            })}
+          />
+          <CommandList>
+            {models.length > 0 ? (
+              <CommandGroup>
+                {models.map((model) => (
+                  <CommandItem
+                    key={model}
+                    value={model}
+                    onSelect={() => {
+                      onChange(model);
+                      setOpen(false);
+                    }}
+                  >
+                    <Check
+                      className={cn(
+                        "mr-2 h-4 w-4",
+                        value === model ? "opacity-100" : "opacity-0",
+                      )}
+                    />
+                    {model}
+                  </CommandItem>
+                ))}
+              </CommandGroup>
+            ) : (
+              <div className="p-4 text-center text-sm text-muted-foreground">
+                {t("configForm.genaiModel.noModels", {
+                  ns: "views/settings",
+                  defaultValue: "No models available",
+                })}
+              </div>
+            )}
+          </CommandList>
+        </Command>
+      </PopoverContent>
+    </Popover>
+  );
+}
--- a/web/src/components/config-form/theme/widgets/GenAIRolesWidget.tsx
+++ b/web/src/components/config-form/theme/widgets/GenAIRolesWidget.tsx
@ -4,7 +4,7 @@ import { useTranslation } from "react-i18next";
 import { Switch } from "@/components/ui/switch";
 import type { ConfigFormContext } from "@/types/configForm";

-const GENAI_ROLES = ["embeddings", "vision", "tools"] as const;
+const GENAI_ROLES = ["embeddings", "descriptions", "chat"] as const;

 function normalizeValue(value: unknown): string[] {
  if (Array.isArray(value)) {