2026-05-09 23:15:28 +03:00
24 changed files with 145 additions and 379 deletions
--- a/frigate/api/app.py
+++ b/frigate/api/app.py
@ -125,16 +125,6 @@ def metrics(request: Request):
    return Response(content=content, media_type=content_type)
@router.get(
    "/genai/models",
    dependencies=[Depends(allow_any_authenticated())],
    summary="List available GenAI models",
    description="Returns available models for each configured GenAI provider.",
 )
 def genai_models(request: Request):
    return JSONResponse(content=request.app.genai_manager.list_models())
@router.get("/config", dependencies=[Depends(allow_any_authenticated())])
 def config(request: Request):
    config_obj: FrigateConfig = request.app.frigate_config
--- a/frigate/api/chat.py
+++ b/frigate/api/chat.py
@ -520,14 +520,45 @@ async def _execute_get_live_context(
            "detections": list(tracked_objects_dict.values()),
        }
-        # Grab live frame when the chat model supports vision
+        # Grab live frame and handle based on provider configuration
        image_url = await _get_live_frame_image_url(request, camera, allowed_cameras)
        if image_url:
-            chat_client = request.app.genai_manager.chat_client
+            genai_manager = request.app.genai_manager
-            if chat_client is not None and chat_client.supports_vision:
+            if genai_manager.tool_client is genai_manager.vision_client:
-                # Pass image URL so it can be injected as a user message
+                # Same provider handles both roles — pass image URL so it can
-                # (images can't be in tool results)
+                # be injected as a user message (images can't be in tool results)
                result["_image_url"] = image_url
            elif genai_manager.vision_client is not None:
                # Separate vision provider — have it describe the image,
                # providing detection context so it knows what to focus on
                frame_bytes = _decode_data_url(image_url)
                if frame_bytes:
                    detections = result.get("detections", [])
                    if detections:
                        detection_lines = []
                        for d in detections:
                            parts = [d.get("label", "unknown")]
                            if d.get("sub_label"):
                                parts.append(f"({d['sub_label']})")
                            if d.get("zones"):
                                parts.append(f"in {', '.join(d['zones'])}")
                            detection_lines.append(" ".join(parts))
                        context = (
                            "The following objects are currently being tracked: "
                            + "; ".join(detection_lines)
                            + "."
                        )
                    else:
                        context = "No objects are currently being tracked."
                    description = genai_manager.vision_client._send(
                        f"Describe what you see in this security camera image. "
                        f"{context} Focus on the scene, any visible activity, "
                        f"and details about the tracked objects.",
                        [frame_bytes],
                    )
                    if description:
                        result["image_description"] = description
        return result
@ -578,6 +609,17 @@ async def _get_live_frame_image_url(
        return None
 def _decode_data_url(data_url: str) -> Optional[bytes]:
    """Decode a base64 data URL to raw bytes."""
    try:
        # Format: data:image/jpeg;base64,<data>
        _, encoded = data_url.split(",", 1)
        return base64.b64decode(encoded)
    except (ValueError, Exception) as e:
        logger.debug("Failed to decode data URL: %s", e)
        return None
 async def _execute_set_camera_state(
    request: Request,
    arguments: Dict[str, Any],
@ -692,9 +734,9 @@ async def _execute_start_camera_watch(
    await require_camera_access(camera, request=request)
    genai_manager = request.app.genai_manager
-    chat_client = genai_manager.chat_client
+    vision_client = genai_manager.vision_client or genai_manager.tool_client
-    if chat_client is None or not chat_client.supports_vision:
+    if vision_client is None:
-        return {"error": "VLM watch requires a chat model with vision support."}
+        return {"error": "No vision/GenAI provider configured."}
    try:
        job_id = start_vlm_watch_job(
@ -1028,7 +1070,7 @@ async def chat_completion(
    6. Repeats until final answer
    7. Returns response to user
    """
-    genai_client = request.app.genai_manager.chat_client
+    genai_client = request.app.genai_manager.tool_client
    if not genai_client:
        return JSONResponse(
            content={
@ -1339,12 +1381,12 @@ async def start_vlm_monitor(
    await require_camera_access(body.camera, request=request)
-    chat_client = genai_manager.chat_client
+    vision_client = genai_manager.vision_client or genai_manager.tool_client
-    if chat_client is None or not chat_client.supports_vision:
+    if vision_client is None:
        return JSONResponse(
            content={
                "success": False,
-                "message": "VLM watch requires a chat model with vision support.",
+                "message": "No vision/GenAI provider configured.",
            },
            status_code=400,
        )
--- a/frigate/api/review.py
+++ b/frigate/api/review.py
@ -746,7 +746,7 @@ async def set_not_reviewed(
    description="Use GenAI to summarize review items over a period of time.",
 )
 def generate_review_summary(request: Request, start_ts: float, end_ts: float):
-    if not request.app.genai_manager.description_client:
+    if not request.app.genai_manager.vision_client:
        return JSONResponse(
            content=(
                {
--- a/frigate/config/camera/genai.py
+++ b/frigate/config/camera/genai.py
@ -18,8 +18,8 @@ class GenAIProviderEnum(str, Enum):
 class GenAIRoleEnum(str, Enum):
-    chat = "chat"
+    tools = "tools"
-    descriptions = "descriptions"
+    vision = "vision"
    embeddings = "embeddings"
@ -49,11 +49,11 @@ class GenAIConfig(FrigateBaseModel):
    roles: list[GenAIRoleEnum] = Field(
        default_factory=lambda: [
            GenAIRoleEnum.embeddings,
-            GenAIRoleEnum.descriptions,
+            GenAIRoleEnum.vision,
-            GenAIRoleEnum.chat,
+            GenAIRoleEnum.tools,
        ],
        title="Roles",
-        description="GenAI roles (chat, descriptions, embeddings); one provider per role.",
+        description="GenAI roles (tools, vision, embeddings); one provider per role.",
    )
    provider_options: dict[str, Any] = Field(
        default={},
--- a/frigate/data_processing/post/object_descriptions.py
+++ b/frigate/data_processing/post/object_descriptions.py
@ -16,7 +16,7 @@ from frigate.config import CameraConfig, FrigateConfig
 from frigate.const import CLIPS_DIR, UPDATE_EVENT_DESCRIPTION
 from frigate.data_processing.post.semantic_trigger import SemanticTriggerProcessor
 from frigate.data_processing.types import PostProcessDataEnum
-from frigate.genai.manager import GenAIClientManager
+from frigate.genai import GenAIClient
 from frigate.models import Event
 from frigate.types import TrackedObjectUpdateTypesEnum
 from frigate.util.builtin import EventsPerSecond, InferenceSpeed
@ -41,7 +41,7 @@ class ObjectDescriptionProcessor(PostProcessorApi):
        embeddings: "Embeddings",
        requestor: InterProcessRequestor,
        metrics: DataProcessorMetrics,
-        genai_manager: GenAIClientManager,
+        client: GenAIClient,
        semantic_trigger_processor: SemanticTriggerProcessor | None,
    ):
        super().__init__(config, metrics, None)
@ -49,7 +49,7 @@ class ObjectDescriptionProcessor(PostProcessorApi):
        self.embeddings = embeddings
        self.requestor = requestor
        self.metrics = metrics
-        self.genai_manager = genai_manager
+        self.genai_client = client
        self.semantic_trigger_processor = semantic_trigger_processor
        self.tracked_events: dict[str, list[Any]] = {}
        self.early_request_sent: dict[str, bool] = {}
@ -198,9 +198,6 @@ class ObjectDescriptionProcessor(PostProcessorApi):
        if data_type != PostProcessDataEnum.tracked_object:
            return
        if self.genai_manager.description_client is None:
            return
        state: str | None = frame_data.get("state", None)
        if state is not None:
@ -332,12 +329,7 @@ class ObjectDescriptionProcessor(PostProcessorApi):
        """Embed the description for an event."""
        start = datetime.datetime.now().timestamp()
        camera_config = self.config.cameras[str(event.camera)]
-        client = self.genai_manager.description_client
+        description = self.genai_client.generate_object_description(
        if client is None:
            return
        description = client.generate_object_description(
            camera_config, thumbnails, event
        )
--- a/frigate/data_processing/post/review_descriptions.py
+++ b/frigate/data_processing/post/review_descriptions.py
@ -22,7 +22,6 @@ from frigate.config.camera.review import GenAIReviewConfig, ImageSourceEnum
 from frigate.const import CACHE_DIR, CLIPS_DIR, UPDATE_REVIEW_DESCRIPTION
 from frigate.data_processing.types import PostProcessDataEnum
 from frigate.genai import GenAIClient
 from frigate.genai.manager import GenAIClientManager
 from frigate.models import Recordings, ReviewSegment
 from frigate.util.builtin import EventsPerSecond, InferenceSpeed
 from frigate.util.image import get_image_from_recording
@ -42,12 +41,12 @@ class ReviewDescriptionProcessor(PostProcessorApi):
        config: FrigateConfig,
        requestor: InterProcessRequestor,
        metrics: DataProcessorMetrics,
-        genai_manager: GenAIClientManager,
+        client: GenAIClient,
    ):
        super().__init__(config, metrics, None)
        self.requestor = requestor
        self.metrics = metrics
-        self.genai_manager = genai_manager
+        self.genai_client = client
        self.review_desc_speed = InferenceSpeed(self.metrics.review_desc_speed)
        self.review_desc_dps = EventsPerSecond()
        self.review_desc_dps.start()
@ -64,12 +63,7 @@ class ReviewDescriptionProcessor(PostProcessorApi):
        Estimates ~1 token per 1250 pixels. Targets 98% context utilization with safety margin.
        Capped at 20 frames.
        """
-        client = self.genai_manager.description_client
+        context_size = self.genai_client.get_context_size()
        if client is None:
            return 3
        context_size = client.get_context_size()
        camera_config = self.config.cameras[camera]
        detect_width = camera_config.detect.width
@ -117,9 +111,6 @@ class ReviewDescriptionProcessor(PostProcessorApi):
        if data_type != PostProcessDataEnum.review:
            return
        if self.genai_manager.description_client is None:
            return
        camera = data["after"]["camera"]
        camera_config = self.config.cameras[camera]
@ -209,7 +200,7 @@ class ReviewDescriptionProcessor(PostProcessorApi):
                target=run_analysis,
                args=(
                    self.requestor,
-                    self.genai_manager.description_client,
+                    self.genai_client,
                    self.review_desc_speed,
                    camera_config,
                    final_data,
@ -325,12 +316,7 @@ class ReviewDescriptionProcessor(PostProcessorApi):
                    os.path.join(CLIPS_DIR, "genai-requests", f"{start_ts}-{end_ts}")
                ).mkdir(parents=True, exist_ok=True)
-            client = self.genai_manager.description_client
+            return self.genai_client.generate_review_summary(
            if client is None:
                return None
            return client.generate_review_summary(
                start_ts,
                end_ts,
                events_with_context,
--- a/frigate/embeddings/maintainer.py
+++ b/frigate/embeddings/maintainer.py
@ -202,13 +202,15 @@ class EmbeddingMaintainer(threading.Thread):
        # post processors
        self.post_processors: list[PostProcessorApi] = []
-        if any(c.review.genai.enabled_in_config for c in self.config.cameras.values()):
+        if self.genai_manager.vision_client is not None and any(
            c.review.genai.enabled_in_config for c in self.config.cameras.values()
        ):
            self.post_processors.append(
                ReviewDescriptionProcessor(
                    self.config,
                    self.requestor,
                    self.metrics,
-                    self.genai_manager,
+                    self.genai_manager.vision_client,
                )
            )
@ -246,14 +248,16 @@ class EmbeddingMaintainer(threading.Thread):
            )
            self.post_processors.append(semantic_trigger_processor)
-        if any(c.objects.genai.enabled_in_config for c in self.config.cameras.values()):
+        if self.genai_manager.vision_client is not None and any(
            c.objects.genai.enabled_in_config for c in self.config.cameras.values()
        ):
            self.post_processors.append(
                ObjectDescriptionProcessor(
                    self.config,
                    self.embeddings,
                    self.requestor,
                    self.metrics,
-                    self.genai_manager,
+                    self.genai_manager.vision_client,
                    semantic_trigger_processor,
                )
            )
--- a/frigate/genai/init.py
+++ b/frigate/genai/init.py
@ -320,22 +320,6 @@ Guidelines:
        """Submit a request to the provider."""
        return None
    @property
    def supports_vision(self) -> bool:
        """Whether the model supports vision/image input.
        Defaults to True for cloud providers. Providers that can detect
        capability at runtime (e.g. llama.cpp) should override this.
        """
        return True
    def list_models(self) -> list[str]:
        """Return the list of model names available from this provider.
        Providers should override this to query their backend.
        """
        return []
    def get_context_size(self) -> int:
        """Get the context window size for this provider in tokens."""
        return 4096
--- a/frigate/genai/azure-openai.py
+++ b/frigate/genai/azure-openai.py
@ -82,14 +82,6 @@ class OpenAIClient(GenAIClient):
            return str(result.choices[0].message.content.strip())
        return None
    def list_models(self) -> list[str]:
        """Return available model IDs from Azure OpenAI."""
        try:
            return sorted(m.id for m in self.provider.models.list().data)
        except Exception as e:
            logger.warning("Failed to list Azure OpenAI models: %s", e)
            return []
    def get_context_size(self) -> int:
        """Get the context window size for Azure OpenAI."""
        return 128000
--- a/frigate/genai/gemini.py
+++ b/frigate/genai/gemini.py
@ -87,14 +87,6 @@ class GeminiClient(GenAIClient):
            return None
        return description
    def list_models(self) -> list[str]:
        """Return available model names from Gemini."""
        try:
            return sorted(m.name or "" for m in self.provider.models.list())
        except Exception as e:
            logger.warning("Failed to list Gemini models: %s", e)
            return []
    def get_context_size(self) -> int:
        """Get the context window size for Gemini."""
        # Gemini Pro Vision has a 1M token context window
--- a/frigate/genai/llama_cpp.py
+++ b/frigate/genai/llama_cpp.py
@ -101,26 +101,15 @@ class LlamaCppClient(GenAIClient):
                e,
            )
-        # Query /props for context size, modalities, and tool support.
+        # Query /props for context size, modalities, and tool support
        # The standard /props?model=<name> endpoint works with llama-server.
        # If it fails, try the llama-swap per-model passthrough endpoint which
        # returns props for a specific model without requiring it to be loaded.
        try:
-            try:
+            response = requests.get(
-                response = requests.get(
+                f"{base_url}/props",
-                    f"{base_url}/props",
+                params={"model": configured_model},
-                    params={"model": configured_model},
+                timeout=10,
-                    timeout=10,
+            )
-                )
+            response.raise_for_status()
-                response.raise_for_status()
+            props = response.json()
                props = response.json()
            except Exception:
                response = requests.get(
                    f"{base_url}/upstream/{configured_model}/props",
                    timeout=10,
                )
                response.raise_for_status()
                props = response.json()
            # Context size from server runtime config
            default_settings = props.get("default_generation_settings", {})
@ -137,7 +126,7 @@ class LlamaCppClient(GenAIClient):
            chat_caps = props.get("chat_template_caps", {})
            self._supports_tools = chat_caps.get("supports_tools", False)
-            logger.info(
+            logger.debug(
                "llama.cpp model '%s' initialized — context: %s, vision: %s, audio: %s, tools: %s",
                configured_model,
                self._context_size or "unknown",
@ -236,23 +225,6 @@ class LlamaCppClient(GenAIClient):
        """Whether the loaded model supports tool/function calling."""
        return self._supports_tools
    def list_models(self) -> list[str]:
        """Return available model IDs from the llama.cpp server."""
        if self.provider is None:
            return []
        try:
            response = requests.get(f"{self.provider}/v1/models", timeout=10)
            response.raise_for_status()
            models = []
            for m in response.json().get("data", []):
                models.append(m.get("id", "unknown"))
                for alias in m.get("aliases", []):
                    models.append(alias)
            return sorted(models)
        except Exception as e:
            logger.warning("Failed to list llama.cpp models: %s", e)
            return []
    def get_context_size(self) -> int:
        """Get the context window size for llama.cpp.
--- a/frigate/genai/manager.py
+++ b/frigate/genai/manager.py
@ -1,15 +1,15 @@
 """GenAI client manager for Frigate.
-Manages GenAI provider clients from Frigate config. Clients are created lazily
+Manages GenAI provider clients from Frigate config. Configuration is read only
-on first access so that providers whose roles are never used (e.g. chat when
+in _update_config(); no other code should read config.genai. Exposes clients
-no chat feature is active) are never initialized.
+by role: tool_client, vision_client, embeddings_client.
 """
 import logging
 from typing import TYPE_CHECKING, Optional
 from frigate.config import FrigateConfig
-from frigate.config.camera.genai import GenAIConfig, GenAIRoleEnum
+from frigate.config.camera.genai import GenAIRoleEnum
 if TYPE_CHECKING:
    from frigate.genai import GenAIClient
@ -21,98 +21,68 @@ class GenAIClientManager:
    """Manages GenAI provider clients from Frigate config."""
    def __init__(self, config: FrigateConfig) -> None:
-        self._configs: dict[str, GenAIConfig] = {}
+        self._tool_client: Optional[GenAIClient] = None
-        self._role_map: dict[GenAIRoleEnum, str] = {}
+        self._vision_client: Optional[GenAIClient] = None
-        self._clients: dict[str, "GenAIClient"] = {}
+        self._embeddings_client: Optional[GenAIClient] = None
        self.update_config(config)
    def update_config(self, config: FrigateConfig) -> None:
-        """Store provider configs and build the role→name mapping.
+        """Build role clients from current Frigate config.genai.
        Called from __init__ and can be called again when config is reloaded.
-        Clients are not created here; they are instantiated lazily on first
+        Each role (tools, vision, embeddings) gets the client for the provider
-        access via a role property or list_models().
+        that has that role in its roles list.
        """
        from frigate.genai import PROVIDERS, load_providers
-        self._configs = {}
+        self._tool_client = None
-        self._role_map = {}
+        self._vision_client = None
-        self._clients = {}
+        self._embeddings_client = None
        if not config.genai:
            return
        load_providers()
-        for name, genai_cfg in config.genai.items():
+        for _name, genai_cfg in config.genai.items():
            if not genai_cfg.provider:
                continue
-            if genai_cfg.provider not in PROVIDERS:
+            provider_cls = PROVIDERS.get(genai_cfg.provider)
            if not provider_cls:
                logger.warning(
                    "Unknown GenAI provider %s in config, skipping.",
                    genai_cfg.provider,
                )
                continue
-
+            try:
-            self._configs[name] = genai_cfg
+                client = provider_cls(genai_cfg)
            except Exception as e:
                logger.exception(
                    "Failed to create GenAI client for provider %s: %s",
                    genai_cfg.provider,
                    e,
                )
                continue
            for role in genai_cfg.roles:
-                self._role_map[role] = name
+                if role == GenAIRoleEnum.tools:
-
+                    self._tool_client = client
-    def _get_client(self, name: str) -> "Optional[GenAIClient]":
+                elif role == GenAIRoleEnum.vision:
-        """Return the client for *name*, creating it on first access."""
+                    self._vision_client = client
-        if name in self._clients:
+                elif role == GenAIRoleEnum.embeddings:
-            return self._clients[name]
+                    self._embeddings_client = client
        from frigate.genai import PROVIDERS
        genai_cfg = self._configs.get(name)
        if not genai_cfg:
            return None
        if not genai_cfg.provider:
            return None
        provider_cls = PROVIDERS.get(genai_cfg.provider)
        if not provider_cls:
            return None
        try:
            client: "GenAIClient" = provider_cls(genai_cfg)
        except Exception as e:
            logger.exception(
                "Failed to create GenAI client for provider %s: %s",
                genai_cfg.provider,
                e,
            )
            return None
        self._clients[name] = client
        return client
    @property
-    def chat_client(self) -> "Optional[GenAIClient]":
+    def tool_client(self) -> "Optional[GenAIClient]":
-        """Client configured for the chat role (e.g. chat with function calling)."""
+        """Client configured for the tools role (e.g. chat with function calling)."""
-        name = self._role_map.get(GenAIRoleEnum.chat)
+        return self._tool_client
        return self._get_client(name) if name else None
    @property
-    def description_client(self) -> "Optional[GenAIClient]":
+    def vision_client(self) -> "Optional[GenAIClient]":
-        """Client configured for the descriptions role (e.g. review descriptions, object descriptions)."""
+        """Client configured for the vision role (e.g. review descriptions, object descriptions)."""
-        name = self._role_map.get(GenAIRoleEnum.descriptions)
+        return self._vision_client
        return self._get_client(name) if name else None
    @property
    def embeddings_client(self) -> "Optional[GenAIClient]":
        """Client configured for the embeddings role."""
-        name = self._role_map.get(GenAIRoleEnum.embeddings)
+        return self._embeddings_client
        return self._get_client(name) if name else None
    def list_models(self) -> dict[str, list[str]]:
        """Return available models keyed by config entry name."""
        result: dict[str, list[str]] = {}
        for name in self._configs:
            client = self._get_client(name)
            if client:
                result[name] = client.list_models()
        return result
--- a/frigate/genai/ollama.py
+++ b/frigate/genai/ollama.py
@ -132,19 +132,6 @@ class OllamaClient(GenAIClient):
            logger.warning("Ollama returned an error: %s", str(e))
            return None
    def list_models(self) -> list[str]:
        """Return available model names from the Ollama server."""
        if self.provider is None:
            return []
        try:
            response = self.provider.list()
            return sorted(
                m.get("name", m.get("model", "")) for m in response.get("models", [])
            )
        except Exception as e:
            logger.warning("Failed to list Ollama models: %s", e)
            return []
    def get_context_size(self) -> int:
        """Get the context window size for Ollama."""
        return int(
--- a/frigate/genai/openai.py
+++ b/frigate/genai/openai.py
@ -86,14 +86,6 @@ class OpenAIClient(GenAIClient):
            logger.warning("OpenAI returned an error: %s", str(e))
            return None
    def list_models(self) -> list[str]:
        """Return available model IDs from the OpenAI-compatible API."""
        try:
            return sorted(m.id for m in self.provider.models.list().data)
        except Exception as e:
            logger.warning("Failed to list OpenAI models: %s", e)
            return []
    def get_context_size(self) -> int:
        """Get the context window size for OpenAI."""
        if self.context_size is not None:
--- a/frigate/jobs/vlm_watch.py
+++ b/frigate/jobs/vlm_watch.py
@ -121,12 +121,11 @@ class VLMWatchRunner(threading.Thread):
    def _run_iteration(self) -> float:
        """Run one VLM analysis iteration. Returns seconds until next run."""
-        chat_client = self.genai_manager.chat_client
+        vision_client = (
-        if chat_client is None or not chat_client.supports_vision:
+            self.genai_manager.vision_client or self.genai_manager.tool_client
-            logger.warning(
+        )
-                "VLM watch job %s: no chat client with vision support available",
+        if vision_client is None:
-                self.job.id,
+            logger.warning("VLM watch job %s: no vision client available", self.job.id)
            )
            return 30
        frame = self.frame_processor.get_current_frame(self.job.camera, {})
@ -164,7 +163,7 @@ class VLMWatchRunner(threading.Thread):
            }
        )
-        response = chat_client.chat_with_tools(
+        response = vision_client.chat_with_tools(
            messages=self.conversation,
            tools=None,
            tool_choice=None,
--- a/web/public/locales/en/views/settings.json
+++ b/web/public/locales/en/views/settings.json
@ -1485,12 +1485,7 @@
      "title": "Timestamp Settings"
    },
    "searchPlaceholder": "Search...",
-    "addCustomLabel": "Add custom label...",
+    "addCustomLabel": "Add custom label..."
    "genaiModel": {
      "placeholder": "Select model…",
      "search": "Search models…",
      "noModels": "No models available"
    }
  },
  "globalConfig": {
    "title": "Global Configuration",
--- a/web/src/components/config-form/section-configs/genai.ts
+++ b/web/src/components/config-form/section-configs/genai.ts
@ -3,6 +3,14 @@ import type { SectionConfigOverrides } from "./types";
 const genai: SectionConfigOverrides = {
  base: {
    sectionDocs: "/configuration/genai/config",
    restartRequired: [
      "*.provider",
      "*.api_key",
      "*.base_url",
      "*.model",
      "*.provider_options",
      "*.runtime_options",
    ],
    advancedFields: ["*.base_url", "*.provider_options", "*.runtime_options"],
    hiddenFields: ["genai.enabled_in_config"],
    uiSchema: {
@ -29,7 +37,6 @@ const genai: SectionConfigOverrides = {
        "ui:options": { size: "lg" },
      },
      "*.model": {
        "ui:widget": "genaiModel",
        "ui:options": { size: "xs" },
      },
      "*.provider": {
--- a/web/src/components/config-form/section-configs/review.ts
+++ b/web/src/components/config-form/section-configs/review.ts
@ -47,7 +47,7 @@ const review: SectionConfigOverrides = {
      "detections.labels": "/configuration/review/#alerts-and-detections",
    },
    restartRequired: [],
-    fieldOrder: ["alerts", "detections", "genai", "genai.enabled"],
+    fieldOrder: ["alerts", "detections", "genai"],
    fieldGroups: {},
    hiddenFields: [
      "enabled_in_config",
--- a/web/src/components/config-form/theme/frigateTheme.ts
+++ b/web/src/components/config-form/theme/frigateTheme.ts
@ -24,7 +24,6 @@ import { ReviewLabelSwitchesWidget } from "./widgets/ReviewLabelSwitchesWidget";
 import { ZoneSwitchesWidget } from "./widgets/ZoneSwitchesWidget";
 import { ArrayAsTextWidget } from "./widgets/ArrayAsTextWidget";
 import { FfmpegArgsWidget } from "./widgets/FfmpegArgsWidget";
 import { GenAIModelWidget } from "./widgets/GenAIModelWidget";
 import { GenAIRolesWidget } from "./widgets/GenAIRolesWidget";
 import { InputRolesWidget } from "./widgets/InputRolesWidget";
 import { TimezoneSelectWidget } from "./widgets/TimezoneSelectWidget";
@ -65,7 +64,6 @@ export const frigateTheme: FrigateTheme = {
    ArrayAsTextWidget: ArrayAsTextWidget,
    FfmpegArgsWidget: FfmpegArgsWidget,
    CameraPathWidget: CameraPathWidget,
    genaiModel: GenAIModelWidget,
    genaiRoles: GenAIRolesWidget,
    inputRoles: InputRolesWidget,
    // Custom widgets
--- a/web/src/components/config-form/theme/widgets/GenAIModelWidget.tsx
+++ b/web/src/components/config-form/theme/widgets/GenAIModelWidget.tsx
@ -1,125 +0,0 @@
 // Combobox widget for genai *.model fields.
 // Fetches available models from the provider's backend and shows them in a dropdown.
 import { useState, useMemo } from "react";
 import type { WidgetProps } from "@rjsf/utils";
 import { useTranslation } from "react-i18next";
 import useSWR from "swr";
 import { Check, ChevronsUpDown } from "lucide-react";
 import { cn } from "@/lib/utils";
 import { Button } from "@/components/ui/button";
 import {
  Command,
  CommandGroup,
  CommandInput,
  CommandItem,
  CommandList,
 } from "@/components/ui/command";
 import {
  Popover,
  PopoverContent,
  PopoverTrigger,
 } from "@/components/ui/popover";
 import { getSizedFieldClassName } from "../utils";
 /**
 * Extract the provider config entry name from the RJSF widget id.
 * Widget ids look like "root_myProvider_model".
 */
 function getProviderKey(widgetId: string): string | undefined {
  const prefix = "root_";
  const suffix = "_model";
  if (!widgetId.startsWith(prefix) || !widgetId.endsWith(suffix)) {
    return undefined;
  }
  return widgetId.slice(prefix.length, -suffix.length) || undefined;
 }
 export function GenAIModelWidget(props: WidgetProps) {
  const { id, value, disabled, readonly, onChange, options } = props;
  const { t } = useTranslation(["views/settings"]);
  const [open, setOpen] = useState(false);
  const fieldClassName = getSizedFieldClassName(options, "sm");
  const providerKey = useMemo(() => getProviderKey(id), [id]);
  const { data: allModels } = useSWR<Record<string, string[]>>("genai/models", {
    revalidateOnFocus: false,
  });
  const models = useMemo(() => {
    if (!allModels || !providerKey) return [];
    return allModels[providerKey] ?? [];
  }, [allModels, providerKey]);
  const currentLabel = typeof value === "string" && value ? value : undefined;
  return (
    <Popover open={open} onOpenChange={setOpen}>
      <PopoverTrigger asChild>
        <Button
          id={id}
          type="button"
          variant="outline"
          role="combobox"
          aria-expanded={open}
          disabled={disabled || readonly}
          className={cn(
            "justify-between font-normal",
            !currentLabel && "text-muted-foreground",
            fieldClassName,
          )}
        >
          {currentLabel ??
            t("configForm.genaiModel.placeholder", {
              ns: "views/settings",
              defaultValue: "Select model…",
            })}
          <ChevronsUpDown className="ml-2 h-4 w-4 shrink-0 opacity-50" />
        </Button>
      </PopoverTrigger>
      <PopoverContent className="w-[--radix-popover-trigger-width] p-0">
        <Command>
          <CommandInput
            placeholder={t("configForm.genaiModel.search", {
              ns: "views/settings",
              defaultValue: "Search models…",
            })}
          />
          <CommandList>
            {models.length > 0 ? (
              <CommandGroup>
                {models.map((model) => (
                  <CommandItem
                    key={model}
                    value={model}
                    onSelect={() => {
                      onChange(model);
                      setOpen(false);
                    }}
                  >
                    <Check
                      className={cn(
                        "mr-2 h-4 w-4",
                        value === model ? "opacity-100" : "opacity-0",
                      )}
                    />
                    {model}
                  </CommandItem>
                ))}
              </CommandGroup>
            ) : (
              <div className="p-4 text-center text-sm text-muted-foreground">
                {t("configForm.genaiModel.noModels", {
                  ns: "views/settings",
                  defaultValue: "No models available",
                })}
              </div>
            )}
          </CommandList>
        </Command>
      </PopoverContent>
    </Popover>
  );
 }
--- a/web/src/components/config-form/theme/widgets/GenAIRolesWidget.tsx
+++ b/web/src/components/config-form/theme/widgets/GenAIRolesWidget.tsx
@ -4,7 +4,7 @@ import { useTranslation } from "react-i18next";
 import { Switch } from "@/components/ui/switch";
 import type { ConfigFormContext } from "@/types/configForm";
-const GENAI_ROLES = ["embeddings", "descriptions", "chat"] as const;
+const GENAI_ROLES = ["embeddings", "vision", "tools"] as const;
 function normalizeValue(value: unknown): string[] {
  if (Array.isArray(value)) {
--- a/web/src/components/overlay/chip/GenAISummaryChip.tsx
+++ b/web/src/components/overlay/chip/GenAISummaryChip.tsx
@ -108,7 +108,7 @@ export function GenAISummaryDialog({
  return (
    <Overlay open={open} onOpenChange={setOpen}>
      <Trigger asChild>
-        <div className="min-w-0">{children}</div>
+        <div>{children}</div>
      </Trigger>
      <Content
        className={cn(
--- a/web/src/components/timeline/DetailStream.tsx
+++ b/web/src/components/timeline/DetailStream.tsx
@ -525,7 +525,7 @@ function ReviewGroup({
                      }
                    }}
                  >
-                    <span className="block truncate hover:underline">
+                    <span className="truncate hover:underline">
                      {review.data.metadata.title}
                    </span>
                  </GenAISummaryDialog>
--- a/web/src/lib/config-schema/transformer.ts
+++ b/web/src/lib/config-schema/transformer.ts
@ -483,20 +483,9 @@ function generateUiSchema(
  const schemaObj = schema as Record<string, unknown>;
-  // Set field ordering — supports dot notation (e.g. "genai.enabled")
+  // Set field ordering
  if (fieldOrder && fieldOrder.length > 0) {
-    const depth = currentPath.length;
+    uiSchema["ui:order"] = [...fieldOrder, "*"];
    const localOrder = fieldOrder
      .map((f) => f.split("."))
      .filter((segments) => {
        if (segments.length !== depth + 1) return false;
        return currentPath.every((p, i) => segments[i] === p);
      })
      .map((segments) => segments[depth]);
    if (localOrder.length > 0) {
      uiSchema["ui:order"] = [...localOrder, "*"];
    }
  }
  if (!isSchemaObject(schemaObj.properties)) {