semantic trigger test

2026-04-28 17:47:41 +03:00 · 2025-06-23 13:09:41 -05:00 · 2025-06-23 13:09:41 -05:00 · 1cc2be2f00
commit 1cc2be2f00
parent 0f4cac736a
6 changed files with 144 additions and 0 deletions
--- a/frigate/api/event.py
+++ b/frigate/api/event.py
@ -1255,6 +1255,38 @@ def regenerate_description(
    )
@router.post(
    "/description/generate",
    response_model=GenericResponse,
    # dependencies=[Depends(require_role(["admin"]))],
 )
 def generate_description_embedding(
    request: Request,
    body: EventsDescriptionBody,
 ):
    new_description = body.description
    # If semantic search is enabled, update the index
    if request.app.frigate_config.semantic_search.enabled:
        context: EmbeddingsContext = request.app.embeddings
        if len(new_description) > 0:
            result = context.generate_description_embedding(
                new_description,
            )
    return JSONResponse(
        content=(
            {
                "success": True,
                "message": f"Embedding for description is {result}"
                if result
                else "Failed to generate embedding",
            }
        ),
        status_code=200,
    )
 def delete_single_event(event_id: str, request: Request) -> dict:
    try:
        event = Event.get(Event.id == event_id)
--- a/frigate/config/camera/camera.py
+++ b/frigate/config/camera/camera.py
@ -22,6 +22,7 @@ from ..classification import (
    AudioTranscriptionConfig,
    CameraFaceRecognitionConfig,
    CameraLicensePlateRecognitionConfig,
    CameraSemanticSearchConfig,
 )
 from .audio import AudioConfig
 from .birdseye import BirdseyeCameraConfig
@ -91,6 +92,10 @@ class CameraConfig(FrigateBaseModel):
    review: ReviewConfig = Field(
        default_factory=ReviewConfig, title="Review configuration."
    )
    semantic_search: CameraSemanticSearchConfig = Field(
        default_factory=CameraSemanticSearchConfig,
        title="Semantic search configuration.",
    )
    snapshots: SnapshotsConfig = Field(
        default_factory=SnapshotsConfig, title="Snapshot configuration."
    )
--- a/frigate/config/classification.py
+++ b/frigate/config/classification.py
@ -10,6 +10,7 @@ __all__ = [
    "CameraLicensePlateRecognitionConfig",
    "FaceRecognitionConfig",
    "SemanticSearchConfig",
    "CameraSemanticSearchConfig",
    "LicensePlateRecognitionConfig",
 ]
@ -113,6 +114,14 @@ class SemanticSearchConfig(FrigateBaseModel):
    )
 class CameraSemanticSearchConfig(FrigateBaseModel):
    triggers: Optional[list[str]] = Field(
        default=None, title="Text phrases to elevate tracked objects to review alerts."
    )
    model_config = ConfigDict(extra="forbid", protected_namespaces=())
 class FaceRecognitionConfig(FrigateBaseModel):
    enabled: bool = Field(default=False, title="Enable face recognition.")
    model_size: str = Field(
--- a/frigate/data_processing/real_time/semantic_trigger.py
+++ b/frigate/data_processing/real_time/semantic_trigger.py
@ -0,0 +1,81 @@
 """Real time processor to trigger alerts by matching embeddings."""
 import datetime
 import logging
 from typing import Any
 import cv2
 import numpy as np
 from frigate.comms.inter_process import InterProcessRequestor
 from frigate.config import FrigateConfig
 from frigate.config.classification import CameraSemanticSearchConfig
 from frigate.util.builtin import EventsPerSecond, InferenceSpeed
 from ..types import DataProcessorMetrics
 from .api import RealTimeProcessorApi
 logger = logging.getLogger(__name__)
 class SemanticTriggerProcessor(RealTimeProcessorApi):
    def __init__(
        self,
        config: FrigateConfig,
        trigger_config: CameraSemanticSearchConfig,
        requestor: InterProcessRequestor,
        metrics: DataProcessorMetrics,
        embeddings,
    ):
        super().__init__(config, metrics)
        self.embeddings = embeddings
        self.trigger_config = trigger_config
        self.requestor = requestor
        self.image_inference_speed = InferenceSpeed(self.metrics.image_embeddings_speed)
        self.image_eps = EventsPerSecond()
        self.text_inference_speed = InferenceSpeed(self.metrics.text_embeddings_speed)
        self.text_eps = EventsPerSecond()
        self.trigger_embeddings: list[np.ndarray] = []
        self.last_run = datetime.datetime.now().timestamp()
        self.__generate_trigger_embeddings()
    def __generate_trigger_embeddings(self) -> None:
        self.image_eps.start()
        self.text_eps.start()
        for trigger in self.trigger_config.triggers:
            embedding = self.embeddings.embed_description(None, trigger, upsert=False)
            self.trigger_embeddings.append(embedding)
    def __update_metrics(self, duration: float) -> None:
        self.image_eps.update()
        self.image_inference_speed.update(duration)
    def process_frame(self, frame_data: dict[str, Any], frame: np.ndarray):
        # self.metrics.classification_cps[
        #     self.model_config.name
        # ].value = self.classifications_per_second.eps()
        camera = frame_data.get("camera")
        now = datetime.datetime.now().timestamp()
        rgb = cv2.cvtColor(frame, cv2.COLOR_YUV2RGB_I420)
        img_embedding = self.embeddings.embed_thumbnail(None, rgb, upsert=False)
        self.__update_metrics(datetime.datetime.now().timestamp() - now)
        if camera != "framecache":
            return
        for trigger_embedding in self.trigger_embeddings:
            for trigger in self.trigger_config.triggers:
                dot_product = np.dot(img_embedding, trigger_embedding)
                norm_img_embedding = np.linalg.norm(img_embedding)
                norm_trigger_embedding = np.linalg.norm(trigger_embedding)
                logger.info(
                    f"{camera}: Cosine similarity is {dot_product / (norm_img_embedding * norm_trigger_embedding)}"
                )
    def handle_request(self, topic, request_data):
        return None
    def expire_object(self, object_id, camera):
        pass
--- a/frigate/embeddings/init.py
+++ b/frigate/embeddings/init.py
@ -287,3 +287,9 @@ class EmbeddingsContext:
        return self.requestor.send_data(
            EmbeddingsRequestEnum.transcribe_audio.value, {"event": event}
        )
    def generate_description_embedding(self, text: str) -> None:
        return self.requestor.send_data(
            EmbeddingsRequestEnum.embed_description.value,
            {"id": None, "description": text, "upsert": False},
        )
--- a/frigate/embeddings/maintainer.py
+++ b/frigate/embeddings/maintainer.py
@ -56,6 +56,7 @@ from frigate.data_processing.real_time.face import FaceRealTimeProcessor
 from frigate.data_processing.real_time.license_plate import (
    LicensePlateRealTimeProcessor,
 )
 from frigate.data_processing.real_time.semantic_trigger import SemanticTriggerProcessor
 from frigate.data_processing.types import DataProcessorMetrics, PostProcessDataEnum
 from frigate.db.sqlitevecq import SqliteVecQueueDatabase
 from frigate.events.types import EventTypeEnum, RegenerateDescriptionEnum
@ -188,6 +189,16 @@ class EmbeddingMaintainer(threading.Thread):
                )
            )
        self.realtime_processors.append(
            SemanticTriggerProcessor(
                self.config,
                self.config.cameras["orlandocam"].semantic_search,
                self.requestor,
                metrics,
                self.embeddings,
            )
        )
        # post processors
        self.post_processors: list[PostProcessorApi] = []