🔗 Serie: Governed Search Patterns – Teil 4: Elasticsearch Percolator fĂŒr Policy-Driven Search Governance ← aktuell: Teil 5 → Teil 6: Personalisierte E-Commerce-Suche mit Kaufhistorie und User Cohorts

Semantische Suche ist großartig – aber sie allein rettet nicht den E-Commerce. Denn wĂ€hrend Algorithmen Bedeutungen verstehen, bleiben stabile UI-Elemente wie Facetten und Paginierung oft auf der Strecke. Die Lösung: ein mehrstufiger Retrieval-Ansatz, der semantische Tiefe mit bewĂ€hrter Shop-FunktionalitĂ€t verbindet.

Jeder E-Commerce-Manager kennt das Szenario: Ein Kunde sucht nach „roten Sneakern“. Die semantische Suche versteht die Absicht – und liefert 200 Ergebnisse. Darunter sind rote Sneaker, aber auch rot-blaue und Sneaker-Ă€hnliche Schuhe in anderen Farben. Die Facette „Farbe: Rot“ zeigt 150 Treffer an. Doch zwischen den Seiten der Paginierung gehen die wirklich relevanten Produkte verloren.

Das Problem heißt Poor Recall – zu viele irrelevante Ergebnisse, die die wirklich passenden Treffer ĂŒberlagern. Besonders kritisch wird es, wenn:

  • Semantische Ähnlichkeiten die exakte Übereinstimmung verwĂ€ssern
  • Facetten zwar viele Produkte zeigen, aber die gefundenen Treffer falsch aggregieren
  • Paginierung und Sortierung inkonsistente Ergebnisse ĂŒber mehrere Seiten liefern

Multi-Tier Retrieval: Die governed Lösung fĂŒr stabilen Recall

Ein Multi-Tier-Ansatz unterteilt die Suche in mehrere, klar getrennte Retrieval-Phasen. Jede Phase hat eine spezifische Aufgabe und wird durch die Control Plane gesteuert – genau wie in den vorherigen Teilen dieser Serie beschrieben.

Tier 1: PrÀzises exaktes Matching

Die erste Stufe nutzt boolesche Filter und exakte Keyword-Matches. Sie stellt sicher, dass grundlegende Shop-Funktionen wie Facetten und Paginierung stabil funktionieren. Wer nach „GrĂ¶ĂŸe 42″ sucht, soll ausschließlich Produkte dieser GrĂ¶ĂŸe sehen – keine semantisch Ă€hnlichen Alternativen.

Tier 2: Semantische Erweiterung

Die zweite Stufe reichert die Ergebnisse mit semantischen Ähnlichkeiten an – aber nur innerhalb des durch Tier 1 gesteckten Rahmens. So werden relevante Alternativen wie Ă€hnliche Modelle oder ergĂ€nzende Produkte gefunden, ohne die Filterlogik zu verlassen.

Tier 3: Kontextuelles Boosting & Personalisierung

Die dritte Stufe boostet basierend auf GeschÀftslogik: Marge, PopularitÀt, saisonale Relevanz oder Kundensegment (mehr dazu in den Teilen 6 und 7 dieser Serie). Diese Regeln werden durch den Elasticsearch Percolator aus Teil 4 gesteuert.

Warum dieser Ansatz Poor Recall behebt

Der entscheidende Vorteil: Jede Tier hat einen klar definierten Einflussbereich. Die exakte Suche in Tier 1 liefert stabile Facetten und konsistente Paginierung. Die semantische Suche in Tier 2 operiert innerhalb dieses Rahmens. Das verhindert, dass semantische Ähnlichkeiten die Kern-Strukturen der Shop-UI aufweichen.

Konkret bedeutet das:

  • Facetten bleiben stabil: Ein Filter auf „Farbe: Blau“ zeigt auch nach der semantischen Erweiterung nur blaue Produkte
  • Paginierung wird konsistent: Seite 1, 2 und 3 folgen einer logischen Reihenfolge, die sich nicht durch semantische Streuung verschiebt
  • Recall verbessert sich: Mehr relevante Produkte werden gefunden, ohne dass irrelevante Ergebnisse die Liste ĂŒberfluten
  • Governance bleibt intakt: Alle Regeln der Control Plane gelten fĂŒr alle Tiers gleichermaßen

Technische Umsetzung mit Elasticsearch

Die Multi-Tier-Architektur lĂ€sst sich mit Elasticsearch ĂŒber verschachtelte Queries und Rescore-Funktionen abbilden:

{
  "query": {
    "bool": {
      "must": [
        { "term": { "category": "schuhe" } },
        { "term": { "farbe": "rot" } }
      ]
    }
  },
  "rescore": {
    "window_size": 100,
    "query": {
      "rescore_query": {
        "more_like_this": {
          "fields": ["name", "beschreibung"],
          "like": "rote Sneaker",
          "min_term_freq": 1
        }
      },
      "query_weight": 0.7,
      "rescore_query_weight": 0.3
    }
  }
}

ErklĂ€rung: Der bool-Query (Tier 1) stellt exakte Übereinstimmungen sicher, wĂ€hrend der rescore (Tier 2) semantische Ähnlichkeiten innerhalb der gefilterten Ergebnisse gewichtet. Das dritte Tier (Boosting nach Marge, PopularitĂ€t etc.) wird durch die Control Plane als zusĂ€tzlicher Weight-Faktor hinzugefĂŒgt.

Wie Cybereiche Multi-Tier-Suche fĂŒr E-Commerce realisiert

Die Implementierung einer Multi-Tier-Architektur erfordert fundierte Kenntnisse der Elasticsearch-Query-Mechanik und der spezifischen E-Commerce-Anforderungen. Falsch konfigurierte Rescore-Fenster oder falsche Weightings können die Suchergebnisse verschlechtern statt verbessern.

Die Experten von Cybereiche haben umfangreiche Erfahrung im Aufbau mehrstufiger Retrieval-Systeme fĂŒr Online-Shops. Ob die Integration von semantischen Rescore-Strategien, die Anbindung an RAG-Pipelines fĂŒr kontextuelles VerstĂ€ndnis oder die Kombination mit KI-Chatbot-Lösungen fĂŒr interaktive Produktsuche – Cybereiche liefert die passende Architektur fĂŒr jedes Anforderungsprofil.

Fazit – und wie Sie Cybereiche kontaktieren

Multi-Tier Search ist der SchlĂŒssel zu stabilen, gouvernierten Suchergebnissen im E-Commerce. Durch die klare Trennung von exaktem Matching, semantischer Erweiterung und geschĂ€ftslogischem Boosting werden sowohl Recall als auch Nutzererfahrung verbessert – ohne die bewĂ€hrten Shop-UI-Elemente zu beeintrĂ€chtigen.

Semantische Tiefe und stabile Facetten mĂŒssen kein Widerspruch sein – mit der richtigen Multi-Tier-Architektur nicht.

Haben Sie Fragen zur Optimierung Ihrer E-Commerce-Suche? Die Experten von Cybereiche beraten Sie gerne – von der Analyse Ihrer aktuellen Retrieval-Performance bis zur produktiven Umsetzung einer Multi-Tier-Architektur. Vereinbaren Sie ein unverbindliches GesprĂ€ch und erfahren Sie, wie Sie Poor Recall in Ihrem Shop nachhaltig beheben.