Reranking (ponowne sortowanie wyników)
Definicja
Reranking to etap, w którym system bierze wstępną listę wyników wyszukiwania (np. 20 fragmentów) i ponownie je sortuje, żeby na górze były najbardziej trafne.
Co to w zasadzie jest?
Wyszukiwarka często zwraca „coś podobnego”. Reranking to dodatkowe sito: „z tych 20 wybierz 5 najlepszych”. Dzięki temu AI dostaje lepszy kontekst, a odpowiedzi są bardziej na temat.
Praktyczne zastosowania (konkretne scenariusze)
Scenariusz 1: W pojęciowniku
- Cel: zapytanie „prompt injection” → reranking wybiera fragmenty o ataku, a nie ogólnie o promptach.
- Wejście: lista wyników wyszukiwania.
- Kroki: pobierz kandydatów -> ponownie oceń -> wybierz najlepsze fragmenty.
- Rezultat: trafniejszy kontekst dla modelu.
- Zabezpieczenie: limity wyników i testy jakości.
Scenariusz 2: W firmie
- Cel: „procedura urlopowa” → reranking wybiera aktualny dokument, a nie stary.
- Wejście: lista wyników wyszukiwania.
- Kroki: pobierz kandydatów -> ponownie oceń -> wybierz najlepsze fragmenty.
- Rezultat: trafniejszy kontekst dla modelu.
- Zabezpieczenie: limity wyników i testy jakości.
Scenariusz 3: W aplikacji
- Cel: „jak zresetować hasło” → reranking podbija artykuł „Reset hasła”, a nie „polityka haseł”.
- Wejście: lista wyników wyszukiwania.
- Kroki: pobierz kandydatów -> ponownie oceń -> wybierz najlepsze fragmenty.
- Rezultat: trafniejszy kontekst dla modelu.
- Zabezpieczenie: limity wyników i testy jakości.
Ryzyka i jak je ograniczać
Ryzyko 1: Reranker promuje „ładne” teksty, a nie prawdziwe
- Ryzyko: reranker promuje „ładne” teksty, a nie prawdziwe.
- Jak ograniczać: testy na zestawach pytań + metryki jakości + ręczna kontrola.
Ryzyko 2: Koszty i opóźnienia
- Ryzyko: koszty i opóźnienia.
- Jak ograniczać: rerank tylko top-k, cache, profilowanie.
Ryzyko 3: Bias w wynikach
- Ryzyko: bias w wynikach.
- Jak ograniczać: audyt i obserwacja, różne typy pytań, analiza błędów.
Mapa powiązań
- Retrieval → reranking poprawia wyniki retrieval.
- RAG → kluczowy element jakości RAG.
- Embedding / Benchmark / Ewaluacja → jak mierzyć, czy jest lepiej.
- Monitoring jakości → wykrywanie pogorszeń.
- Mini-przepływ:
Wyniki top-20 → Rerank → top-5 → Kontekst
Diagram
flowchart LR
A[Wyniki top-20]
B[Reranking]
C[Top-5]
D[Kontekst]
E[Lepsza odpowiedź]
A --> B --> C --> D --> E
Diagram pokazuje, że po wstępnym wyszukaniu system wybiera najbardziej trafne fragmenty do odpowiedzi.