Stronniczość
Definicja
Stronniczość to sytuacja, w której model częściej faworyzuje jedne grupy lub rozwiązania, a inne traktuje gorzej.
Co to w zasadzie jest?
- Model uczy się na danych z przeszłości. Te dane mogą być niesprawiedliwe.
- Stronniczość może być ukryta i nieintencjonalna.
- W firmie ryzyko dotyczy między innymi komunikacji i automatycznej klasyfikacji spraw.
Praktyczne zastosowania (konkretne scenariusze)
Scenariusz 1: Klasyfikacja zgłoszeń
- Cel: klasyfikacja zgłoszeń: czy nie zaniża priorytetu wybranych tematów?.
- Wejście: wyniki modelu dla różnych grup albo tematów.
- Kroki: zbierz próbki -> porównaj wyniki -> popraw proces.
- Rezultat: mniejsze ryzyko nierównego traktowania.
- Zabezpieczenie: przegląd człowieka i testy na zróżnicowanych danych.
Scenariusz 2: Wzory odpowiedzi
- Cel: wzory odpowiedzi: czy język nie jest wykluczający?.
- Wejście: wyniki modelu dla różnych grup albo tematów.
- Kroki: zbierz próbki -> porównaj wyniki -> popraw proces.
- Rezultat: mniejsze ryzyko nierównego traktowania.
- Zabezpieczenie: przegląd człowieka i testy na zróżnicowanych danych.
Scenariusz 3: Rekrutacje
- Cel: rekrutacje: unikać automatycznych ocen bez kontroli.
- Wejście: wyniki modelu dla różnych grup albo tematów.
- Kroki: zbierz próbki -> porównaj wyniki -> popraw proces.
- Rezultat: mniejsze ryzyko nierównego traktowania.
- Zabezpieczenie: przegląd człowieka i testy na zróżnicowanych danych.
Typowe błędy i pułapki
- Brak testów na różnych przypadkach.
- Założenie, że „model jest neutralny”.
Ryzyka i jak je ograniczać
Ryzyko 1: Nierówne traktowanie
- Ryzyko: Nierówne traktowanie.
- Jak ograniczać: testy, kryteria oceny i przegląd wyników.
Ryzyko 2: Skargi i reputacja
- Ryzyko: Skargi i reputacja.
- Jak ograniczać: transparentność + poprawki.
Ryzyko 3: Błędy procesowe
- Ryzyko: Błędy procesowe.
- Jak ograniczać: polityka, monitoring.
Checklista “zanim użyjesz”
- Czy testuję na różnych przykładach?
- Czy mam kryteria oceny?
- Czy człowiek zatwierdza wyniki?
- Czy mogę wyjaśnić decyzję?
- Czy mam procedurę korekty?
Diagram
flowchart LR
A[Dane i proces]
B[Testy]
C[Wykrycie biasu]
D[Poprawki]
E[Monitoring]
A --> B --> C --> D --> E
Diagram pokazuje, że stronniczość trzeba wykrywać i ograniczać przez testy, poprawki i stały monitoring.
Dalsza lektura
Miejsce w mapie
- Bias → kontroluje: Ewaluacja
- Bias → wymaga: Transparentność
- Bias → wpływa na: Polityka AI