Przejdź do treści

Stronniczość

Definicja

Stronniczość to sytuacja, w której model częściej faworyzuje jedne grupy lub rozwiązania, a inne traktuje gorzej.

Co to w zasadzie jest?

Model uczy się na danych z przeszłości. Te dane mogą być niesprawiedliwe.
Stronniczość może być ukryta i nieintencjonalna.
W firmie ryzyko dotyczy między innymi komunikacji i automatycznej klasyfikacji spraw.

Praktyczne zastosowania (konkretne scenariusze)

Scenariusz 1: Klasyfikacja zgłoszeń

Cel: klasyfikacja zgłoszeń: czy nie zaniża priorytetu wybranych tematów?.
Wejście: wyniki modelu dla różnych grup albo tematów.
Kroki: zbierz próbki -> porównaj wyniki -> popraw proces.
Rezultat: mniejsze ryzyko nierównego traktowania.
Zabezpieczenie: przegląd człowieka i testy na zróżnicowanych danych.

Scenariusz 2: Wzory odpowiedzi

Cel: wzory odpowiedzi: czy język nie jest wykluczający?.
Wejście: wyniki modelu dla różnych grup albo tematów.
Kroki: zbierz próbki -> porównaj wyniki -> popraw proces.
Rezultat: mniejsze ryzyko nierównego traktowania.
Zabezpieczenie: przegląd człowieka i testy na zróżnicowanych danych.

Scenariusz 3: Rekrutacje

Cel: rekrutacje: unikać automatycznych ocen bez kontroli.
Wejście: wyniki modelu dla różnych grup albo tematów.
Kroki: zbierz próbki -> porównaj wyniki -> popraw proces.
Rezultat: mniejsze ryzyko nierównego traktowania.
Zabezpieczenie: przegląd człowieka i testy na zróżnicowanych danych.

Typowe błędy i pułapki

Brak testów na różnych przypadkach.
Założenie, że „model jest neutralny”.

Ryzyka i jak je ograniczać

Ryzyko 1: Nierówne traktowanie

Ryzyko: Nierówne traktowanie.
Jak ograniczać: testy, kryteria oceny i przegląd wyników.

Ryzyko 2: Skargi i reputacja

Ryzyko: Skargi i reputacja.
Jak ograniczać: transparentność + poprawki.

Ryzyko 3: Błędy procesowe

Ryzyko: Błędy procesowe.
Jak ograniczać: polityka, monitoring.

Checklista “zanim użyjesz”

Czy testuję na różnych przykładach?
Czy mam kryteria oceny?
Czy człowiek zatwierdza wyniki?
Czy mogę wyjaśnić decyzję?
Czy mam procedurę korekty?

Diagram

flowchart LR
    A[Dane i proces]
    B[Testy]
    C[Wykrycie biasu]
    D[Poprawki]
    E[Monitoring]
    A --> B --> C --> D --> E

Diagram pokazuje, że stronniczość trzeba wykrywać i ograniczać przez testy, poprawki i stały monitoring.

Dalsza lektura

Miejsce w mapie

Bias → kontroluje: Ewaluacja
Bias → wymaga: Transparentność
Bias → wpływa na: Polityka AI

Powiązane hasła