Interaktywny ebook AI - AIholics × Włącz Wizję

Szukaj w tytułach i treści

Kategoria

Widoczne hasła: 118

Najprostsza ścieżka czytania

Przeczytaj Definicję.
Potem przejdź do sekcji Co to w zasadzie jest? i do praktyki.
Na końcu sprawdź Ryzyka i Powiązane hasła.

Przycisk „Pokaż tylko podstawy” ukrywa sekcje dodatkowe, takie jak metadane, mapa powiązań, dalsza lektura i propozycje ilustracji.

Legenda sekcji

Definicja: krótkie wyjaśnienie bez ocen.
Co to w zasadzie jest?: to samo pojęcie opisane prościej.
Po co w praktyce / Praktyczne zastosowania: kiedy i po co to pojęcie ma znaczenie.
Typowe błędy i pułapki: najczęstsze pomyłki.
Ryzyka i jak je ograniczać: co może pójść źle i jak temu zapobiec.
Checklista: szybka lista do sprawdzenia przed użyciem.
Diagram: jeden prosty diagram Mermaid i krótki opis zaczynający się od „Diagram pokazuje...”.
Dalsza lektura: źródła, standardy i materiały do pogłębienia.
Miejsce w mapie: relacje z innymi pojęciami.
Powiązane hasła: linki do kolejnych haseł, które warto otworzyć.

Hasła

AB testy

Kategoria: Jakość i ewaluacja Tagi:

Definicja

AB testy polegają na porównaniu dwóch wersji rozwiązania. Obie wersje działają w tych samych warunkach. Dzięki temu można sprawdzić, która działa lepiej.

Po co w praktyce

Scenariusz 1: Poprawa skuteczności asystenta

Cel: poprawa skuteczności asystenta.
Wejście: dwie instrukcje systemowe.
Kroki: uruchom A/B -> mierz jakość -> wybierz wersję.
Rezultat: lepsza odpowiedź.
Zabezpieczenie: stałe kryteria oceny.

Scenariusz 2: Poprawa FAQ

Cel: poprawa FAQ.
Wejście: dwie wersje tekstu.
Kroki: test ruchu -> pomiar -> decyzja.
Rezultat: wyższa skuteczność.
Zabezpieczenie: kontrola stronniczości grup.

Scenariusz 3: Optymalizacja automatyzacji

Cel: optymalizacja automatyzacji.
Wejście: dwa przepływy pracy.
Kroki: test czasu i błędów -> analiza -> wdrożenie.
Rezultat: sprawniejszy proces.
Zabezpieczenie: plan wycofania zmian.

Ryzyka i jak je ograniczać

Ryzyko 1: Błędna interpretacja

Ryzyko: Błędna interpretacja.
Jak ograniczać: ustal metryki i sprawdź istotność statystyczną.

Ryzyko 2: Stronniczość grup

Ryzyko: Stronniczość grup.
Jak ograniczać: stosuj losowy podział i kontroluj rozkład.

Ryzyko 3: Złe wdrożenie

Ryzyko: Złe wdrożenie.
Jak ograniczać: wprowadzaj zmiany stopniowo i prowadź monitoring.

Checklista

Czy jest jedna zmienna testowa?
Czy metryki są zdefiniowane?
Czy próbka jest wystarczająca?
Czy masz plan rollbacku?
Czy wyniki są udokumentowane?

Dalsza lektura

Miejsce w mapie

AB testy -> uzupełniają: Benchmark
AB testy -> wspierają: Ewaluacja (evaluation)
AB testy -> wspierają: Monitoring jakości

Co to w zasadzie jest?

Wersja A i wersja B są testowane na podobnych danych lub grupach.
Metryki pokazują, która wersja daje lepszy wynik.
To metoda decyzji oparta na danych, nie na intuicji.

Typowe błędy i pułapki

Za mała próbka testowa.
Zmiana wielu zmiennych na raz.
Brak kryteriów sukcesu.

Diagram

Diagram pokazuje, że A/B test polega na porównaniu dwóch wersji w tych samych warunkach, zebraniu metryk i wyborze lepszego wariantu po analizie wyników.

Agent AI

Kategoria: Organizacja i zarządzanie Tagi:

Definicja

Agent AI to system, który planuje i wykonuje zadania. Często korzysta z narzędzi i danych zewnętrznych. Może przejść przez kilka kroków zamiast udzielić jednej odpowiedzi. To opis sposobu działania aplikacji, a nie pojedynczego modelu.

Po co w praktyce

Scenariusz 1: Automatyzacja raportu tygodniowego

Cel: automatyzacja raportu tygodniowego.
Wejście: dane z CRM i narzędzia BI.
Kroki: pobierz -> podsumuj -> wyślij.
Rezultat: raport na czas.
Zabezpieczenie: zatwierdzenie przed wysyłką.

Scenariusz 2: Obsługa zgłoszeń

Cel: obsługa zgłoszeń.
Wejście: zgłoszenie.
Kroki: klasyfikacja -> propozycja odpowiedzi -> eskalacja.
Rezultat: szybsza obsługa.
Zabezpieczenie: człowiek w pętli.

Scenariusz 3: Porządkowanie dokumentów

Cel: porządkowanie dokumentów.
Wejście: folder z plikami.
Kroki: analiza → tagowanie → archiwizacja.
Rezultat: uporządkowana baza.
Zabezpieczenie: ograniczenia uprawnień.

Ryzyka i jak je ograniczać

Ryzyko 1: Niepożądane działania

Ryzyko: Niepożądane działania.
Jak ograniczać: ograniczenia narzędzi i uprawnień.

Ryzyko 2: Błędy w automatyzacji

Ryzyko: Błędy w automatyzacji.
Jak ograniczać: przegląd wyników i testy.

Ryzyko 3: Brak śladu audytowego

Ryzyko: Brak śladu audytowego.
Jak ograniczać: logowanie kroków.

Checklista

Czy agent ma minimalne uprawnienia?
Czy wiesz, jakie narzędzia może uruchamiać?
Czy jest kontrola człowieka w kluczowych krokach?
Czy logujesz wszystkie działania?
Czy masz plan awaryjny?

Dalsza lektura

Miejsce w mapie

Agent AI → wykorzystuje: Orkiestracja
Agent AI → wymaga: Human-in-the-loop
Agent AI → zwiększa wagę: Audit trail

Co to w zasadzie jest?

Agent AI to „samodzielny wykonawca”, który realizuje cel krok po kroku.
Może pobierać dane, uruchamiać akcje i tworzyć wyniki.
Wymaga jasnych granic i kontroli, bo działa bardziej autonomicznie.
Najlepiej sprawdza się w dobrze zdefiniowanych procesach.

Typowe błędy i pułapki

Zbyt szerokie uprawnienia agenta.
Brak logowania działań.
Zaufanie bez weryfikacji.

Diagram

Diagram pokazuje, że agent AI nie tylko odpowiada, ale planuje kroki, używa narzędzi i przekazuje wynik do zatwierdzenia.

Powiązane hasła

Asystent AI
Orkiestracja
Human-in-the-loop
Audit trail
Guardrails

AI Act (Akt w sprawie sztucznej inteligencji)

Kategoria: Prawo i etyka Tagi: ai act prawo zgodność ryzyko governance

Definicja

AI Act to unijne rozporządzenie regulujące sztuczną inteligencję. Wprowadza podejście oparte na poziomie ryzyka i określa obowiązki dla wybranych systemów AI oraz modeli ogólnego przeznaczenia.

Po co w praktyce

Scenariusz 1: Weryfikacja systemu do oceny wniosków

Cel: sprawdzić, czy system używany w urzędzie albo firmie podlega szczególnym obowiązkom.
Wejście: opis systemu, jego funkcje, dane wejściowe i proces decyzyjny.
Kroki: analiza zastosowania -> ocena poziomu ryzyka -> decyzja o wymaganiach.
Rezultat: wiadomo, czy potrzebna jest dokumentacja, nadzór i dodatkowe kontrole.
Zabezpieczenie: przegląd prawny i udział właściciela procesu.

Scenariusz 2: Zakup gotowego narzędzia AI od dostawcy

Cel: ocenić, czy kupowane rozwiązanie spełnia wymagania regulacyjne.
Wejście: oferta dostawcy, opis produktu, warunki korzystania i deklaracje zgodności.
Kroki: przegląd umowy -> ocena obowiązków -> sprawdzenie dokumentacji dostawcy.
Rezultat: mniejsze ryzyko zakupu narzędzia, którego nie da się bezpiecznie wdrożyć.
Zabezpieczenie: checklista zakupowa i zapis o odpowiedzialności dostawcy.

Scenariusz 3: Wdrożenie modelu do wsparcia rekrutacji

Cel: ocenić, czy użycie AI w procesie kadrowym wymaga dodatkowych zabezpieczeń.
Wejście: opis funkcji modelu, zakres decyzji i dane kandydatów.
Kroki: analiza procesu -> ocena wpływu na osoby -> decyzja o dopuszczalności użycia.
Rezultat: wiadomo, czy rozwiązanie można wdrożyć i w jakiej formie.
Zabezpieczenie: human-in-the-loop i dokumentacja decyzji.

Ryzyka i jak je ograniczać

Ryzyko 1: Błędna klasyfikacja systemu

Ryzyko: błędna klasyfikacja systemu.
Jak ograniczać: prowadź ocenę ryzyka przed wdrożeniem.

Ryzyko 2: Brak zgodności formalnej

Ryzyko: brak zgodności formalnej.
Jak ograniczać: twórz dokumentację i przypisz właściciela procesu.

Ryzyko 3: Użycie niedozwolonego zastosowania

Ryzyko: użycie niedozwolonego zastosowania.
Jak ograniczać: weryfikuj przypadki użycia przed zakupem lub uruchomieniem.

Ryzyko 4: Kary i konieczność wycofania systemu

Ryzyko: kary i konieczność wycofania systemu.
Jak ograniczać: łącz przegląd prawny z przeglądem operacyjnym.

Checklista

Czy wiadomo, do czego dokładnie służy system?
Czy oceniono poziom ryzyka?
Czy wiadomo, kto odpowiada za zgodność?
Czy dostawca przekazał potrzebną dokumentację?
Czy użytkownicy znają ograniczenia systemu?

Dalsza lektura

Miejsce w mapie

AI Act (Akt w sprawie sztucznej inteligencji) → wspiera: AI Governance (Ład korporacyjny AI)

AI Act (Akt w sprawie sztucznej inteligencji) → wymaga: RODO / DPIA

AI Act (Akt w sprawie sztucznej inteligencji) → zwiększa wagę: Transparentność

Co to w zasadzie jest?

To zestaw reguł mówiących, kiedy i jak można wdrażać AI w organizacji. Nie każdy system AI podlega tym samym obowiązkom. Im większe ryzyko dla ludzi, praw i bezpieczeństwa, tym więcej wymagań.

Dla organizacji oznacza to potrzebę sprawdzenia:

czy dane rozwiązanie w ogóle podpada pod AI Act,
jaki ma poziom ryzyka,
jakie obowiązki trzeba spełnić przed wdrożeniem i w trakcie używania.

Typowe błędy i pułapki

Założenie, że każde narzędzie AI działa poza regulacją.
Traktowanie AI Act jako problemu wyłącznie działu prawnego.
Brak klasyfikacji systemu przed wdrożeniem.
Kupowanie narzędzia bez sprawdzenia obowiązków po stronie organizacji.

Diagram

Diagram pokazuje, że przed wdrożeniem AI trzeba najpierw ocenić zastosowanie, poziom ryzyka i wymagane obowiązki.

Powiązane hasła

AI Governance (Ład korporacyjny AI)

GPAI

RODO / DPIA

Transparentność

Human-in-the-loop (człowiek w pętli)

---

AI Governance (Ład korporacyjny AI)

Kategoria: Organizacja i zarządzanie Tagi: governance zarządzanie zgodność polityka ai nadzór

Definicja

AI Governance to zbiór zasad, ról, procesów i mechanizmów nadzoru, które pomagają organizacji wdrażać AI w sposób bezpieczny, zgodny z prawem i kontrolowany biznesowo.

Po co w praktyce

Scenariusz 1: Zatwierdzanie nowych projektów AI

Cel: uporządkować wdrażanie nowych zastosowań AI.
Wejście: opis projektu, dane, cel biznesowy i ryzyka.
Kroki: zgłoszenie projektu -> ocena ryzyka -> decyzja o wdrożeniu.
Rezultat: wiadomo, które projekty mogą wejść do realizacji.
Zabezpieczenie: udział prawa, bezpieczeństwa i właściciela biznesowego.

Scenariusz 2: Powołanie właścicieli procesu AI

Cel: przypisać odpowiedzialność za systemy AI.
Wejście: lista narzędzi, zastosowań i właścicieli biznesowych.
Kroki: identyfikacja systemów -> przypisanie ról -> opis odpowiedzialności.
Rezultat: mniej chaosu i szybsze decyzje przy incydentach.
Zabezpieczenie: centralny rejestr zastosowań AI.

Scenariusz 3: Przegląd zgodności i jakości

Cel: regularnie oceniać, czy system AI nadal spełnia wymagania.
Wejście: metryki jakości, incydenty, zmiany w procesie i dokumentacja.
Kroki: przegląd okresowy -> ocena ryzyk -> decyzja o zmianach.
Rezultat: system nie działa bez nadzoru i kontroli.
Zabezpieczenie: harmonogram przeglądów i checklisty zgodności.

Ryzyka i jak je ograniczać

Ryzyko 1: Brak odpowiedzialności

Ryzyko: brak odpowiedzialności.
Jak ograniczać: przypisz role i właścicieli systemów.

Ryzyko 2: Rozjazd decyzji w organizacji

Ryzyko: rozjazd decyzji w organizacji.
Jak ograniczać: wprowadź wspólny proces oceny zastosowań.

Ryzyko 3: Brak zgodności

Ryzyko: brak zgodności.
Jak ograniczać: łącz governance z przeglądem prawnym i bezpieczeństwa.

Ryzyko 4: Spadek jakości bez reakcji

Ryzyko: spadek jakości bez reakcji.
Jak ograniczać: dodaj monitoring jakości i regularne przeglądy.

Checklista

Czy wiadomo, kto odpowiada za ten system?
Czy istnieje proces zgłaszania i zatwierdzania AI?
Czy oceniono ryzyka prawne i operacyjne?
Czy są zasady dla danych i jakości?
Czy organizacja prowadzi rejestr zastosowań AI?

Miejsce w mapie

AI Governance (Ład korporacyjny AI) → wspiera: Polityka użycia AI w organizacji

AI Governance (Ład korporacyjny AI) → wymaga: Ślad audytowy

AI Governance (Ład korporacyjny AI) → zwiększa wagę: RODO / DPIA

Co to w zasadzie jest?

To sposób uporządkowania odpowiedzialności za AI w organizacji. Nie chodzi tylko o technologię. Chodzi też o decyzje, ryzyka, zgodność, jakość i odpowiedzialność za skutki wdrożenia.

AI Governance odpowiada na pytania:

kto może wdrażać AI,
kto zatwierdza nowe użycia,
jak ocenia się ryzyko,
jak kontroluje się jakość i zgodność.

Typowe błędy i pułapki

Traktowanie governance jako papierowego obowiązku.
Brak właściciela biznesowego systemu.
Brak połączenia między bezpieczeństwem, prawem i operacjami.
Wdrażanie AI bez procesu zatwierdzania.

Diagram

Diagram pokazuje, że AI Governance porządkuje drogę od pomysłu na AI do wdrożenia i późniejszego nadzoru.

Powiązane hasła

Polityka użycia AI w organizacji

AI Act (Akt w sprawie sztucznej inteligencji)

RODO / DPIA

Ślad audytowy

Monitoring jakości

---

AI Literacy (Kompetencje AI)

Kategoria: Organizacja i zarządzanie Tagi: ai literacy kompetencje edukacja wdrożenie użytkownicy

Definicja

AI Literacy to praktyczne rozumienie tego, czym jest AI, do czego może służyć, jakie ma ograniczenia i jak używać jej odpowiedzialnie w codziennej pracy.

Po co w praktyce

Scenariusz 1: Szkolenie pracowników biurowych

Cel: nauczyć bezpiecznego i sensownego używania AI w codziennej pracy.
Wejście: grupa użytkowników, przykładowe zadania i zasady organizacji.
Kroki: szkolenie podstawowe -> ćwiczenia na scenariuszach -> sprawdzenie zrozumienia.
Rezultat: pracownicy lepiej rozumieją, kiedy AI pomaga, a kiedy szkodzi.
Zabezpieczenie: materiały o danych wrażliwych, halucynacjach i odpowiedzialności.

Scenariusz 2: Wdrożenie nowego asystenta AI

Cel: przygotować użytkowników do pracy z narzędziem.
Wejście: opis narzędzia, przypadki użycia i ograniczenia systemu.
Kroki: onboarding -> pokaz dobrych praktyk -> checklista użytkownika.
Rezultat: mniej błędów i mniej nadmiernego zaufania.
Zabezpieczenie: jasne reguły pracy i kanał zgłaszania problemów.

Scenariusz 3: Przygotowanie kadry kierowniczej

Cel: podnieść jakość decyzji o zakupie i użyciu AI.
Wejście: przykłady wdrożeń, ryzyka i wymagania zgodności.
Kroki: warsztat decyzyjny -> omówienie ryzyk -> zasady oceny wdrożeń.
Rezultat: lepsze decyzje zarządcze i mniej przypadkowych inwestycji.
Zabezpieczenie: połączenie perspektywy biznesowej, prawnej i bezpieczeństwa.

Ryzyka i jak je ograniczać

Ryzyko 1: Błędne użycie AI

Ryzyko: błędne użycie AI.
Jak ograniczać: szkol użytkowników na realnych przykładach.

Ryzyko 2: Nadmierne zaufanie

Ryzyko: nadmierne zaufanie.
Jak ograniczać: ucz weryfikacji i krytycznego myślenia.

Ryzyko 3: Shadow AI

Ryzyko: shadow AI.
Jak ograniczać: daj bezpieczne narzędzia i jasne zasady.

Ryzyko 4: Brak trwałego efektu

Ryzyko: brak trwałego efektu.
Jak ograniczać: planuj edukację jako proces, nie jedną prezentację.

Checklista

Czy użytkownicy znają ograniczenia AI?
Czy wiedzą, jak pracować z danymi wrażliwymi?
Czy wiedzą, kiedy trzeba sprawdzić wynik ręcznie?
Czy znają politykę organizacji?
Czy mają gdzie zgłaszać błędy i ryzyka?

Miejsce w mapie

AI Literacy (Kompetencje AI) → wspiera: Polityka użycia AI w organizacji

AI Literacy (Kompetencje AI) → ogranicza ryzyko: Nadmierne zaufanie (Overreliance)

AI Literacy (Kompetencje AI) → ogranicza ryzyko: Shadow AI (Szara strefa AI)

Co to w zasadzie jest?

To nie jest wiedza tylko dla specjalistów technicznych. Chodzi o podstawowy poziom świadomości użytkownika, lidera albo pracownika, który korzysta z AI albo podejmuje decyzje o jej wdrożeniu.

AI Literacy obejmuje między innymi:

rozumienie ograniczeń modeli,
rozpoznawanie ryzyk,
umiejętność weryfikacji odpowiedzi,
podstawy pracy na danych,
znajomość zasad organizacji.

Typowe błędy i pułapki

Założenie, że AI Literacy to tylko obsługa jednego narzędzia.
Szkolenie bez praktycznych scenariuszy.
Pomijanie tematu danych i odpowiedzialności.
Traktowanie edukacji jako jednorazowego wydarzenia.

Diagram

Diagram pokazuje, że kompetencje AI zmniejszają liczbę błędów i zwiększają odpowiedzialne użycie narzędzi.

Powiązane hasła

Polityka użycia AI w organizacji

Nadmierne zaufanie (Overreliance)

Shadow AI (Szara strefa AI)

Human-in-the-loop (człowiek w pętli)

Fact-checking (weryfikacja faktów)

---

Anonimizacja / pseudonimizacja

Kategoria: Prawo i etyka Tagi:

Definicja

Anonimizacja usuwa możliwość rozpoznania osoby. Pseudonimizacja zastępuje identyfikatory, na przykład nazwisko, innym oznaczeniem. Zwykle pozwala wrócić do danych przy użyciu klucza.

Po co w praktyce

Scenariusz 1: Szkic odpowiedzi na pismo

Cel: szkic odpowiedzi na pismo: zastąp nazwiska i numery identyfikatorów.
Wejście: tekst, zgłoszenie albo przykład z danymi identyfikującymi.
Kroki: usuń identyfikatory -> zastąp szczegóły -> sprawdź ryzyko ponownej identyfikacji.
Rezultat: materiał gotowy do bezpieczniejszej analizy.
Zabezpieczenie: minimalizacja danych i przegląd prywatności.

Scenariusz 2: Analiza skarg/zgłoszeń

Cel: analiza skarg/zgłoszeń: usuń dane kontaktowe i szczegóły identyfikujące.
Wejście: tekst, zgłoszenie albo przykład z danymi identyfikującymi.
Kroki: usuń identyfikatory -> zastąp szczegóły -> sprawdź ryzyko ponownej identyfikacji.
Rezultat: materiał gotowy do bezpieczniejszej analizy.
Zabezpieczenie: minimalizacja danych i przegląd prywatności.

Scenariusz 3: Szkolenia

Cel: szkolenia: przykłady na danych syntetycznych.
Wejście: tekst, zgłoszenie albo przykład z danymi identyfikującymi.
Kroki: usuń identyfikatory -> zastąp szczegóły -> sprawdź ryzyko ponownej identyfikacji.
Rezultat: materiał gotowy do bezpieczniejszej analizy.
Zabezpieczenie: minimalizacja danych i przegląd prywatności.

Ryzyka i jak je ograniczać

Ryzyko 1: Reidentyfikacja

Ryzyko: Reidentyfikacja.
Jak ograniczać: usuń rzadkie szczegóły, agreguj dane.

Ryzyko 2: Błędy procesu

Ryzyko: Błędy procesu.
Jak ograniczać: checklista + drugi czytelnik.

Ryzyko 3: Brak spójności

Ryzyko: Brak spójności.
Jak ograniczać: standard anonimizacji w organizacji.

Checklista

Czy usunąłem nazwiska, adresy, numery?
Czy usunąłem dane rzadkie, które identyfikują?
Czy klucz pseudonimizacji jest chroniony?
Czy narzędzie AI jest zatwierdzone?
Czy loguję użycie?

Dalsza lektura

Miejsce w mapie

Anonimizacja → chroni: PII
Anonimizacja → wspiera: Polityka użycia AI
Anonimizacja → powiązana z: DLP

Co to w zasadzie jest?

Anonimizacja jest „mocniejsza”, ale trudniejsza.
Pseudonimizacja jest częstsza w procesach, bo pozwala śledzić sprawę bez ujawniania nazwisk.
Do narzędzi AI najbezpieczniej podawać dane zanonimizowane lub pseudonimizowane.

Typowe błędy i pułapki

Zostawienie „pośrednich” identyfikatorów, na przykład opisu „jedyna osoba na tym stanowisku”.
Pseudonimizacja bez kontroli klucza.

Diagram

Diagram pokazuje, że dane osobowe są przetwarzane tak, aby ograniczyć możliwość identyfikacji osoby przed dalszym użyciem.

Powiązane hasła

PII
DLP
RODO / DPIA
Audit trail
Human-in-the-loop

API

Kategoria: Wdrożenia i operacje (LLMOps) Tagi:

Definicja

API to sposób, w jaki systemy komputerowe „rozmawiają” ze sobą. Na przykład aplikacja organizacji wysyła zapytanie do modelu i odbiera odpowiedź.

Po co w praktyce

Scenariusz 1: Asystent na intranecie do procedur

Cel: asystent na intranecie do procedur.
Wejście: wymagania procesu i dostępne systemy.
Kroki: wybierz endpoint -> przekaż dane -> odbierz wynik.
Rezultat: integracja działa w kontrolowany sposób.
Zabezpieczenie: uwierzytelnianie, limity i logowanie.

Scenariusz 2: Generator szkiców pism w systemie obiegu dokumentów

Cel: generator szkiców pism w systemie obiegu dokumentów.
Wejście: wymagania procesu i dostępne systemy.
Kroki: wybierz endpoint -> przekaż dane -> odbierz wynik.
Rezultat: integracja działa w kontrolowany sposób.
Zabezpieczenie: uwierzytelnianie, limity i logowanie.

Scenariusz 3: Automatyczne kategoryzowanie zgłoszeń

Cel: automatyczne kategoryzowanie zgłoszeń.
Wejście: wymagania procesu i dostępne systemy.
Kroki: wybierz endpoint -> przekaż dane -> odbierz wynik.
Rezultat: integracja działa w kontrolowany sposób.
Zabezpieczenie: uwierzytelnianie, limity i logowanie.

Ryzyka i jak je ograniczać

Ryzyko 1: Wycieki danych

Ryzyko: Wycieki danych.
Jak ograniczać: anonimizacja + DLP.

Ryzyko 2: Nadużycia

Ryzyko: Nadużycia.
Jak ograniczać: IAM i limity zapytań.

Ryzyko 3: Błędy jakości

Ryzyko: Błędy jakości.
Jak ograniczać: ewaluacja i monitoring.

Checklista

Czy API ma uwierzytelnianie?
Czy są limity zapytań?
Czy logujesz parametry i źródła?
Czy dane są filtrowane (PII)?
Czy masz testy regresji?

Dalsza lektura

Miejsce w mapie

API → używa: Temperatura
API → wspiera: Orkiestracja
API → wymaga: SSO/IAM

Co to w zasadzie jest?

API to „formularz” dla programu: co wysłać i co dostaniesz.
Pozwala zintegrować AI z intranetem, formularzami czy systemem zgłoszeń.
Daje większą kontrolę nad logami, limitami i uprawnieniami.

Typowe błędy i pułapki

Brak limitów (koszty i nadużycia).
Brak logów i śladu audytowego.

Diagram

Diagram pokazuje, że API pośredniczy między aplikacją a usługą AI i kontroluje sposób wymiany danych.

Powiązane hasła

Orkiestracja
SSO / IAM
Audit trail
DLP
RAG

Asystent AI

Kategoria: Organizacja i zarządzanie Tagi:

Definicja

Asystent AI to narzędzie do rozmowy z użytkownikiem. Odpowiada na pytania, tłumaczy i pomaga w zadaniach. Zwykle działa w określonym zakresie. Sam nie wykonuje działań w systemach.

Po co w praktyce

Scenariusz 1: Wsparcie działu obsługi klienta

Cel: wsparcie działu obsługi klienta.
Wejście: pytanie klienta.
Kroki: odpowiedź -> korekta -> wysyłka.
Rezultat: szybka reakcja.
Zabezpieczenie: przegląd odpowiedzi.

Scenariusz 2: Wsparcie pracowników w procedurach

Cel: wsparcie pracowników w procedurach.
Wejście: pytanie o proces.
Kroki: wyszukaj → wyjaśnij → podaj źródło.
Rezultat: krótkie wskazówki.
Zabezpieczenie: cytaty i źródła.

Scenariusz 3: Pomoc w redakcji treści

Cel: pomoc w redakcji treści.
Wejście: szkic tekstu.
Kroki: propozycje → wybór → redakcja.
Rezultat: poprawiony tekst.
Zabezpieczenie: kontrola stylu.

Ryzyka i jak je ograniczać

Ryzyko 1: Halucynacje

Ryzyko: Halucynacje.
Jak ograniczać: proś o źródła i sprawdzaj odpowiedzi.

Ryzyko 2: Dane osobowe

Ryzyko: Dane osobowe.
Jak ograniczać: anonimizuj dane i stosuj jasne zasady.

Ryzyko 3: Stronniczość

Ryzyko: Stronniczość.
Jak ograniczać: testuj jakość na różnych przykładach.

Checklista

Czy asystent ma jasno zdefiniowany zakres?
Czy odpowiedzi są weryfikowane?
Czy dane wrażliwe są chronione?
Czy masz monitoring jakości?
Czy użytkownicy są przeszkoleni?

Dalsza lektura

OWASP LLM Top 10

Miejsce w mapie

Asystent AI → oparty o: LLM
Asystent AI → wspiera: RAG
Asystent AI → wymaga: Instrukcja systemowa

Co to w zasadzie jest?

To „czatowy pomocnik”, który tłumaczy, streszcza i podpowiada.
Pomaga w codziennych zadaniach, ale nie podejmuje decyzji sam.
Jakość zależy od danych i konfiguracji.
Wymaga weryfikacji w ważnych procesach.

Typowe błędy i pułapki

Traktowanie asystenta jako źródła prawdy.
Brak kontekstu w zapytaniu.
Brak weryfikacji odpowiedzi.

Diagram

Diagram pokazuje, że asystent AI odpowiada na pytanie, ale wynik powinien przejść przez etap sprawdzenia.

Powiązane hasła

Agent AI
LLM
RAG
Instrukcja systemowa
Guardrails

Baza wektorowa (Vector database)

Kategoria: Retrieval / RAG Tagi: rag retrieval wyszukiwanie vector database

Definicja

Baza wektorowa to system, który przechowuje embeddingi i pozwala szybko znaleźć najbardziej podobne fragmenty treści.

Po co w praktyce

Scenariusz 1: Asystent procedur

Cel: asystent procedur.
Wejście: pytanie.
Kroki: embedding → search w bazie → cytaty.
Rezultat: odpowiedź z linkami.
Zabezpieczenie: tylko zatwierdzone źródła.

Scenariusz 2: Obsługa infolinii (skrypty)

Cel: obsługa infolinii (skrypty).
Wejście: temat rozmowy.
Kroki: wyszukaj podobne przypadki → podpowiedzi.
Rezultat: szybsza obsługa.
Zabezpieczenie: log + kontrola jakości.

Scenariusz 3: Wyszukiwanie w regulaminch/zarządzeniach

Cel: wyszukiwanie w regulaminch/zarządzeniach.
Wejście: fraza „po sensie”.
Kroki: embedding → top fragmenty.
Rezultat: lista cytatów.
Zabezpieczenie: wersjonowanie dokumentów.

Ryzyka i jak je ograniczać

Ryzyko 1: Zatrucie bazy (poisoning)

Ryzyko: Zatrucie bazy (poisoning): wstrzyknięty złośliwy fragment.
Jak ograniczać: whitelist źródeł + review.

Ryzyko 2: Prywatność

Ryzyko: Prywatność: embeddingi mogą „niosą” sens danych.
Jak ograniczać: polityka danych + anonimizacja.

Ryzyko 3: Błędne cytowanie

Ryzyko: Błędne cytowanie: brak kontroli fragmentów.
Jak ograniczać: zawsze pokazuj źródło i cytat.

Checklista

Czy źródła są zatwierdzone?
Czy jest proces aktualizacji indeksu?
Czy są filtry po dziale i dacie?
Czy wynik zawsze pokazuje cytat i link?
Czy logujesz zapytania (audit trail)?

Dalsza lektura

Miejsce w mapie

Baza wektorowa → przechowuje: Embedding
Baza wektorowa → umożliwia: RAG
Baza wektorowa → narażona na: Data poisoning

Co to w zasadzie jest?

To „wyszukiwarka po znaczeniu”, tylko zoptymalizowana pod liczby (wektory).
Zamiast szukać słów kluczowych, szuka „najbliższych sensów”.
Najczęściej działa razem z RAG.

Typowe błędy i pułapki

Brak filtrów po dacie/typie dokumentu.
Niewłaściwe metadane (tagi) → złe wyniki.
Indeks nieaktualny.

Diagram

Diagram pokazuje, że baza wektorowa służy do wyszukiwania podobnych treści po znaczeniu, a nie tylko po słowach.

Powiązane hasła

Embedding
Chunking
RAG
Audit trail
Konektory danych

Benchmark

Kategoria: Jakość i ewaluacja Tagi:

Definicja

Benchmark to zestaw testów, który pozwala porównać modele lub ustawienia na tych samych zasadach.

Po co w praktyce

Scenariusz 1: Porównanie dwóch konfiguracji RAG dla procedur

Cel: porównanie dwóch konfiguracji RAG dla procedur.
Wejście: dwa warianty rozwiązania i zestaw testowy.
Kroki: ustal kryteria -> uruchom test -> porównaj wyniki.
Rezultat: porównanie oparte na tych samych warunkach.
Zabezpieczenie: stała metryka i ten sam zestaw danych.

Scenariusz 2: Porównanie stylu komunikatów (czytelność, plain language)

Cel: porównanie stylu komunikatów (czytelność, plain language).
Wejście: dwa warianty rozwiązania i zestaw testowy.
Kroki: ustal kryteria -> uruchom test -> porównaj wyniki.
Rezultat: porównanie oparte na tych samych warunkach.
Zabezpieczenie: stała metryka i ten sam zestaw danych.

Scenariusz 3: Porównanie bezpieczeństwa, na przykład odporności na wstrzyknięcie poleceń

Cel: porównanie bezpieczeństwa, na przykład odporności na wstrzyknięcie poleceń.
Wejście: dwa warianty rozwiązania i zestaw testowy.
Kroki: ustal kryteria -> uruchom test -> porównaj wyniki.
Rezultat: porównanie oparte na tych samych warunkach.
Zabezpieczenie: stała metryka i ten sam zestaw danych.

Ryzyka i jak je ograniczać

Ryzyko 1: Zły dobór testów

Ryzyko: Zły dobór testów.
Jak ograniczać: udział użytkowników i przykłady z praktyki.

Ryzyko 2: Nadmierna optymalizacja pod test

Ryzyko: Nadmierna optymalizacja pod test.
Jak ograniczać: mieszanka przykładów + losowanie.

Ryzyko 3: Brak porównywalności

Ryzyko: Brak porównywalności.
Jak ograniczać: stała metodologia i wersjonowanie.

Checklista

Czy testy obejmują realne scenariusze?
Czy masz rubrykę oceny?
Czy testujesz też bezpieczeństwo?
Czy zapisujesz wyniki i wersje?
Czy benchmark jest aktualny?

Dalsza lektura

Miejsce w mapie

Benchmark → część: Ewaluacja
Benchmark → wspiera: A/B testy
Benchmark → kontroluje: Monitoring jakości

Co to w zasadzie jest?

To jak „sprawdzian” z ustalonymi pytaniami.
Dzięki temu wiesz, czy nowa wersja jest lepsza, czy tylko „inna”.
Benchmark powinien odpowiadać na realne potrzeby organizacji.

Typowe błędy i pułapki

Benchmark z zadaniami ułożonymi „pod model”, a nie pod użytkownika.
Brak aktualizacji benchmarku po zmianach procesów.

Diagram

Diagram pokazuje, że benchmark porównuje modele lub rozwiązania na wspólnym zestawie testowym, aby zmierzyć ich jakość.

Powiązane hasła

Ewaluacja
A/B testy
Monitoring jakości
LLMOps
RAG

Biblioteka promptów (szablony)

Kategoria: Prompting Tagi: prompt prompting jakosc procesy praktyka

Definicja

Biblioteka promptów to zestaw sprawdzonych szablonów poleceń do powtarzalnych zadań: streszczeń, analiz, komunikatów, klasyfikacji albo checklist.

Po co w praktyce

Scenariusz 1: Streszczenia dokumentów

Cel: ujednolicenie streszczeń.
Wejście: dokument i szablon streszczenia.
Kroki: wstaw dokument -> użyj szablonu -> sprawdź wynik.
Rezultat: streszczenia w stałym formacie.
Zabezpieczenie: kontrola źródeł i braków.

Scenariusz 2: Posty do mediów społecznościowych

Cel: spójny ton i długość komunikatów.
Wejście: temat, grupa odbiorców i format.
Kroki: wybór szablonu -> generowanie -> redakcja.
Rezultat: szybsze przygotowanie wersji roboczej.
Zabezpieczenie: przegląd redakcyjny.

Scenariusz 3: Ocena jakości treści

Cel: powtarzalna ocena według tych samych kryteriów.
Wejście: tekst i rubryka oceny.
Kroki: ocena -> uzasadnienie -> propozycja poprawki.
Rezultat: łatwiejsze porównanie jakości.
Zabezpieczenie: testy A/B i ewaluacja.

Ryzyka i jak je ograniczać

Ryzyko 1: Przestarzały szablon

Ryzyko: Przestarzały szablon.
Jak ograniczać: wersjonuj prompty i testuj je okresowo.

Ryzyko 2: Dane wrażliwe w placeholderach

Ryzyko: Dane wrażliwe w placeholderach.
Jak ograniczać: stosuj anonimizację i DLP.

Ryzyko 3: Rozjazd standardów w zespole

Ryzyko: Rozjazd standardów w zespole.
Jak ograniczać: trzymaj jedną zatwierdzoną bibliotekę.

Checklista

Czy prompt ma właściciela?
Czy wiadomo, do jakiego zadania służy?
Czy ma wersję i datę aktualizacji?
Czy był testowany na przykładach?

Dalsza lektura

OpenAI — Prompting

Miejsce w mapie

Biblioteka promptów → porządkuje: Prompt
Biblioteka promptów → wspiera: Ewaluacja
Biblioteka promptów → powinna być opisana w: Polityka użycia AI w organizacji

Co to w zasadzie jest?

Zamiast za każdym razem pisać od zera, masz gotowce. Wkładasz dane w wyznaczone miejsca i dostajesz bardziej przewidywalny format odpowiedzi.

To działa jak szablony dokumentów. Jeden raz dopracowujesz jakość i styl, a potem korzystasz wielokrotnie.

Biblioteka promptów pomaga też utrzymać spójność w zespole. Każdy używa tych samych standardów, a zmiany w promptach można wersjonować.

Diagram

Diagram pokazuje, że biblioteka promptów łączy szablon, dane i ocenę jakości w powtarzalny proces.

Powiązane hasła

Prompt
Prompt systemowy
AB testy
Ewaluacja
Monitoring jakości
Polityka użycia AI w organizacji

Caching (pamięć podręczna)

Kategoria: Wdrożenia i operacje (LLMOps) Tagi: llmops wdrozenia operacje caching

Definicja

Caching to zapisywanie wyników (np. odpowiedzi, embeddingów, fragmentów retrieval), żeby przy kolejnym podobnym pytaniu nie liczyć wszystkiego od zera.

Po co w praktyce

Scenariusz 1: FAQ

Cel: „Jak działa RAG?” — cache gotowej, zaakceptowanej odpowiedzi.
Wejście: powtarzalne pytanie albo kosztowny wynik.
Kroki: zapisz wynik -> sprawdź cache -> odśwież po czasie.
Rezultat: szybsza i tańsza odpowiedź.
Zabezpieczenie: czas ważności i czyszczenie cache.

Scenariusz 2: RAG

Cel: cache embeddingów dokumentów, żeby nie przeliczać po każdej zmianie.
Wejście: powtarzalne pytanie albo kosztowny wynik.
Kroki: zapisz wynik -> sprawdź cache -> odśwież po czasie.
Rezultat: szybsza i tańsza odpowiedź.
Zabezpieczenie: czas ważności i czyszczenie cache.

Scenariusz 3: Agent

Cel: cache wyników „lista plików w folderze”, jeśli folder się nie zmienia.
Wejście: powtarzalne pytanie albo kosztowny wynik.
Kroki: zapisz wynik -> sprawdź cache -> odśwież po czasie.
Rezultat: szybsza i tańsza odpowiedź.
Zabezpieczenie: czas ważności i czyszczenie cache.

Ryzyka i jak je ograniczać

Ryzyko 1: Przestarzałe odpowiedzi

Ryzyko: przestarzałe odpowiedzi.
Jak ograniczać: TTL (czas ważności) + czyszczenie cache po aktualizacji źródeł.

Ryzyko 2: Cache zawiera dane wrażliwe

Ryzyko: cache zawiera dane wrażliwe.
Jak ograniczać: szyfrowanie, minimalizacja danych, separacja per tenant.

Ryzyko 3: „mieszanie” użytkowników (cross-tenant)

Ryzyko: „mieszanie” użytkowników (cross-tenant).
Jak ograniczać: klucze cache uwzględniające tenant i uprawnienia.

Miejsce w mapie

Tenant → cache musi być odseparowany.
Token → cache pomaga ograniczać koszty tokenów.
RAG / Embedding → cache embeddingów i wyników.
DLP → dane w cache też podlegają ochronie.
Mini-przepływ: Zapytanie → (cache hit?) → odpowiedź / oblicz i zapisz

Co to w zasadzie jest?

To jak „zapamiętanie raz znalezionej odpowiedzi”, żeby nie szukać jej ponownie. Daje:

szybciej (mniejsze opóźnienia),
taniej (mniej tokenów/wywołań),
stabilniej (mniej losowości).

W AI cache może dotyczyć:

wyników wyszukiwania,
embeddingów,
odpowiedzi na powtarzalne pytania,
pośrednich kroków w agentach.

Diagram

Diagram pokazuje, że system najpierw sprawdza zapisany wynik, a dopiero gdy go nie ma, liczy odpowiedź od zera.

Chain-of-thought (rozumowanie krok po kroku)

Kategoria: Prompting Tagi: prompting jakosc rozumowanie ryzyko praktyka

Definicja

Chain-of-thought to podejście, w którym prosisz model o pokazanie drogi do odpowiedzi: kroków, założeń, planu albo krótkiego uzasadnienia.

Po co w praktyce

Scenariusz 1: Plan projektu

Cel: uporządkowanie pracy.
Wejście: opis celu i ograniczeń.
Kroki: założenia -> plan -> ryzyka.
Rezultat: lista działań do sprawdzenia.
Zabezpieczenie: przegląd przez osobę odpowiedzialną.

Scenariusz 2: Decyzja z uzasadnieniem

Cel: lepsze zrozumienie rekomendacji.
Wejście: warianty decyzji.
Kroki: kryteria -> porównanie -> wybór.
Rezultat: rekomendacja z krótkim uzasadnieniem.
Zabezpieczenie: sprawdzenie faktów i założeń.

Scenariusz 3: Checklista jakości

Cel: wychwycenie braków przed publikacją.
Wejście: szkic treści lub procedury.
Kroki: kryteria -> ocena -> poprawki.
Rezultat: lista rzeczy do poprawy.
Zabezpieczenie: fact-checking i human-in-the-loop.

Ryzyka i jak je ograniczać

Ryzyko 1: Ładne, ale błędne uzasadnienie

Ryzyko: Ładne, ale błędne uzasadnienie.
Jak ograniczać: sprawdzaj źródła i dane wejściowe.

Ryzyko 2: Za długie odpowiedzi

Ryzyko: Za długie odpowiedzi.
Jak ograniczać: ogranicz liczbę kroków.

Ryzyko 3: Pozorna pewność

Ryzyko: Pozorna pewność.
Jak ograniczać: każ modelowi wskazać niepewności.

Checklista

Czy potrzebujesz uzasadnienia, czy tylko wyniku?
Czy kroki można zweryfikować?
Czy odpowiedź nie jest zbyt długa?
Czy model ma wskazać założenia i niepewności?

Dalsza lektura

NIST AI Risk Management Framework

Miejsce w mapie

Chain-of-thought → wspiera: Ewaluacja
Chain-of-thought → wymaga kontroli przez: Fact-checking
Chain-of-thought → może ograniczać ryzyko: Halucynacje

Co to w zasadzie jest?

Nie chcesz tylko wyniku. Chcesz też zrozumieć, co model założył, co sprawdził i z czego wynika odpowiedź.

To bywa przydatne w planowaniu, analizie ryzyk, tworzeniu procedur i checklist. Trzeba jednak pamiętać, że uzasadnienie może brzmieć sensownie nawet wtedy, gdy wniosek jest błędny.

W praktyce często lepiej prosić o „plan i krótkie uzasadnienie” niż o bardzo długi tok rozumowania.

Diagram

Diagram pokazuje, że rozumowanie krok po kroku powinno kończyć się sprawdzeniem, a nie tylko ładnym wnioskiem.

Powiązane hasła

Prompt
Halucynacje
Fact-checking
Ewaluacja
Human-in-the-loop

Content Credentials

Kategoria: Prawo i etyka Tagi: content credentials pochodzenie treści transparentność media provenance

Definicja

Content Credentials to zestaw metadanych opisujących pochodzenie treści cyfrowej, w tym informacje o autorze, narzędziu, zmianach i sposobie powstania materiału.

Po co w praktyce

Scenariusz 1: Publikacja obrazu wygenerowanego lub edytowanego przez AI

Cel: pokazać, że materiał ma ślad pochodzenia i zmian.
Wejście: plik graficzny i narzędzie do publikacji.
Kroki: zapis metadanych -> dołączenie informacji -> publikacja.
Rezultat: odbiorca ma więcej informacji o pochodzeniu treści.
Zabezpieczenie: zachowanie metadanych przy eksporcie i publikacji.

Scenariusz 2: Obieg materiałów promocyjnych w organizacji

Cel: wiedzieć, kto stworzył materiał i jakie narzędzia były użyte.
Wejście: plik roboczy, autor i historia edycji.
Kroki: rejestracja źródła -> zapis zmian -> zatwierdzenie materiału.
Rezultat: łatwiejsze ustalenie pochodzenia treści.
Zabezpieczenie: standard pracy z plikami i wersjonowanie.

Scenariusz 3: Oznaczanie treści syntetycznych

Cel: zmniejszyć ryzyko pomylenia treści syntetycznej z oryginalną.
Wejście: materiał wygenerowany albo zmodyfikowany przez AI.
Kroki: identyfikacja treści -> dodanie metadanych -> publikacja.
Rezultat: większa przejrzystość wobec odbiorcy.
Zabezpieczenie: polityka oznaczania i kontrola publikacji.

Ryzyka i jak je ograniczać

Ryzyko 1: Utrata metadanych

Ryzyko: utrata metadanych.
Jak ograniczać: testuj kanały publikacji i eksportu.

Ryzyko 2: Fałszywe poczucie pewności

Ryzyko: fałszywe poczucie pewności.
Jak ograniczać: traktuj je jako pomoc, nie absolutny dowód.

Ryzyko 3: Brak spójności organizacyjnej

Ryzyko: brak spójności organizacyjnej.
Jak ograniczać: ustal standard oznaczania treści.

Ryzyko 4: Niska użyteczność dla odbiorcy

Ryzyko: niska użyteczność dla odbiorcy.
Jak ograniczać: łącz metadane z czytelną komunikacją.

Checklista

Czy wiadomo, skąd pochodzi treść?
Czy zapisano historię zmian?
Czy metadane przetrwają publikację?
Czy organizacja ma zasady oznaczania treści AI?
Czy odbiorca rozumie, co oznacza taki ślad?

Miejsce w mapie

Content Credentials → wspiera: Transparentność

Content Credentials → wspiera: Data provenance (pochodzenie danych)

Content Credentials → powiązane z: Watermarking (znakowanie treści)

Co to w zasadzie jest?

To „metryczka treści”, która pomaga odpowiedzieć na pytanie, skąd pochodzi plik i co się z nim działo. W praktyce może dotyczyć obrazu, filmu, dokumentu albo innej treści cyfrowej.

Content Credentials pomagają:

zwiększać transparentność,
śledzić historię zmian,
oznaczać użycie narzędzi AI,
lepiej oceniać wiarygodność materiału.

Typowe błędy i pułapki

Założenie, że metadane zawsze przetrwają eksport i publikację.
Brak standardu oznaczania treści w organizacji.
Mylenie Content Credentials z pełnym dowodem autentyczności.
Pomijanie śladu zmian wewnątrz organizacji.

Diagram

Diagram pokazuje, że Content Credentials dodają do treści ślad pochodzenia i zmian przed publikacją.

Powiązane hasła

Transparentność

Data provenance (pochodzenie danych)

Watermarking (znakowanie treści)

Deepfake

Fact-checking (weryfikacja faktów)

---

Cytowanie źródeł

Kategoria: Jakość i ewaluacja Tagi:

Definicja

Cytowanie źródeł to podawanie, skąd pochodzą informacje użyte w odpowiedzi. Może to być link, dokument albo konkretny fragment.

Po co w praktyce

Scenariusz 1: Odpowiedzi na pytania klientów z linkiem do procedury

Cel: odpowiedzi na pytania klientów z linkiem do procedury.
Wejście: odpowiedź, dokument źródłowy i link do konkretnego fragmentu.
Kroki: znajdź źródło -> dopasuj cytat -> sprawdź aktualność.
Rezultat: odpowiedź łatwiejsza do zweryfikowania.
Zabezpieczenie: cytowanie tylko oficjalnych i aktualnych źródeł.

Scenariusz 2: Komunikaty o terminach z linkiem do zarządzenia albo ogłoszenia

Cel: komunikaty o terminach z linkiem do zarządzenia albo ogłoszenia.
Wejście: odpowiedź, dokument źródłowy i link do konkretnego fragmentu.
Kroki: znajdź źródło -> dopasuj cytat -> sprawdź aktualność.
Rezultat: odpowiedź łatwiejsza do zweryfikowania.
Zabezpieczenie: cytowanie tylko oficjalnych i aktualnych źródeł.

Scenariusz 3: Opisy usług z linkiem do strony WWW lub FAQ organizacji

Cel: opisy usług z linkiem do strony WWW lub FAQ organizacji.
Wejście: odpowiedź, dokument źródłowy i link do konkretnego fragmentu.
Kroki: znajdź źródło -> dopasuj cytat -> sprawdź aktualność.
Rezultat: odpowiedź łatwiejsza do zweryfikowania.
Zabezpieczenie: cytowanie tylko oficjalnych i aktualnych źródeł.

Ryzyka i jak je ograniczać

Ryzyko 1: Błędne źródła

Ryzyko: Błędne źródła.
Jak ograniczać: whitelist + wersjonowanie.

Ryzyko 2: Brak transparentności

Ryzyko: Brak transparentności.
Jak ograniczać: wymóg źródeł dla twierdzeń.

Ryzyko 3: Przeciążenie linkami

Ryzyko: Przeciążenie linkami.
Jak ograniczać: wybieraj 1–3 kluczowe.

Checklista

Czy źródło jest oficjalne i aktualne?
Czy link prowadzi do konkretu?
Czy cytat odpowiada twierdzeniu?
Czy widać datę dokumentu?
Czy treść jest zrozumiała bez klikania?

Dalsza lektura

Miejsce w mapie

Cytowanie → wspiera: Fact-checking
Cytowanie → wspiera: Grounding
Cytowanie → wymagane w: Polityka użycia AI

Co to w zasadzie jest?

To „paragon” do informacji: można sprawdzić, czy jest prawdziwa.
W firmie zwiększa wiarygodność i ułatwia akceptację treści.
W RAG cytowanie bywa automatyczne, ale trzeba je kontrolować.

Typowe błędy i pułapki

Link do strony głównej zamiast do konkretnego punktu.
Cytowanie nieaktualnej wersji dokumentu.

Diagram

Diagram pokazuje, że ważne twierdzenie powinno być powiązane z konkretnym źródłem i cytatem, aby dało się je sprawdzić.

Powiązane hasła

Grounding
Fact-checking
RAG
Audit trail
Transparentność

Dane osobowe (PII)

Kategoria: Prawo i etyka Tagi: prawo etyka zgodność pii dane osobowe

Definicja

PII (dane osobowe) to informacje, które pozwalają zidentyfikować osobę bezpośrednio lub pośrednio.

Po co w praktyce

Scenariusz 1: Tworzenie odpowiedzi „na szablonie” bez wklejania danych wrażliwych

Cel: tworzenie odpowiedzi „na szablonie” bez wklejania danych wrażliwych.
Wejście: tekst zawierający możliwe dane osobowe.
Kroki: wykryj PII -> usuń lub zastąp -> sprawdź wynik.
Rezultat: materiał bez zbędnych danych osobowych.
Zabezpieczenie: minimalizacja danych i DLP.

Scenariusz 2: Analiza sprawy na podstawie opisu po anonimizacji

Cel: analiza sprawy na podstawie opisu po anonimizacji.
Wejście: tekst zawierający możliwe dane osobowe.
Kroki: wykryj PII -> usuń lub zastąp -> sprawdź wynik.
Rezultat: materiał bez zbędnych danych osobowych.
Zabezpieczenie: minimalizacja danych i DLP.

Scenariusz 3: Automatyczne wykrywanie PII w tekście (DLP)

Cel: automatyczne wykrywanie PII w tekście (DLP).
Wejście: tekst zawierający możliwe dane osobowe.
Kroki: wykryj PII -> usuń lub zastąp -> sprawdź wynik.
Rezultat: materiał bez zbędnych danych osobowych.
Zabezpieczenie: minimalizacja danych i DLP.

Ryzyka i jak je ograniczać

Ryzyko 1: Naruszenie prywatności

Ryzyko: Naruszenie prywatności.
Jak ograniczać: anonimizacja/pseudonimizacja.

Ryzyko 2: Wycieki

Ryzyko: Wycieki.
Jak ograniczać: DLP + polityka.

Ryzyko 3: Brak kontroli dostępu

Ryzyko: Brak kontroli dostępu.
Jak ograniczać: IAM/SSO.

Checklista

Czy mogę usunąć dane osobowe?
Czy mam podstawę prawną i zgodę procesu?
Czy narzędzie jest zatwierdzone?
Czy wynik nie ujawnia danych?
Czy mam log i audyt?

Dalsza lektura

Miejsce w mapie

PII → wymaga: Anonimizacja
PII → chroni: DLP
PII → powiązane z: RODO / DPIA

Co to w zasadzie jest?

To np. imię i nazwisko, PESEL, adres, numer telefonu, ale też zestaw danych, który razem wskazuje osobę.
W kontekście AI najważniejsze jest: nie wklejać danych, jeśli nie ma do tego podstaw i zabezpieczeń.
Bezpieczniej pracować na danych zanonimizowanych.

Typowe błędy i pułapki

Wklejenie całego pisma z danymi do narzędzia zewnętrznego.
Trzymanie promptów z danymi w historii narzędzia.

Diagram

Diagram pokazuje, że dane osobowe powinny zostać wykryte i ograniczone przed użyciem ich w systemach AI.

Powiązane hasła

Anonimizacja
DLP
RODO / DPIA
Audit trail
SSO / IAM

Dane syntetyczne

Kategoria: Modele i dane Tagi: modele dane ai syntetyczne

Definicja

Dane syntetyczne to dane wygenerowane (np. przez algorytm lub AI), które mają przypominać dane prawdziwe, ale nie są bezpośrednią kopią konkretnych osób czy zdarzeń.

Po co w praktyce

Scenariusz 1: Test chatbotów na „udawanych” zgłoszeniach, bez prawdziwych nazwisk

Cel: test chatbotów na „udawanych” zgłoszeniach, bez prawdziwych nazwisk.
Wejście: dane źródłowe albo schemat danych.
Kroki: wygeneruj dane -> sprawdź podobieństwo -> przetestuj proces.
Rezultat: bezpieczniejszy materiał testowy.
Zabezpieczenie: kontrola reidentyfikacji.

Scenariusz 2: Demo systemu na fikcyjnych dokumentach i formularzach

Cel: demo systemu na fikcyjnych dokumentach i formularzach.
Wejście: dane źródłowe albo schemat danych.
Kroki: wygeneruj dane -> sprawdź podobieństwo -> przetestuj proces.
Rezultat: bezpieczniejszy materiał testowy.
Zabezpieczenie: kontrola reidentyfikacji.

Scenariusz 3: Trening klasyfikacji na sztucznie wygenerowanych przykładach

Cel: trening klasyfikacji na sztucznie wygenerowanych przykładach.
Wejście: dane źródłowe albo schemat danych.
Kroki: wygeneruj dane -> sprawdź podobieństwo -> przetestuj proces.
Rezultat: bezpieczniejszy materiał testowy.
Zabezpieczenie: kontrola reidentyfikacji.

Ryzyka i jak je ograniczać

Ryzyko 1: Dane syntetyczne są zbyt podobne do prawdziwych (ryzyko reidentyfikacji)

Ryzyko: dane syntetyczne są zbyt podobne do prawdziwych (ryzyko reidentyfikacji).
Jak ograniczać: testy prywatności, kontrola podobieństwa, anonimizacja źródeł.

Ryzyko 2: Bias i zniekształcenia (syntetyk „upiększa” świat)

Ryzyko: bias i zniekształcenia (syntetyk „upiększa” świat).
Jak ograniczać: ewaluacja, analiza bias, mieszanie źródeł.

Ryzyko 3: „zatruwanie” systemu kiepskimi danymi

Ryzyko: „zatruwanie” systemu kiepskimi danymi.
Jak ograniczać: kontrola jakości, walidacje, wersjonowanie.

Dalsza lektura

EDPB / instytucje UE — prywatność i dobre praktyki (edpb.europa.eu)

Miejsce w mapie

Anonimizacja → alternatywa lub uzupełnienie.
PII / RODO/DPIA → kontekst prywatności.
Bias → syntetyki mogą wzmacniać uprzedzenia.
Ewaluacja → sprawdzanie jakości danych.
Mini-przepływ: Źródła → generator → dane syntetyczne → testy jakości → użycie

Co to w zasadzie jest?

To jak „symulacja danych”. Zamiast pracować na prawdziwych rekordach (czasem wrażliwych), tworzysz dane podobne w strukturze. Po co?

do testów (żeby nie ryzykować danych osobowych),
do nauki i demo,
do zasilenia modeli, gdy brakuje danych.

Ważne: syntetyczne ≠ automatycznie bezpieczne. Jeśli są zrobione źle, mogą „przemycić” wzorce z danych wrażliwych.

Diagram

Diagram pokazuje, że dane syntetyczne powstają na bazie modelu i wymagają sprawdzenia jakości oraz ryzyka prywatności przed użyciem.

Data poisoning (zatrucie danych)

Kategoria: Bezpieczeństwo Tagi: bezpieczeństwo ryzyko ochrona data poisoning

Definicja

Data poisoning to celowe wprowadzenie złośliwych lub mylących treści do danych, aby model lub RAG zwracał błędne odpowiedzi.

Po co w praktyce

Scenariusz 1: Podmieniony PDF w repozytorium powoduje błędne odpowiedzi asystenta

Cel: podmieniony PDF w repozytorium powoduje błędne odpowiedzi asystenta.
Wejście: repozytorium dokumentów, FAQ albo baza wiedzy.
Kroki: sprawdź źródło -> wykryj zmianę -> odizoluj podejrzany materiał.
Rezultat: mniejsze ryzyko odpowiedzi opartych na zatrutych danych.
Zabezpieczenie: provenance, review i kontrola wersji.

Scenariusz 2: Złośliwy fragment w FAQ próbuje wymusić ujawnienie danych

Cel: złośliwy fragment w FAQ próbuje wymusić ujawnienie danych.
Wejście: repozytorium dokumentów, FAQ albo baza wiedzy.
Kroki: sprawdź źródło -> wykryj zmianę -> odizoluj podejrzany materiał.
Rezultat: mniejsze ryzyko odpowiedzi opartych na zatrutych danych.
Zabezpieczenie: provenance, review i kontrola wersji.

Ryzyka i jak je ograniczać

Ryzyko 1: Błędne decyzje

Ryzyko: Błędne decyzje.
Jak ograniczać: whitelist + review + podpisywanie źródeł.

Ryzyko 2: Prompt injection w dokumentach

Ryzyko: Prompt injection w dokumentach.
Jak ograniczać: skanowanie i filtracja.

Ryzyko 3: Utrata zaufania

Ryzyko: Utrata zaufania.
Jak ograniczać: monitoring jakości i szybki rollback.

Checklista

Czy źródła są zatwierdzone?
Czy dokumenty mają właściciela i wersję?
Czy jest przegląd zmian?
Czy testujesz RAG na „złych” przykładach?
Czy masz monitoring i alarmy?

Dalsza lektura

Miejsce w mapie

Data poisoning → atakuje: RAG
Data poisoning → atakuje: Baza wektorowa
Data poisoning → ogranicza: Red teaming

Co to w zasadzie jest?

To jak podmiana karteczek w instrukcji, żeby ktoś robił źle.
W RAG wystarczy wstrzyknąć jeden „sprytny” fragment do bazy wiedzy.
Skutkiem mogą być błędne procedury lub wycieki.

Typowe błędy i pułapki

Brak kontroli źródeł (każdy może dodać dokument).
Brak przeglądu zmian i wersjonowania.

Diagram

Diagram pokazuje, że zatrute dane mogą wpłynąć na model już na etapie treningu, dlatego trzeba kontrolować jakość zbioru.

Powiązane hasła

RAG
Baza wektorowa
Prompt injection
Red teaming
Audit trail

Data provenance (pochodzenie danych)

Kategoria: Prawo i etyka Tagi: prawo etyka zgodność provenance

Definicja

Data provenance to informacja o tym, skąd pochodzą dane: kto je stworzył, kiedy, w jakiej wersji, jak były przetwarzane i gdzie są używane.

Po co w praktyce

Scenariusz 1: W pojęciowniku

Cel: data aktualizacji definicji i autor zmian.
Wejście: dokument, dane albo wynik modelu.
Kroki: zapisz źródło -> śledź wersję -> pokaż pochodzenie.
Rezultat: łatwiejsza weryfikacja materiału.
Zabezpieczenie: kontrola wersji i właściciel źródła.

Scenariusz 2: W RAG

Cel: informacja z jakiego dokumentu i wersji pochodzi fragment.
Wejście: dokument, dane albo wynik modelu.
Kroki: zapisz źródło -> śledź wersję -> pokaż pochodzenie.
Rezultat: łatwiejsza weryfikacja materiału.
Zabezpieczenie: kontrola wersji i właściciel źródła.

Scenariusz 3: W firmie

Cel: ślad, że procedura pochodzi z polityki X wersja Y.
Wejście: dokument, dane albo wynik modelu.
Kroki: zapisz źródło -> śledź wersję -> pokaż pochodzenie.
Rezultat: łatwiejsza weryfikacja materiału.
Zabezpieczenie: kontrola wersji i właściciel źródła.

Ryzyka i jak je ograniczać

Ryzyko 1: Brak provenance = brak zaufania i trudna naprawa błędów

Ryzyko: brak provenance = brak zaufania i trudna naprawa błędów.
Jak ograniczać: wersjonowanie, daty aktualizacji, identyfikatory dokumentów.

Ryzyko 2: Provenance jest, ale rozproszone i nieczytelne

Ryzyko: provenance jest, ale rozproszone i nieczytelne.
Jak ograniczać: standard zapisu metadanych, szablony i automaty.

Ryzyko 3: Ujawnianie zbyt dużo informacji wrażliwych

Ryzyko: ujawnianie zbyt dużo informacji wrażliwych.
Jak ograniczać: publikuj tylko potrzebne metadane, resztę trzymaj w logach z dostępem.

Dalsza lektura

NIST — dobre praktyki wiarygodności i ryzyka (nist.gov)

Miejsce w mapie

Cytowanie źródeł → provenance ułatwia cytowanie.
Transparentność → pokazuje skąd treść.
Audit trail → ślad działań i zmian.
Fact-checking → łatwiej weryfikować.
Mini-przepływ: Źródło → wersja → przetwarzanie → użycie w odpowiedzi

Co to w zasadzie jest?

To „metryczka danych”. Dzięki niej da się odpowiedzieć na pytania:

„Skąd to wiemy?”
„Czy to jest aktualne?”
„Kto to zmienił?”
„Czy można temu ufać?”

W AI provenance jest ważne, bo jakość odpowiedzi zależy od jakości źródeł.

Diagram

Diagram pokazuje, że pochodzenie danych trzeba śledzić od źródła przez transformacje aż do późniejszego użycia i audytu.

Deepfake

Kategoria: Bezpieczeństwo Tagi:

Definicja

Deepfake to zmanipulowane materiały audio lub wideo tworzone przez AI, które imitują prawdziwe osoby. Mogą wyglądać realistycznie, mimo że są fałszywe. To ryzyko w obszarze dezinformacji i reputacji.

Po co w praktyce

Scenariusz 1: Ochrona marki

Cel: ochrona marki.
Wejście: monitoring mediów.
Kroki: wykrycie → weryfikacja → reakcja.
Rezultat: szybkie sprostowanie.
Zabezpieczenie: plan kryzysowy.

Scenariusz 2: Weryfikacja nagrań w procesach HR

Cel: weryfikacja nagrań w procesach HR.
Wejście: nagranie wideo.
Kroki: analiza → potwierdzenie źródła → decyzja.
Rezultat: bezpieczny proces.
Zabezpieczenie: zasada dwóch kanałów.

Scenariusz 3: Szkolenia bezpieczeństwa

Cel: szkolenia bezpieczeństwa.
Wejście: przykłady deepfake.
Kroki: szkolenie → testy → procedury.
Rezultat: większa odporność zespołu.
Zabezpieczenie: regularne przypomnienia.

Ryzyka i jak je ograniczać

Ryzyko 1: Dezinformacja

Ryzyko: Dezinformacja.
Jak ograniczać: monitoring i szybkie sprostowania.

Ryzyko 2: Oszustwa

Ryzyko: Oszustwa.
Jak ograniczać: weryfikacja tożsamości wieloma kanałami.

Ryzyko 3: Reputacja

Ryzyko: Reputacja.
Jak ograniczać: plan komunikacji kryzysowej.

Checklista

Czy masz procedurę weryfikacji nagrań?
Czy zespół zna ryzyko deepfake?
Czy masz plan komunikacji kryzysowej?
Czy treści są odpowiednio oznaczone?
Czy logujesz incydenty?

Dalsza lektura

Miejsce w mapie

Deepfake → zwiększa ryzyko: GenAI
Deepfake → wymaga: Transparentność
Deepfake → powiązany z: Fact-checking

Co to w zasadzie jest?

Deepfake „udaje” prawdziwe nagranie lub głos.
Może być użyty do oszustw lub manipulacji.
W biznesie grozi reputacji i bezpieczeństwu informacji.
Wymaga procedur weryfikacji i oznaczania treści.

Typowe błędy i pułapki

Traktowanie każdego nagrania jako wiarygodnego.
Brak procedur weryfikacji.
Brak komunikacji kryzysowej.

Diagram

Diagram pokazuje, że deepfake powstaje z materiałów prawdziwej osoby, potem jest generowany przez model i może trafić do publikacji. Punkt kontroli to weryfikacja i oznaczenie treści przed użyciem.

Powiązane hasła

GenAI
Model multimodalny
Fact-checking
Transparentność
Dostępność treści AI

Destylacja modelu (Model distillation)

Kategoria: Modele i dane Tagi: distillation model optymalizacja slm wdrożenie

Definicja

Destylacja modelu to technika, w której mniejszy model uczy się na podstawie odpowiedzi albo zachowania większego modelu, aby przejąć część jego jakości przy niższym koszcie działania.

Po co w praktyce

Scenariusz 1: Tańsza klasyfikacja zgłoszeń

Cel: zastąpić kosztowny model dużej skali w prostym procesie klasyfikacji.
Wejście: przykłady wejść, odpowiedzi większego modelu i kryteria oceny.
Kroki: generowanie wzorców -> uczenie mniejszego modelu -> benchmark.
Rezultat: lżejszy model do jednego konkretnego zadania.
Zabezpieczenie: porównanie z wynikiem modelu nauczyciela.

Scenariusz 2: Przygotowanie modelu lokalnego

Cel: uruchomić model bliżej danych i na słabszej infrastrukturze.
Wejście: większy model, dane zadaniowe i wymagania środowiska.
Kroki: wybór nauczyciela -> przygotowanie zbioru -> destylacja.
Rezultat: model łatwiejszy do uruchomienia lokalnie.
Zabezpieczenie: testy jakości po wdrożeniu.

Scenariusz 3: Stabilizacja formatu odpowiedzi

Cel: nauczyć mniejszy model stałego stylu i formatu.
Wejście: zestaw przykładów generowanych przez model większy.
Kroki: przygotowanie par wejście-wyjście -> uczenie -> ocena formatu.
Rezultat: bardziej przewidywalne odpowiedzi w produkcji.
Zabezpieczenie: kontrola błędów i monitoring regresji.

Ryzyka i jak je ograniczać

Ryzyko 1: Utrwalenie błędów nauczyciela

Ryzyko: utrwalenie błędów nauczyciela.
Jak ograniczać: sprawdzaj jakość danych treningowych.

Ryzyko 2: Spadek jakości w trudniejszych przypadkach

Ryzyko: spadek jakości w trudniejszych przypadkach.
Jak ograniczać: testuj na realnych scenariuszach.

Ryzyko 3: Pozorna oszczędność

Ryzyko: pozorna oszczędność.
Jak ograniczać: licz pełny koszt przygotowania i utrzymania.

Ryzyko 4: Zbyt wąskie zastosowanie

Ryzyko: zbyt wąskie zastosowanie.
Jak ograniczać: jasno określ zakres zadania dla modelu ucznia.

Checklista

Czy znasz konkretne zadanie dla modelu po destylacji?
Czy dane od modelu nauczyciela są dobrej jakości?
Czy wykonano benchmark przed i po?
Czy zakres użycia jest ograniczony?
Czy wiadomo, kiedy trzeba przełączyć się na większy model?

Miejsce w mapie

Destylacja modelu (Model distillation) → wspiera: Small Language Model (SLM)

Destylacja modelu (Model distillation) → wspiera: Zarządzanie kosztami AI

Destylacja modelu (Model distillation) → wymaga: Ewaluacja

Co to w zasadzie jest?

To sposób tworzenia „lżejszego ucznia” na bazie „większego nauczyciela”. Organizacja używa dużego modelu do przygotowania wzorców albo odpowiedzi, a potem uczy nimi model mniejszy.

Celem jest zwykle:

obniżenie kosztu,
skrócenie czasu odpowiedzi,
łatwiejsze wdrożenie lokalne,
zachowanie wystarczającej jakości w węższym zadaniu.

Typowe błędy i pułapki

Zakładanie, że mały model przejmie całą jakość dużego.
Uczenie na słabych albo błędnych odpowiedziach nauczyciela.
Brak benchmarku po destylacji.
Mylenie destylacji z kwantyzacją.

Diagram

Diagram pokazuje, że destylacja przenosi część jakości dużego modelu do mniejszego modelu przez przykłady i późniejszy test jakości.

Powiązane hasła

Small Language Model (SLM)

Fine-tuning (dostrajanie)

Kwantyzacja (Quantization)

Ewaluacja

Benchmark

---

Determinism (deterministyczność)

Kategoria: Jakość i ewaluacja Tagi: jakosc ewaluacja metryki determinism

Definicja

Deterministyczność oznacza, że przy tych samych danych wejściowych system daje ten sam (lub bardzo podobny) wynik.

Po co w praktyce

Scenariusz 1: Generowanie komunikatu urzędowego

Cel: chcesz, żeby format zawsze był taki sam.
Wejście: to samo wejście i ustawienia modelu.
Kroki: uruchom test -> porównaj wyniki -> ustabilizuj parametry.
Rezultat: bardziej powtarzalne odpowiedzi.
Zabezpieczenie: kontrola temperatury i wersji modelu.

Scenariusz 2: Zmiana temperatury

Cel: niższa = bardziej powtarzalne odpowiedzi.
Wejście: to samo wejście i ustawienia modelu.
Kroki: uruchom test -> porównaj wyniki -> ustabilizuj parametry.
Rezultat: bardziej powtarzalne odpowiedzi.
Zabezpieczenie: kontrola temperatury i wersji modelu.

Scenariusz 3: RAG

Cel: odpowiedź bardziej stabilna, bo opiera się na tych samych źródłach.
Wejście: to samo wejście i ustawienia modelu.
Kroki: uruchom test -> porównaj wyniki -> ustabilizuj parametry.
Rezultat: bardziej powtarzalne odpowiedzi.
Zabezpieczenie: kontrola temperatury i wersji modelu.

Ryzyka i jak je ograniczać

Ryzyko 1: Zbyt duża deterministyczność = „sztywne” odpowiedzi

Ryzyko: zbyt duża deterministyczność = „sztywne” odpowiedzi.
Jak ograniczać: dobierz parametry do celu (kreatywność vs procedura).

Ryzyko 2: Zbyt mała deterministyczność = chaos i brak kontroli

Ryzyko: zbyt mała deterministyczność = chaos i brak kontroli.
Jak ograniczać: szablony, structured output, testy.

Ryzyko 3: Zmiany modelu psują powtarzalność

Ryzyko: zmiany modelu psują powtarzalność.
Jak ograniczać: wersjonowanie i benchmarki.

Dalsza lektura

NIST — jakość i ocena systemów (nist.gov)

Miejsce w mapie

Temperatura sampling → bezpośrednio wpływa na losowość.
Prompt format → struktura zwiększa powtarzalność.
Structured output → wymusza stabilny format.
Benchmark / Ewaluacja → mierzenie stabilności.
Mini-przepływ: Te samo wejście → (czy ten sam wynik?) → kontrola parametrów

Co to w zasadzie jest?

Modele generatywne mają element losowości. Czasem to zaleta (kreatywność), a czasem wada (chcesz powtarzalności). Deterministyczność zależy m.in. od:

temperatury i sampling (np. „temperatura”),
długości i struktury promptu,
użycia źródeł (RAG),
wersji modelu.

Diagram

Diagram pokazuje, że deterministyczność oznacza powtarzalny wynik przy tych samych danych i ustawieniach.

DLP

Kategoria: Bezpieczeństwo Tagi:

Definicja

DLP to zestaw mechanizmów, które pomagają zapobiegać wyciekom danych. Na przykład mogą blokować wysyłkę danych osobowych poza organizację.

Po co w praktyce

Scenariusz 1: Blokowanie wklejania PII do czatów AI

Cel: blokowanie wklejania PII do czatów AI.
Wejście: tekst, plik albo log z możliwymi danymi wrażliwymi.
Kroki: wykryj wzorzec -> zablokuj lub zamaskuj -> zapisz decyzję.
Rezultat: mniejsze ryzyko wycieku danych.
Zabezpieczenie: polityki DLP i testy wyjątków.

Scenariusz 2: Ostrzeganie, gdy ktoś próbuje wysłać wrażliwy plik

Cel: ostrzeganie, gdy ktoś próbuje wysłać wrażliwy plik.
Wejście: tekst, plik albo log z możliwymi danymi wrażliwymi.
Kroki: wykryj wzorzec -> zablokuj lub zamaskuj -> zapisz decyzję.
Rezultat: mniejsze ryzyko wycieku danych.
Zabezpieczenie: polityki DLP i testy wyjątków.

Scenariusz 3: Maskowanie danych w logach

Cel: maskowanie danych w logach.
Wejście: tekst, plik albo log z możliwymi danymi wrażliwymi.
Kroki: wykryj wzorzec -> zablokuj lub zamaskuj -> zapisz decyzję.
Rezultat: mniejsze ryzyko wycieku danych.
Zabezpieczenie: polityki DLP i testy wyjątków.

Ryzyka i jak je ograniczać

Ryzyko 1: Fałszywe alarmy

Ryzyko: Fałszywe alarmy.
Jak ograniczać: strojenie reguł i tryb ostrzegania.

Ryzyko 2: Obejścia

Ryzyko: Obejścia.
Jak ograniczać: szkolenia + audyt.

Ryzyko 3: Brak spójności

Ryzyko: Brak spójności.
Jak ograniczać: centralna polityka.

Checklista

Czy reguły DLP obejmują PII i dokumenty?
Czy jest proces wyjątków?
Czy logi są przeglądane?
Czy użytkownicy są przeszkoleni?
Czy DLP obejmuje narzędzia AI?

Dalsza lektura

Miejsce w mapie

DLP → chroni: PII
DLP → wspiera: Polityka użycia AI
DLP → współgra z: SSO / IAM

Co to w zasadzie jest?

DLP działa jak „bramka bezpieczeństwa”.
Może wykrywać numery PESEL, adresy, numery kont i je blokować lub maskować.
Wspiera bezpieczne użycie AI w organizacji.

Typowe błędy i pułapki

Zbyt ostre reguły (blokują pracę).
Brak wyjątków kontrolowanych (dla uprawnionych procesów).

Diagram

Diagram pokazuje, że DLP wykrywa i zatrzymuje ryzykowny przepływ danych według ustalonych polityk.

Powiązane hasła

PII
Anonimizacja
RODO / DPIA
SSO / IAM
Audit trail

Dostępność cyfrowa w treściach AI

Kategoria: UX i dostępność Tagi:

Definicja

To zestaw zasad, które sprawiają, że treści tworzone z pomocą AI są czytelne i użyteczne dla wszystkich. Dotyczy to także osób z niepełnosprawnościami.

Po co w praktyce

Scenariusz 1: Opisy grafik w social media i na stronach WWW

Cel: opisy grafik w social media i na stronach WWW.
Wejście: treść, grafika albo komunikat do publikacji.
Kroki: sprawdź dostępność -> popraw język -> zweryfikuj odbiór.
Rezultat: treść bardziej dostępna dla różnych użytkowników.
Zabezpieczenie: kontrola WCAG i przegląd redakcyjny.

Scenariusz 2: Upraszczanie komunikatów i instrukcji

Cel: upraszczanie komunikatów i instrukcji.
Wejście: treść, grafika albo komunikat do publikacji.
Kroki: sprawdź dostępność -> popraw język -> zweryfikuj odbiór.
Rezultat: treść bardziej dostępna dla różnych użytkowników.
Zabezpieczenie: kontrola WCAG i przegląd redakcyjny.

Scenariusz 3: Porządkowanie artykułów, ofert i komunikatów urzędowych

Cel: porządkowanie artykułów, ofert i komunikatów urzędowych.
Wejście: treść, grafika albo komunikat do publikacji.
Kroki: sprawdź dostępność -> popraw język -> zweryfikuj odbiór.
Rezultat: treść bardziej dostępna dla różnych użytkowników.
Zabezpieczenie: kontrola WCAG i przegląd redakcyjny.

Ryzyka i jak je ograniczać

Ryzyko 1: Wykluczenie części odbiorców

Ryzyko: Wykluczenie części odbiorców.
Jak ograniczać: stosuj checklistę dostępności i przegląd przed publikacją.

Ryzyko 2: Nieczytelność treści

Ryzyko: Nieczytelność treści.
Jak ograniczać: skracaj zdania i dziel treść na mniejsze części.

Ryzyko 3: Błędy publikacji

Ryzyko: Błędy publikacji.
Jak ograniczać: sprawdzaj nagłówki, linki, teksty alternatywne i kolejność informacji.

Checklista

Czy nagłówki mają logiczną kolejność?
Czy długie akapity da się podzielić na krótsze części?
Czy grafiki mają sensowny tekst alternatywny?
Czy język jest prosty i konkretny?
Czy ktoś sprawdził treść przed publikacją?

Dalsza lektura

Miejsce w mapie

Dostępność cyfrowa w treściach AI -> wspiera: Transparentność
Dostępność cyfrowa w treściach AI -> wymaga: Fact-checking
Dostępność cyfrowa w treściach AI -> wpływa na: Polityka użycia AI w organizacji

Co to w zasadzie jest?

AI może pomagać w pisaniu, ale może też pogarszać jakość treści.
Problemem bywają zbyt długie zdania, brak struktury i brak tekstów alternatywnych.
Dobra treść powinna być prosta, logiczna i poprawnie sformatowana.
W praktyce liczą się nagłówki, listy, prosty język i opisy grafik.

Typowe błędy i pułapki

Brak tekstów alternatywnych.
Przeładowane akapity.
Nagłówki używane tylko „dla ozdoby”.
Publikacja treści bez szybkiego przeglądu człowieka.

Diagram

Diagram pokazuje, że treść wygenerowana przez AI powinna przejść przez etap dostosowania i sprawdzenia dostępności.

Powiązane hasła

Polecenie dla modelu
Transparentność
Fact-checking
Human-in-the-loop
Stack

Dryft danych i zachowania modelu

Kategoria: Jakość i ewaluacja Tagi:

Definicja

Dryft to sytuacja, w której z czasem zmieniają się dane, kontekst lub zachowanie systemu AI. Przez to wyniki stają się gorsze albo inne niż wcześniej.

Po co w praktyce

Scenariusz 1: Słownik

Cel: dodajesz nowe pojęcia, a wyszukiwarka zaczyna gorzej trafiać.
Wejście: metryki jakości i dane produkcyjne.
Kroki: monitoruj zmianę -> porównaj z bazą -> uruchom korektę.
Rezultat: szybsze wykrycie spadku jakości.
Zabezpieczenie: alerty i okresowa ewaluacja.

Scenariusz 2: Firma

Cel: zmiana procedury, a chatbot nadal odpowiada „po staremu”.
Wejście: metryki jakości i dane produkcyjne.
Kroki: monitoruj zmianę -> porównaj z bazą -> uruchom korektę.
Rezultat: szybsze wykrycie spadku jakości.
Zabezpieczenie: alerty i okresowa ewaluacja.

Scenariusz 3: Produkt

Cel: nowe funkcje, a model nie nadąża z instrukcjami.
Wejście: metryki jakości i dane produkcyjne.
Kroki: monitoruj zmianę -> porównaj z bazą -> uruchom korektę.
Rezultat: szybsze wykrycie spadku jakości.
Zabezpieczenie: alerty i okresowa ewaluacja.

Ryzyka i jak je ograniczać

Ryzyko 1: Spadek jakości i zaufania

Ryzyko: spadek jakości i zaufania.
Jak ograniczać: regularna ewaluacja + monitoring + poprawki na podstawie logów.

Ryzyko 2: Błędne decyzje na podstawie „starych” odpowiedzi

Ryzyko: błędne decyzje na podstawie „starych” odpowiedzi.
Jak ograniczać: daty aktualizacji, cytowanie źródeł, sygnalizowanie niepewności.

Ryzyko 3: Drift bezpieczeństwa (nowe typy ataków)

Ryzyko: drift bezpieczeństwa (nowe typy ataków).
Jak ograniczać: red teaming i aktualizacja zabezpieczeń.

Dalsza lektura

NIST — ocena i zarządzanie ryzykiem AI (nist.gov)

Miejsce w mapie

Monitoring jakości → drift wykrywa się przez obserwację metryk.
Ewaluacja / Benchmark → porównanie „kiedyś vs dziś”.
Red teaming → drift bezpieczeństwa.
RAG → drift może wynikać ze zmian w źródłach.
Mini-przepływ: Czas → zmiana danych → spadek jakości → wykrycie → poprawka

Co to w zasadzie jest?

AI może działać dobrze dziś, a gorzej za miesiąc, bo:

zmieniły się dokumenty i procesy,
pojawiły się nowe słowa, nazwy, produkty,
użytkownicy pytają inaczej,
dane „w tle” mają inny rozkład niż w testach.

To normalne zjawisko. Problem zaczyna się wtedy, gdy nikt go nie zauważa.

Diagram

Diagram pokazuje, że zmiana danych lub warunków użycia w czasie może obniżyć jakość modelu i wymaga monitoringu.

Dynamiczny kontekst

Kategoria: Retrieval / RAG Tagi: rag retrieval wyszukiwanie dynamic context

Definicja

Dynamiczny kontekst to podejście, w którym system dobiera do promptu tylko te fragmenty informacji, które są potrzebne do konkretnego pytania — zamiast wklejać „wszystko”.

Po co w praktyce

Scenariusz 1: Pytasz o „prompt injection” → system dobiera fragmenty o atakach, a nie całe rozdziały

Cel: pytasz o „prompt injection” → system dobiera fragmenty o atakach, a nie całe rozdziały.
Wejście: zapytanie i wiele możliwych fragmentów kontekstu.
Kroki: wybierz fragmenty -> ogranicz długość -> wygeneruj odpowiedź.
Rezultat: bardziej trafny kontekst.
Zabezpieczenie: limity fragmentów i ranking źródeł.

Scenariusz 2: Pytasz o „koszty tokenów” → dobiera definicje token/okno kontekstowe/caching

Cel: pytasz o „koszty tokenów” → dobiera definicje token/okno kontekstowe/caching.
Wejście: zapytanie i wiele możliwych fragmentów kontekstu.
Kroki: wybierz fragmenty -> ogranicz długość -> wygeneruj odpowiedź.
Rezultat: bardziej trafny kontekst.
Zabezpieczenie: limity fragmentów i ranking źródeł.

Scenariusz 3: Pytasz o „RAG” → dobiera retrieval, chunking, vector database

Cel: pytasz o „RAG” → dobiera retrieval, chunking, vector database.
Wejście: zapytanie i wiele możliwych fragmentów kontekstu.
Kroki: wybierz fragmenty -> ogranicz długość -> wygeneruj odpowiedź.
Rezultat: bardziej trafny kontekst.
Zabezpieczenie: limity fragmentów i ranking źródeł.

Ryzyka i jak je ograniczać

Ryzyko 1: System dobierze zły kontekst

Ryzyko: system dobierze zły kontekst.
Jak ograniczać: reranking, testy, fallback „pokaż źródła”.

Ryzyko 2: Brak przejrzystości („skąd to wzięte?”)

Ryzyko: brak przejrzystości („skąd to wzięte?”).
Jak ograniczać: cytowanie i provenance fragmentów.

Ryzyko 3: Ataki przez dokumenty (context poisoning)

Ryzyko: ataki przez dokumenty (context poisoning).
Jak ograniczać: filtry, polityka źródeł, guardrails.

Dalsza lektura

NIST — wiarygodność i ryzyko AI (nist.gov)

Miejsce w mapie

Okno kontekstowe → ograniczenie, które dynamiczny kontekst rozwiązuje.
Retrieval / Reranking → dobór najlepszych fragmentów.
Cytowanie źródeł → przejrzystość.
Context poisoning → ryzyko w źródłach.
Mini-przepływ: Pytanie → dobór fragmentów → kontekst → odpowiedź

Co to w zasadzie jest?

Okno kontekstowe ma limit. Jeśli wrzucisz za dużo, AI:

gubi sedno,
jest droższa,
bywa mniej trafna.

Dynamiczny kontekst działa jak selekcja: „weź najlepsze 3–8 fragmentów” i nic więcej.

Diagram

Diagram pokazuje, że odpowiedź modelu może być budowana z uwzględnieniem bieżącej rozmowy i zapisanych ustaleń.

Dzielenie na fragmenty

Kategoria: Retrieval / RAG Tagi:

Definicja

Chunking to dzielenie dokumentów na mniejsze fragmenty. Dzięki temu łatwiej je wyszukać i wstawić do kontekstu modelu.

Po co w praktyce

Scenariusz 1: RAG do procedur

Cel: RAG do procedur.
Wejście: PDF procedury.
Kroki: podział na sekcje → embedding → baza.
Rezultat: trafne cytaty.
Zabezpieczenie: zachowanie numerów rozdziałów.

Scenariusz 2: Baza odpowiedzi do strony WWW i FAQ

Cel: baza odpowiedzi do strony WWW i FAQ.
Wejście: regulaminy i FAQ.
Kroki: podział na fragmenty -> linkowanie -> wyszukiwarka.
Rezultat: szybkie dopasowanie.
Zabezpieczenie: kontrola wersji.

Scenariusz 3: Analiza uchwał

Cel: analiza uchwał.
Wejście: długie dokumenty.
Kroki: dziel po paragrafach.
Rezultat: cytowanie konkretów.
Zabezpieczenie: spójne ID fragmentów.

Ryzyka i jak je ograniczać

Ryzyko 1: Utrata kontekstu

Ryzyko: Utrata kontekstu: fragment bez definicji.
Jak ograniczać: overlap (nakładanie) + sekcje.

Ryzyko 2: Błędne cytaty

Ryzyko: Błędne cytaty: brak źródła fragmentu.
Jak ograniczać: metadane: tytuł, rozdział, URL.

Ryzyko 3: Bałagan w aktualizacjach

Ryzyko: Bałagan w aktualizacjach: fragmenty się „rozjeżdżają”.
Jak ograniczać: stałe identyfikatory.

Checklista

Czy chunk ma tytuł/sekcję?
Czy jest overlap (np. 10–20%)?
Czy fragment ma link do źródła?
Czy rozmiar chunków jest testowany na pytaniach?
Czy aktualizacja dokumentu przebudowuje indeks?

Dalsza lektura

Miejsce w mapie

Chunking → wspiera: RAG
Chunking → poprawia: Baza wektorowa
Chunking → wpływa na: Halucynacje

Co to w zasadzie jest?

Model nie „połknie” całej książki naraz — ma limit kontekstu.
Dlatego dokument dzieli się na sensowne części, na przykład akapity albo sekcje.
Dobre fragmenty zwykle dają lepsze odpowiedzi w RAG.

Typowe błędy i pułapki

Zbyt krótkie fragmenty -> brak kontekstu.
Zbyt długie fragmenty -> szum i gorsze wyniki.
Dzielenie w losowych miejscach (bez nagłówków).

Diagram

Diagram pokazuje, że długi dokument trzeba podzielić na sensowne fragmenty, aby łatwiej go wyszukać i zacytować.

Powiązane hasła

RAG
Embedding
Okno kontekstowe
Ewaluacja
Monitoring jakości

Ewaluacja

Kategoria: Jakość i ewaluacja Tagi:

Definicja

Ewaluacja to systematyczne sprawdzanie, jak dobrze model lub asystent radzi sobie z konkretnymi zadaniami.

Po co w praktyce

Scenariusz 1: Test odpowiedzi na 50 typowych pytań klientów

Cel: test odpowiedzi na 50 typowych pytań klientów.
Wejście: zestaw testowy i kryteria jakości.
Kroki: uruchom test -> oceń wyniki -> zapisz wnioski.
Rezultat: mierzalna ocena jakości.
Zabezpieczenie: stała rubryka i powtarzalny zestaw testowy.

Scenariusz 2: Test streszczeń dokumentów (czy sens się zgadza)

Cel: test streszczeń dokumentów (czy sens się zgadza).
Wejście: zestaw testowy i kryteria jakości.
Kroki: uruchom test -> oceń wyniki -> zapisz wnioski.
Rezultat: mierzalna ocena jakości.
Zabezpieczenie: stała rubryka i powtarzalny zestaw testowy.

Scenariusz 3: Test wykrywania danych wrażliwych (czy asystent nie prosi o PII)

Cel: test wykrywania danych wrażliwych (czy asystent nie prosi o PII).
Wejście: zestaw testowy i kryteria jakości.
Kroki: uruchom test -> oceń wyniki -> zapisz wnioski.
Rezultat: mierzalna ocena jakości.
Zabezpieczenie: stała rubryka i powtarzalny zestaw testowy.

Ryzyka i jak je ograniczać

Ryzyko 1: Spadek jakości po zmianie

Ryzyko: Spadek jakości po zmianie.
Jak ograniczać: regresja testów.

Ryzyko 2: Stronniczość

Ryzyko: Stronniczość.
Jak ograniczać: zestawy testowe z różnymi przypadkami.

Ryzyko 3: Brak powtarzalności

Ryzyko: Brak powtarzalności.
Jak ograniczać: benchmark i stałe instrukcje.

Checklista

Czy masz zestaw pytań testowych?
Czy masz kryteria oceny (rubryka)?
Czy mierzysz błędy krytyczne?
Czy testujesz bezpieczeństwo, na przykład wstrzyknięcie poleceń?
Czy logujesz wersję modelu i danych?

Dalsza lektura

Miejsce w mapie

Ewaluacja → kontroluje: Halucynacje
Ewaluacja → wspiera: LLMOps
Ewaluacja → wymaga: Benchmark

Co to w zasadzie jest?

To „testy jakości”, zanim coś trafi do ludzi.
W firmie liczy się: poprawność, zgodność z procedurą, język prosty, bezpieczeństwo.
Bez ewaluacji nie wiesz, czy ulepszenie nie pogorszyło wyniku.

Typowe błędy i pułapki

Testowanie na 5 przykładach „które akurat wyszły”.
Brak stałych kryteriów oceny.

Diagram

Diagram pokazuje, że ewaluacja polega na mierzeniu jakości systemu na ustalonych przykładach.

Powiązane hasła

Benchmark
LLMOps
Monitoring jakości
Grounding
Polecenie dla modelu

Fact-checking (weryfikacja faktów)

Kategoria: Jakość i ewaluacja Tagi: jakosc ewaluacja metryki fact checking

Definicja

Fact-checking to proces sprawdzania, czy treść jest zgodna z faktami i źródłami.

Po co w praktyce

Scenariusz 1: Komunikat

Cel: komunikat: sprawdź daty, godziny, miejsce, warunki.
Wejście: treść do publikacji i źródła referencyjne.
Kroki: wyodrębnij twierdzenia -> sprawdź źródła -> popraw błędy.
Rezultat: mniej błędów faktograficznych.
Zabezpieczenie: oficjalne źródła i druga para oczu.

Scenariusz 2: Odpowiedź na pismo

Cel: odpowiedź na pismo: sprawdź podstawę prawną w źródle.
Wejście: treść do publikacji i źródła referencyjne.
Kroki: wyodrębnij twierdzenia -> sprawdź źródła -> popraw błędy.
Rezultat: mniej błędów faktograficznych.
Zabezpieczenie: oficjalne źródła i druga para oczu.

Scenariusz 3: Post w social media

Cel: post w social media: sprawdź liczby i nazwy własne.
Wejście: treść do publikacji i źródła referencyjne.
Kroki: wyodrębnij twierdzenia -> sprawdź źródła -> popraw błędy.
Rezultat: mniej błędów faktograficznych.
Zabezpieczenie: oficjalne źródła i druga para oczu.

Ryzyka i jak je ograniczać

Ryzyko 1: Błędy reputacyjne

Ryzyko: Błędy reputacyjne.
Jak ograniczać: checklista + drugi czytelnik.

Ryzyko 2: Błędy formalne

Ryzyko: Błędy formalne.
Jak ograniczać: odwołanie do dokumentu źródłowego.

Ryzyko 3: Deepfake/dezinformacja

Ryzyko: Deepfake/dezinformacja.
Jak ograniczać: weryfikacja materiału i metadanych.

Checklista

Czy mam źródło do każdego twierdzenia?
Czy daty/liczby są zgodne z dokumentem?
Czy nazwy instytucji i jednostek są poprawne?
Czy linki prowadzą do aktualnych stron?
Czy ktoś drugi przeczytał?

Dalsza lektura

Miejsce w mapie

Fact-checking → ogranicza: Halucynacje
Fact-checking → wymaga: Cytowanie źródeł
Fact-checking → wspiera: Transparentność

Co to w zasadzie jest?

To nie „czepianie się” — to ochrona przed błędem.
W firmie chodzi też o zgodność z dokumentami i przepisami.
AI może pomóc pisać, ale człowiek odpowiada za prawdę.

Typowe błędy i pułapki

Weryfikacja „na oko”, bez źródła.
Brak listy elementów do sprawdzenia (daty/liczby/nazwy).

Diagram

Diagram pokazuje, że faktograficzna odpowiedź powinna zostać sprawdzona w źródłach przed użyciem lub publikacją.

Powiązane hasła

Halucynacje
Cytowanie źródeł
Grounding
Human-in-the-loop
Deepfake

Few-shot (z przykładami)

Kategoria: Prompting Tagi: prompting prompt przyklady jakosc praktyka

Definicja

Few-shot to sposób użycia modelu, w którym dodajesz kilka przykładów poprawnych odpowiedzi, żeby model lepiej trafił w format i styl.

Po co w praktyce

Scenariusz 1: Odpowiedzi do klientów

Cel: utrzymanie tonu i struktury odpowiedzi.
Wejście: 2 przykłady dobrych odpowiedzi i nowa sprawa.
Kroki: pokaż wzorce -> podaj przypadek -> wygeneruj odpowiedź.
Rezultat: bardziej spójna komunikacja.
Zabezpieczenie: przegląd odpowiedzi przed wysłaniem.

Scenariusz 2: Ocena zgłoszeń

Cel: podobna klasyfikacja zgłoszeń.
Wejście: przykłady ocen i nowe zgłoszenie.
Kroki: wzorzec -> klasyfikacja -> uzasadnienie.
Rezultat: mniej przypadkowe etykiety.
Zabezpieczenie: testy na kilku zestawach.

Scenariusz 3: Pisanie haseł do pojęciownika

Cel: utrzymanie struktury wpisów.
Wejście: przykładowe hasło i nowe pojęcie.
Kroki: wzorzec -> szkic -> korekta.
Rezultat: wpis zgodny ze stylem repo.
Zabezpieczenie: przegląd przez glossary-architect.

Ryzyka i jak je ograniczać

Ryzyko 1: Dane wrażliwe w przykładach

Ryzyko: Dane wrażliwe w przykładach.
Jak ograniczać: anonimizuj i stosuj DLP.

Ryzyko 2: Przejmowanie błędów z przykładów

Ryzyko: Przejmowanie błędów z przykładów.
Jak ograniczać: testuj na kilku zestawach i poprawiaj wzorce.

Ryzyko 3: Za długi prompt

Ryzyko: Za długi prompt.
Jak ograniczać: pilnuj tokenów i zostaw tylko potrzebne przykłady.

Checklista

Czy przykłady są dobre jakościowo?
Czy nie zawierają danych wrażliwych?
Czy format jest jasny?
Czy wynik da się porównać z oczekiwaniami?

Dalsza lektura

OpenAI — Prompting

Miejsce w mapie

Few-shot → rozszerza: Zero-shot
Few-shot → zużywa: Okno kontekstowe
Few-shot → wymaga kontroli przez: Ewaluacja

Co to w zasadzie jest?

Zamiast długo tłumaczyć, pokazujesz 2-3 wzorce. Model łatwiej kopiuje strukturę niż domyśla się, jak ma wyglądać wynik.

Few-shot jest przydatny, gdy chcesz utrzymać konsekwentny format, uzyskać podobne wyniki w zespole albo pilnować wymagań redakcyjnych.

To często złoty środek między chaosem zero-shot a kosztami treningu.

Diagram

Diagram pokazuje, że przykłady działają jak wzorzec formatu dla nowego zadania.

Powiązane hasła

Prompt
Okno kontekstowe
Token
Dane osobowe (PII)
Ewaluacja

Fine-tuning (dostrajanie)

Kategoria: Modele i dane Tagi: modele dane ai fine tuning

Definicja

Fine-tuning to proces dopasowania modelu do konkretnego stylu lub zadania przez dodatkowe uczenie na wybranych danych.

Po co w praktyce

Scenariusz 1: Stały styl komunikatów

Cel: stały styl komunikatów.
Wejście: zestaw dobrych przykładów.
Kroki: trening → testy → wdrożenie.
Rezultat: spójne komunikaty.
Zabezpieczenie: ewaluacja + human-in-the-loop.

Scenariusz 2: Klasyfikacja zgłoszeń (kategorie)

Cel: klasyfikacja zgłoszeń (kategorie).
Wejście: opis sprawy.
Kroki: fine-tuning na etykietach.
Rezultat: szybsze kierowanie.
Zabezpieczenie: próg pewności + ręczna korekta.

Scenariusz 3: Poprawa tonu pism

Cel: poprawa tonu pism.
Wejście: wzorce + błędy.
Kroki: trening stylu.
Rezultat: mniej poprawek.
Zabezpieczenie: kontrola prawna.

Ryzyka i jak je ograniczać

Ryzyko 1: PII/RODO

Ryzyko: PII/RODO: dane w treningu.
Jak ograniczać: anonimizacja + DPIA.

Ryzyko 2: Overfitting

Ryzyko: Overfitting: model „uczy się na pamięć”.
Jak ograniczać: walidacja, test set.

Ryzyko 3: Koszty i zależności

Ryzyko: Koszty i zależności: lock-in.
Jak ograniczać: dokumentacja i możliwość wycofania.

Checklista

Czy dane są legalne i zanonimizowane?
Czy masz zbiór testowy i metryki?
Czy masz proces wycofania wersji?
Czy rezultat przechodzi review człowieka?
Czy wiesz, czy nie wystarczy RAG?

Dalsza lektura

Miejsce w mapie

Fine-tuning → alternatywa dla / uzupełnia: RAG
Fine-tuning → wymaga: Ewaluacja
Fine-tuning → zwiększa wagę: RODO / DPIA

Co to w zasadzie jest?

To jak „doszkolenie” modelu do Twojego języka i standardów.
Nie zawsze poprawia wiedzę faktograficzną — często poprawia styl i powtarzalność.
W firmie częściej wystarczy RAG + dobre prompty niż fine-tuning.

Typowe błędy i pułapki

Uczenie na małej, słabej jakości próbce.
Wrzucanie danych wrażliwych do treningu.
Brak ewaluacji po zmianie.

Diagram

Diagram pokazuje, że fine-tuning polega na dodatkowym uczeniu modelu na wybranych danych i późniejszym testowaniu efektu.

Powiązane hasła

RAG
Ewaluacja
LLMOps
Human-in-the-loop
Vendor lock-in

Function calling (wywoływanie funkcji)

Kategoria: Wdrożenia i operacje (LLMOps) Tagi: llmops wdrozenia operacje function calling

Definicja

Function calling to mechanizm, w którym model zamiast „zgadywać odpowiedź”, zwraca ustrukturyzowaną prośbę o wywołanie konkretnej funkcji (np. pobierz dane, policz, wyszukaj), a potem wykorzystuje wynik tej funkcji do odpowiedzi.

Po co w praktyce

Scenariusz 1: Planowanie

Cel: „Sprawdź wolne terminy w kalendarzu i zaproponuj 3 sloty.” (funkcja: odczyt kalendarza).
Wejście: pytanie użytkownika i dostępna funkcja.
Kroki: wybierz funkcję -> przekaż parametry -> użyj wyniku.
Rezultat: odpowiedź oparta na wyniku funkcji.
Zabezpieczenie: walidacja parametrów i obsługa błędów.

Scenariusz 2: Obsługa wiedzy

Cel: „Znajdź w repo definicję RAG i podaj skrót.” (funkcja: wyszukaj w plikach).
Wejście: pytanie użytkownika i dostępna funkcja.
Kroki: wybierz funkcję -> przekaż parametry -> użyj wyniku.
Rezultat: odpowiedź oparta na wyniku funkcji.
Zabezpieczenie: walidacja parametrów i obsługa błędów.

Scenariusz 3: Automatyzacja

Cel: „Zapisz to jako notatkę i dodaj tag ‘AI’.” (funkcja: utwórz wpis w systemie notatek).
Wejście: pytanie użytkownika i dostępna funkcja.
Kroki: wybierz funkcję -> przekaż parametry -> użyj wyniku.
Rezultat: odpowiedź oparta na wyniku funkcji.
Zabezpieczenie: walidacja parametrów i obsługa błędów.

Ryzyka i jak je ograniczać

Ryzyko 1: Model wybierze złą funkcję albo poda złe parametry

Ryzyko: model wybierze złą funkcję albo poda złe parametry.
Jak ograniczać: walidacja parametrów + lista dozwolonych funkcji (allowlist) + testy przypadków brzegowych.

Ryzyko 2: Wyciek danych (model „poprosi” o zbyt szeroki zakres)

Ryzyko: wyciek danych (model „poprosi” o zbyt szeroki zakres).
Jak ograniczać: minimalizacja danych, maskowanie PII, zasady dostępu per rola.

Ryzyko 3: Nadużycie funkcji przez prompt injection (atak w treści)

Ryzyko: nadużycie funkcji przez prompt injection (atak w treści).
Jak ograniczać: oddzielanie danych od instrukcji + guardrails + kontrola uprawnień.

Dalsza lektura

Miejsce w mapie

API → funkcje zwykle mapują się na endpointy API.
Agent AI → agent używa function calling, by wykonywać działania.
Orkiestracja → orkiestrator decyduje, kiedy wywołać funkcję i co zrobić z wynikiem.
Prompt injection → treść może próbować „wymusić” niebezpieczne wywołania.
DLP / PII → ochrona danych przekazywanych do funkcji.
Mini-przepływ: Prompt → LLM → function_call → API → wynik → LLM → odpowiedź

Co to w zasadzie jest?

Wyobraź sobie, że AI to „gadatliwy asystent”, który czasem powinien przestać gadać i… po prostu coś sprawdzić lub wykonać. Function calling to sposób, żeby AI powiedziało: „hej, potrzebuję danych z kalendarza / pliku / API — zróbmy to technicznie, a nie na słowo”. W praktyce: 1) Ty zadajesz pytanie, 2) model wybiera funkcję (np. „pobierz pogodę”, „wyszukaj w bazie”), 3) system wywołuje funkcję, 4) wynik wraca do modelu, 5) model tworzy finalną odpowiedź.

Dzięki temu AI częściej bazuje na faktach (bo „widzi” wynik funkcji), a rzadziej fantazjuje.

Diagram

Diagram pokazuje, że model może poprosić system o wywołanie konkretnej funkcji zamiast zgadywać wynik.

GenAI

Kategoria: Modele i dane Tagi: modele dane ai genai

Definicja

GenAI (Generative AI) to systemy, które generują nowe treści: tekst, obraz, dźwięk lub kod. Modele uczą się wzorców z danych i tworzą nowe warianty. To kategoria technologii, a nie pojedynczy produkt.

Po co w praktyce

Scenariusz 1: Szkice kampanii marketingowej

Cel: szkice kampanii marketingowej.
Wejście: brief i grupa docelowa.
Kroki: prompt → warianty → wybór.
Rezultat: pomysły do dopracowania.
Zabezpieczenie: kontrola brandowa.

Scenariusz 2: Opisy produktów

Cel: opisy produktów.
Wejście: specyfikacja.
Kroki: generacja → redakcja → publikacja.
Rezultat: spójne opisy.
Zabezpieczenie: weryfikacja faktów.

Scenariusz 3: Materiały szkoleniowe

Cel: materiały szkoleniowe.
Wejście: zakres szkolenia.
Kroki: generacja konspektu → korekta → zatwierdzenie.
Rezultat: szkic materiału.
Zabezpieczenie: review merytoryczne.

Ryzyka i jak je ograniczać

Ryzyko 1: Dezinformacja

Ryzyko: Dezinformacja.
Jak ograniczać: weryfikacja faktów.

Ryzyko 2: Prawa autorskie

Ryzyko: Prawa autorskie.
Jak ograniczać: polityka źródeł i review.

Ryzyko 3: Deepfake

Ryzyko: Deepfake.
Jak ograniczać: oznaczanie treści i procedury.

Checklista

Czy masz jasny cel i brief?
Czy weryfikujesz fakty i daty?
Czy treść jest zgodna z marką?
Czy masz politykę praw autorskich?
Czy wiesz, gdzie nie używać GenAI?

Dalsza lektura

Miejsce w mapie

GenAI → obejmuje: LLM
GenAI → zwiększa ryzyko: Deepfake
GenAI → wymaga: Fact-checking

Co to w zasadzie jest?

GenAI „wytwarza” treści na podstawie polecenia.
Jakość zależy od danych wejściowych i ustawień.
Może przyspieszać pracę kreatywną i automatyzacje.
Wymaga weryfikacji, bo może tworzyć błędy.

Typowe błędy i pułapki

Traktowanie treści GenAI jako gotowych do publikacji.
Brak kontroli praw autorskich.
Zbyt ogólne prompty.

Diagram

Diagram pokazuje podstawowy przepływ generowania treści przez model AI i potrzebę sprawdzenia wyniku.

Powiązane hasła

LLM
Deepfake
Model multimodalny
Fact-checking
Transparentność

GPAI

Kategoria: Modele i dane Tagi: prawo etyka zgodność gpai modele dane ai

Definicja

GPAI (General-Purpose AI, czyli AI ogólnego przeznaczenia) to modele, które mogą być używane w wielu różnych zadaniach i kontekstach. Nie są zaprojektowane do jednego wąskiego celu. To pojęcie opisuje klasę modeli, a nie konkretny produkt.

Po co w praktyce

Scenariusz 1: Jedna platforma AI dla wielu działów

Cel: jedna platforma AI dla wielu działów.
Wejście: polityka użycia.
Kroki: konfiguracja → role → monitoring.
Rezultat: spójne wykorzystanie.
Zabezpieczenie: audyt i ograniczenia.

Scenariusz 2: Szybkie prototypowanie usług

Cel: szybkie prototypowanie usług.
Wejście: brief produktu.
Kroki: testy → pilotaż → wdrożenie.
Rezultat: szybszy time-to-market.
Zabezpieczenie: ocena ryzyk.

Scenariusz 3: Automatyzacja procesów

Cel: automatyzacja procesów.
Wejście: opis procesów.
Kroki: mapowanie → prompty → kontrola.
Rezultat: oszczędność czasu.
Zabezpieczenie: human-in-the-loop.

Ryzyka i jak je ograniczać

Ryzyko 1: Nieprzewidywalne użycia

Ryzyko: Nieprzewidywalne użycia.
Jak ograniczać: jasne polityki i role.

Ryzyko 2: Stronniczość

Ryzyko: Stronniczość.
Jak ograniczać: testy na różnych danych.

Ryzyko 3: Vendor lock-in

Ryzyko: Vendor lock-in.
Jak ograniczać: strategia wyjścia.

Checklista

Czy określono dozwolone przypadki użycia?
Czy są role i uprawnienia?
Czy jest plan monitoringu jakości?
Czy są procedury eskalacji błędów?
Czy logujesz użycie?

Dalsza lektura

Miejsce w mapie

GPAI → obejmuje: LLM
GPAI → wymaga: Polityka AI
GPAI → zwiększa wagę: Ewaluacja

Co to w zasadzie jest?

To „uniwersalne” modele, które potrafią robić wiele rzeczy.
Mogą zasilać różne aplikacje: od obsługi klienta po analizę dokumentów.
Taka ogólność zwiększa możliwości, ale też ryzyka.
Wymaga to jasnych zasad użycia i kontroli jakości.

Typowe błędy i pułapki

Traktowanie modelu ogólnego jako „gotowego na wszystko”.
Brak ograniczeń zakresu użycia.
Zbyt szeroki dostęp w organizacji.

Diagram

Diagram pokazuje, że GPAI to model używany do wielu różnych zastosowań, a nie do jednego wąskiego zadania.

Powiązane hasła

GenAI
LLM
Polityka AI
Ewaluacja
Vendor lock-in

Ground truth (prawda referencyjna)

Kategoria: Jakość i ewaluacja Tagi: jakosc ewaluacja metryki ground truth

Definicja

Ground truth to „prawidłowa odpowiedź” lub zestaw danych referencyjnych, do których porównujesz wyniki AI.

Po co w praktyce

Scenariusz 1: Zestaw 100 pytań o pojęciownik z przygotowanymi dobrymi odpowiedziami

Cel: zestaw 100 pytań o pojęciownik z przygotowanymi dobrymi odpowiedziami.
Wejście: zestaw referencyjnych odpowiedzi albo etykiet.
Kroki: porównaj wynik -> policz różnice -> popraw model lub prompt.
Rezultat: ocena jakości oparta na wzorcu.
Zabezpieczenie: aktualizacja i przegląd danych referencyjnych.

Scenariusz 2: Lista „poprawnych” fragmentów dokumentów do retrieval

Cel: lista „poprawnych” fragmentów dokumentów do retrieval.
Wejście: zestaw referencyjnych odpowiedzi albo etykiet.
Kroki: porównaj wynik -> policz różnice -> popraw model lub prompt.
Rezultat: ocena jakości oparta na wzorcu.
Zabezpieczenie: aktualizacja i przegląd danych referencyjnych.

Scenariusz 3: Testy bezpieczeństwa

Cel: oczekiwana reakcja „odmowa” na niebezpieczne prośby.
Wejście: zestaw referencyjnych odpowiedzi albo etykiet.
Kroki: porównaj wynik -> policz różnice -> popraw model lub prompt.
Rezultat: ocena jakości oparta na wzorcu.
Zabezpieczenie: aktualizacja i przegląd danych referencyjnych.

Ryzyka i jak je ograniczać

Ryzyko 1: Ground truth jest nieaktualne

Ryzyko: ground truth jest nieaktualne.
Jak ograniczać: aktualizacje, wersjonowanie, daty.

Ryzyko 2: Ground truth jest stronnicze

Ryzyko: ground truth jest stronnicze.
Jak ograniczać: różne osoby, różne przypadki, analiza bias.

Ryzyko 3: Porównujesz nie to, co trzeba (zła metryka)

Ryzyko: porównujesz nie to, co trzeba (zła metryka).
Jak ograniczać: jasne kryteria jakości i metryki.

Dalsza lektura

NIST — metody oceny i ryzyka (nist.gov)

Miejsce w mapie

Ewaluacja → bez ground truth nie ma dobrej ewaluacji.
Benchmark → benchmarky opierają się na danych referencyjnych.
Fact-checking → ground truth jako baza do weryfikacji.
Drift → porównanie „w czasie” do prawdy referencyjnej.
Mini-przepływ: Ground truth → testy → metryki → poprawki

Co to w zasadzie jest?

Jeśli chcesz ocenić, czy AI działa dobrze, musisz mieć punkt odniesienia:

prawidłowe odpowiedzi,
poprawne etykiety,
sprawdzone źródła.

Bez ground truth łatwo wpaść w pułapkę: „wydaje się OK”, ale w praktyce jest źle.

Diagram

Diagram pokazuje, że ground truth jest punktem odniesienia do oceny jakości systemu.

Grounding (ugruntowanie odpowiedzi)

Kategoria: Retrieval / RAG Tagi: rag retrieval wyszukiwanie grounding

Definicja

Grounding to technika, w której model odpowiada na podstawie wskazanych źródeł, a nie tylko „z pamięci modelu”.

Po co w praktyce

Scenariusz 1: Komunikat do klientów z regulaminy

Cel: komunikat do klientów z regulaminy.
Wejście: regulamin.
Kroki: wybierz fragmenty → generuj → dodaj cytaty.
Rezultat: czytelny komunikat.
Zabezpieczenie: weryfikacja prawnika.

Scenariusz 2: Odpowiedź na zgłoszenie o informację

Cel: odpowiedź na zgłoszenie o informację.
Wejście: procedura + wzór.
Kroki: RAG → odpowiedź → źródła.
Rezultat: spójna odpowiedź.
Zabezpieczenie: usunięcie PII.

Scenariusz 3: Streszczenie regulaminu

Cel: streszczenie regulaminu.
Wejście: regulamin.
Kroki: grounding → plain language.
Rezultat: skrót z odnośnikami.
Zabezpieczenie: brak zmian sensu.

Ryzyka i jak je ograniczać

Ryzyko 1: Błędne źródła

Ryzyko: Błędne źródła: zły dokument w bazie.
Jak ograniczać: whitelist + wersjonowanie.

Ryzyko 2: Nadinterpretacja

Ryzyko: Nadinterpretacja: model dopowiada.
Jak ograniczać: polecenie: „tylko na podstawie cytatów”.

Ryzyko 3: Ukryte wstrzyknięcia

Ryzyko: Ukryte wstrzyknięcia: złośliwy fragment w źródle.
Jak ograniczać: skan + review.

Checklista

Czy źródła są oficjalne i aktualne?
Czy odpowiedź zawiera cytaty/linki?
Czy w treści nie ma dopowiedzeń poza źródłem?
Czy wersje dokumentów są zgodne?
Czy jest akceptacja człowieka?

Dalsza lektura

Miejsce w mapie

Grounding → ogranicza: Halucynacje
Grounding → współpracuje z: RAG
Grounding → wymaga: Cytowanie źródeł

Co to w zasadzie jest?

Chodzi o to, by odpowiedź miała „podparcie” w dokumentach.
Model dostaje fragmenty tekstu i ma się na nich oprzeć.
Dzięki temu łatwiej ograniczyć halucynacje i podać cytaty.

Typowe błędy i pułapki

Podanie źródeł nie na temat.
Brak cytowania fragmentów (tylko „link ogólny”).
Mieszanie wersji dokumentów.

Diagram

Diagram pokazuje, że grounding polega na osadzeniu odpowiedzi w konkretnych materiałach źródłowych.

Powiązane hasła

RAG
Halucynacje
Ewaluacja
Prompt
Prompt injection

Guardrails (barierki bezpieczeństwa)

Kategoria: Bezpieczeństwo Tagi: bezpieczeństwo ryzyko ochrona guardrails

Definicja

Guardrails to zestaw zasad i zabezpieczeń, które ograniczają, co model może zrobić i jak ma odpowiadać.

Po co w praktyce

Scenariusz 1: Wymóg

Cel: wymóg: odpowiedzi tylko z dokumentów organizacji (grounding).
Wejście: reguły systemu i przykładowe zapytania użytkowników.
Kroki: zdefiniuj ograniczenie -> przetestuj odpowiedzi -> popraw reguły.
Rezultat: bezpieczniejsze zachowanie systemu.
Zabezpieczenie: testy regresji i monitoring naruszeń.

Scenariusz 2: Blokada

Cel: blokada: nie podawaj danych osobowych ani nie proś o nie.
Wejście: reguły systemu i przykładowe zapytania użytkowników.
Kroki: zdefiniuj ograniczenie -> przetestuj odpowiedzi -> popraw reguły.
Rezultat: bezpieczniejsze zachowanie systemu.
Zabezpieczenie: testy regresji i monitoring naruszeń.

Scenariusz 3: Szablon

Cel: szablon: komunikaty w plain language.
Wejście: reguły systemu i przykładowe zapytania użytkowników.
Kroki: zdefiniuj ograniczenie -> przetestuj odpowiedzi -> popraw reguły.
Rezultat: bezpieczniejsze zachowanie systemu.
Zabezpieczenie: testy regresji i monitoring naruszeń.

Ryzyka i jak je ograniczać

Ryzyko 1: Jailbreaking

Ryzyko: Jailbreaking.
Jak ograniczać: red teaming + aktualizacja zasad.

Ryzyko 2: Prompt injection

Ryzyko: Prompt injection.
Jak ograniczać: filtrowanie źródeł i instrukcji.

Ryzyko 3: Fałszywe blokady

Ryzyko: Fałszywe blokady.
Jak ograniczać: strojenie + wyjątki.

Checklista

Czy guardrails są spisane i wdrożone technicznie?
Czy testowałeś obejścia?
Czy logujesz odmowy i wyjątki?
Czy masz eskalację problemów?
Czy jest wersjonowanie zasad?

Dalsza lektura

Miejsce w mapie

Guardrails → ogranicza: Jailbreaking
Guardrails → ogranicza: Prompt injection
Guardrails → wymaga: Polityka użycia AI

Co to w zasadzie jest?

To „poręcze”, które trzymają AI w bezpiecznych granicach.
Mogą wymuszać: styl, cytaty, zakaz podawania danych wrażliwych, odmowę niebezpiecznych treści.
Guardrails nie zastępują człowieka, ale zmniejszają ryzyko.

Typowe błędy i pułapki

Guardrails tylko „na papierze” (brak testów).
Zbyt luźne zasady, które łatwo obejść.

Diagram

Diagram pokazuje, że guardrails działają przed i po generowaniu odpowiedzi, ograniczając ryzyko.

Powiązane hasła

Prompt injection
Jailbreaking
Red teaming
Polityka użycia AI
Human-in-the-loop

Halucynacje

Kategoria: Organizacja i zarządzanie Tagi: modele dane ai hallucynacje organizacja zarzadzanie procesy

Definicja

Halucynacje to sytuacja, gdy model podaje fałszywe informacje, ale robi to w sposób przekonujący.

Po co w praktyce

Scenariusz 1: Odpowiedź klientowi

Cel: odpowiedź klientowi.
Wejście: zadanie, dane wejściowe i źródła.
Kroki: wykonaj zadanie -> sprawdź ryzyko: błędna podstawa prawna -> zastosuj zabezpieczenie.
Rezultat: odpowiedź mniej podatna na zmyślenia.
Zabezpieczenie: grounding + cytaty + akceptacja.

Scenariusz 2: Opis projektu/inwestycji

Cel: opis projektu/inwestycji.
Wejście: zadanie, dane wejściowe i źródła.
Kroki: wykonaj zadanie -> sprawdź ryzyko: „dopowiedzenie” liczb -> zastosuj zabezpieczenie.
Rezultat: odpowiedź mniej podatna na zmyślenia.
Zabezpieczenie: dane wejściowe z tabeli + weryfikacja.

Scenariusz 3: Streszczenie regulaminu

Cel: streszczenie regulaminu.
Wejście: zadanie, dane wejściowe i źródła.
Kroki: wykonaj zadanie -> sprawdź ryzyko: zmiana sensu -> zastosuj zabezpieczenie.
Rezultat: odpowiedź mniej podatna na zmyślenia.
Zabezpieczenie: porównanie punkt po punkcie.

Ryzyka i jak je ograniczać

Ryzyko 1: Dezinformacja

Ryzyko: Dezinformacja.
Jak ograniczać: fact-checking + źródła.

Ryzyko 2: Błąd formalny

Ryzyko: Błąd formalny.
Jak ograniczać: checklista prawna.

Ryzyko 3: Utrata zaufania

Ryzyko: Utrata zaufania.
Jak ograniczać: transparentność, że to szkic.

Checklista

Czy odpowiedź ma źródła/cytaty?
Czy liczby i daty są weryfikowalne?
Czy treść przeszła review?
Czy użyto zatwierdzonych dokumentów?
Czy logujesz wersję i autora?

Dalsza lektura

Miejsce w mapie

Halucynacje → ogranicza: Grounding
Halucynacje → ogranicza: RAG
Halucynacje → kontroluje: Fact-checking

Co to w zasadzie jest?

Model nie „wie”, tylko przewiduje kolejne słowa.
Może tworzyć odpowiedzi, które brzmią sensownie, ale są nieprawdziwe.
Ryzyko rośnie przy braku źródeł i przy zbyt ogólnych poleceniach.

Typowe błędy i pułapki

Proszenie o „przepisy” bez podania źródła.
Brak prośby o cytaty i linki.
Publikowanie bez weryfikacji.

Diagram

Diagram pokazuje, że halucynacja pojawia się wtedy, gdy model uzupełnia brak wiedzy zgadywaniem.

Powiązane hasła

Grounding
RAG
Fact-checking
Ewaluacja
Cytowanie źródeł

Human-in-the-loop (człowiek w pętli)

Kategoria: Organizacja i zarządzanie Tagi: modele dane ai human in the loop organizacja

Definicja

Human-in-the-loop oznacza, że człowiek sprawdza i zatwierdza wyniki AI na kluczowych etapach.

Po co w praktyce

Scenariusz 1: Posty i komunikaty

Cel: posty i komunikaty: zawsze akceptacja redaktora.
Wejście: wynik AI wymagający decyzji albo publikacji.
Kroki: AI proponuje -> człowiek sprawdza -> człowiek akceptuje.
Rezultat: kontrolowana decyzja lub publikacja.
Zabezpieczenie: jasny właściciel decyzji.

Scenariusz 2: Odpowiedzi na pisma

Cel: odpowiedzi na pisma: zawsze akceptacja merytoryczna/prawna.
Wejście: wynik AI wymagający decyzji albo publikacji.
Kroki: AI proponuje -> człowiek sprawdza -> człowiek akceptuje.
Rezultat: kontrolowana decyzja lub publikacja.
Zabezpieczenie: jasny właściciel decyzji.

Scenariusz 3: Klasyfikacja zgłoszeń

Cel: klasyfikacja zgłoszeń: AI proponuje, człowiek poprawia.
Wejście: wynik AI wymagający decyzji albo publikacji.
Kroki: AI proponuje -> człowiek sprawdza -> człowiek akceptuje.
Rezultat: kontrolowana decyzja lub publikacja.
Zabezpieczenie: jasny właściciel decyzji.

Ryzyka i jak je ograniczać

Ryzyko 1: Błędy merytoryczne

Ryzyko: Błędy merytoryczne.
Jak ograniczać: checklisty i źródła.

Ryzyko 2: Przeciążenie ludzi

Ryzyko: Przeciążenie ludzi.
Jak ograniczać: automatyzuj tylko część, mierz jakość.

Ryzyko 3: Brak odpowiedzialności

Ryzyko: Brak odpowiedzialności.
Jak ograniczać: role i ślad audytowy.

Checklista

Czy wiadomo, kto zatwierdza?
Czy są kryteria oceny?
Czy treść ma źródła?
Czy w treści nie ma PII?
Czy zapisujesz wersję i autora?

Dalsza lektura

Miejsce w mapie

HITL → ogranicza: Halucynacje
HITL → wymagany w: Polityka AI
HITL → wspiera: Fact-checking

Co to w zasadzie jest?

AI robi szkic, człowiek odpowiada za decyzję.
Najważniejsze w treściach publicznych i sprawach formalnych.
To podstawowy „bezpiecznik” na halucynacje i błędy.

Typowe błędy i pułapki

„Zatwierdzanie na ślepo”.
Brak kryteriów oceny.

Diagram

Diagram pokazuje, że człowiek pozostaje punktem decyzyjnym w ważnym etapie procesu.

Powiązane hasła

Polityka użycia AI
Fact-checking
Halucynacje
Audit trail
Transparentność

Hybrid search (wyszukiwanie hybrydowe)

Kategoria: Retrieval / RAG Tagi: rag retrieval wyszukiwanie hybrid search

Definicja

Hybrid search to łączenie dwóch podejść do wyszukiwania: klasycznego (słowa kluczowe) i semantycznego (embeddingi), aby lepiej trafiać w intencję pytania.

Po co w praktyce

Scenariusz 1: Pytanie

Cel: „jak chronić dane osobowe w AI” → semantyka trafia w PII/DLP.
Wejście: zapytanie użytkownika i indeks tekstowy/wektorowy.
Kroki: wyszukaj tekstowo -> wyszukaj semantycznie -> połącz wyniki.
Rezultat: większa trafność wyszukiwania.
Zabezpieczenie: reranking i testy jakości.

Scenariusz 2: Pytanie

Cel: „prompt leakage” → keyword search łapie termin.
Wejście: zapytanie użytkownika i indeks tekstowy/wektorowy.
Kroki: wyszukaj tekstowo -> wyszukaj semantycznie -> połącz wyniki.
Rezultat: większa trafność wyszukiwania.
Zabezpieczenie: reranking i testy jakości.

Scenariusz 3: Pytanie

Cel: „baza wektorowa” → hybryda znajduje i „vector database”, i „embedding”.
Wejście: zapytanie użytkownika i indeks tekstowy/wektorowy.
Kroki: wyszukaj tekstowo -> wyszukaj semantycznie -> połącz wyniki.
Rezultat: większa trafność wyszukiwania.
Zabezpieczenie: reranking i testy jakości.

Ryzyka i jak je ograniczać

Ryzyko 1: Skomplikowanie i trudność strojenia

Ryzyko: skomplikowanie i trudność strojenia.
Jak ograniczać: testy na realnych pytaniach + proste heurystyki.

Ryzyko 2: Złe wyniki w długich dokumentach

Ryzyko: złe wyniki w długich dokumentach.
Jak ograniczać: chunking + reranking.

Ryzyko 3: Koszty

Ryzyko: koszty.
Jak ograniczać: cache, top-k, profilowanie.

Dalsza lektura

NIST — jakość i ocena systemów AI (nist.gov)

Miejsce w mapie

Embedding / Vector database → filar semantyki.
Chunking → poprawia trafność.
Reranking → drugi filtr jakości.
RAG → hybryda często jest częścią RAG.
Mini-przepływ: Keyword + semantyka → wspólne wyniki → rerank

Co to w zasadzie jest?

Słowa kluczowe świetnie działają, gdy ktoś zna nazwę („RAG”, „DLP”). Semantyka działa, gdy ktoś opisuje problem („jak uniknąć wycieków danych do AI”). Hybryda bierze najlepsze z obu światów:

dopasowanie po frazach,
dopasowanie po znaczeniu.

Diagram

Diagram pokazuje, że wyszukiwanie hybrydowe łączy dopasowanie po słowach i po sensie.

Idempotencja

Kategoria: Wdrożenia i operacje (LLMOps) Tagi: llmops wdrozenia operacje idempotencja

Definicja

Idempotencja oznacza, że wykonanie tej samej operacji wiele razy daje ten sam efekt (np. „utwórz X” nie tworzy duplikatów).

Po co w praktyce

Scenariusz 1: Agent tworzy zadanie w systemie — idempotency key zapobiega duplikatom

Cel: agent tworzy zadanie w systemie — idempotency key zapobiega duplikatom.
Wejście: akcja możliwa do ponowienia.
Kroki: nadaj identyfikator -> sprawdź duplikat -> wykonaj raz.
Rezultat: brak podwójnych operacji.
Zabezpieczenie: klucze idempotencji i logi.

Scenariusz 2: Integracja z API — ponowienie żądania po timeout nie robi szkody

Cel: integracja z API — ponowienie żądania po timeout nie robi szkody.
Wejście: akcja możliwa do ponowienia.
Kroki: nadaj identyfikator -> sprawdź duplikat -> wykonaj raz.
Rezultat: brak podwójnych operacji.
Zabezpieczenie: klucze idempotencji i logi.

Scenariusz 3: Publikacja wpisu — „update” zamiast „create”, jeśli już istnieje

Cel: publikacja wpisu — „update” zamiast „create”, jeśli już istnieje.
Wejście: akcja możliwa do ponowienia.
Kroki: nadaj identyfikator -> sprawdź duplikat -> wykonaj raz.
Rezultat: brak podwójnych operacji.
Zabezpieczenie: klucze idempotencji i logi.

Ryzyka i jak je ograniczać

Ryzyko 1: Brak idempotencji = duble, chaos, koszty

Ryzyko: brak idempotencji = duble, chaos, koszty.
Jak ograniczać: klucze idempotencji, wykrywanie duplikatów, transakcje.

Ryzyko 2: Trudna diagnoza „czemu są dwa wpisy”

Ryzyko: trudna diagnoza „czemu są dwa wpisy”.
Jak ograniczać: audit trail i identyfikatory żądań.

Ryzyko 3: Agent zapętla się

Ryzyko: agent zapętla się.
Jak ograniczać: limity kroków, rate limiting, checkpointy.

Miejsce w mapie

API → idempotencja jest częsta w dobrych API.
Tool calling → narzędzia powinny być bezpieczne na powtórzenia.
Audit trail → ślad wykonań.
Agentic workflow → pętle i ponowienia.
Mini-przepływ: Wywołanie → (czy już było?) → wykonaj / pomiń

Co to w zasadzie jest?

W AI z narzędziami łatwo o powtórzenia: agent może kliknąć „wyślij” dwa razy, bo nie był pewien wyniku. Idempotencja to zabezpieczenie: nawet jeśli to się zdarzy, system nie zrobi dubla (albo bezpiecznie go wykryje).

Diagram

Diagram pokazuje, że ponowienie tej samej operacji nie powinno wywołać nowego skutku.

Inferencja (inference)

Kategoria: Wdrożenia i operacje (LLMOps) Tagi: ai modele llmops wdrozenia tokeny

Definicja

Inferencja to uruchomienie modelu, żeby wygenerował wynik: tekst, klasyfikację, embeddingi albo inną odpowiedź. To użycie modelu, a nie jego uczenie.

Po co w praktyce

Scenariusz 1: Odpowiedź chatbota

Cel: wsparcie działu obsługi klienta.
Wejście: pytanie klienta.
Kroki: analiza pytania -> odpowiedź -> ewentualna eskalacja.
Rezultat: szybka reakcja.
Zabezpieczenie: przegląd odpowiedzi przy trudnych sprawach.

Scenariusz 2: Streszczenie dokumentu

Cel: skrócenie długiego materiału.
Wejście: dokument lub fragment tekstu.
Kroki: podaj tekst -> wskaż format -> wygeneruj streszczenie.
Rezultat: krótsza wersja do dalszej pracy.
Zabezpieczenie: sprawdzenie, czy streszczenie nie pomija ważnych zastrzeżeń.

Scenariusz 3: Klasyfikacja wiadomości

Cel: podział zgłoszeń na kategorie.
Wejście: treść wiadomości.
Kroki: klasyfikacja -> przypisanie etykiety -> zapis wyniku.
Rezultat: łatwiejsze kierowanie zgłoszeń.
Zabezpieczenie: testy jakości i monitoring błędów.

Ryzyka i jak je ograniczać

Ryzyko 1: Wyciek danych w prompcie

Ryzyko: Wyciek danych w prompcie.
Jak ograniczać: stosuj DLP, minimalizację danych i anonimizację.

Ryzyko 2: Koszty i opóźnienia

Ryzyko: Koszty i opóźnienia.
Jak ograniczać: ustaw limity, cache i monitoring.

Ryzyko 3: Niestabilne odpowiedzi

Ryzyko: Niestabilne odpowiedzi.
Jak ograniczać: kontroluj temperaturę i testuj wyniki.

Checklista

Czy dane wejściowe są potrzebne w takiej szczegółowości?
Czy znasz koszt i limit tokenów?
Czy odpowiedź wymaga przeglądu człowieka?
Czy wynik jest monitorowany?

Dalsza lektura

Miejsce w mapie

Inferencja → zużywa: Token
Inferencja → działa przez: API
Inferencja → wymaga kontroli w produkcji przez: LLMOps

Co to w zasadzie jest?

Inferencja to moment, gdy AI odpowiada na pytanie. To jak odpalenie kalkulatora: liczysz teraz, ale nie zmieniasz zasad matematyki.

Wiele osób myli inferencję z uczeniem się modelu. Tymczasem w typowych narzędziach model nie zapamiętuje rozmowy na stałe. Bierze prompt, kontekst i ustawienia, a potem generuje odpowiedź.

To ważne dla prywatności, kosztów i jakości. Każda inferencja zużywa zasoby obliczeniowe, zwykle rozliczane tokenami.

Diagram

Diagram pokazuje, że inferencja to pojedyncze użycie modelu, które ma wejście, wynik oraz koszt.

Powiązane hasła

Token
Temperatura / sampling
API
LLMOps
Monitoring jakości

Instruction tuning / RLHF

Kategoria: Modele i dane Tagi: modele dane ai instruction tuning rlhf

Definicja

Instruction tuning to uczenie modelu odpowiadania na polecenia. RLHF to metoda, w której model uczy się preferencji na podstawie ocen (np. ludzkich), aby lepiej trzymać się zasad.

Po co w praktyce

Scenariusz 1: Stały ton odpowiedzi

Cel: stały ton odpowiedzi.
Wejście: standard komunikacji.
Kroki: instrukcje → testy.
Rezultat: mniej „odjazdów”.
Zabezpieczenie: ewaluacja i monitoring.

Scenariusz 2: Ograniczenie ryzykownych treści

Cel: ograniczenie ryzykownych treści.
Wejście: polityka.
Kroki: guardrails + instrukcje.
Rezultat: bezpieczniejsze wyniki.
Zabezpieczenie: log + audyt.

Ryzyka i jak je ograniczać

Ryzyko 1: Fałszywe poczucie bezpieczeństwa

Ryzyko: Fałszywe poczucie bezpieczeństwa.
Jak ograniczać: checklisty i review.

Ryzyko 2: Błędna pewność

Ryzyko: Błędna pewność: model brzmi przekonująco.
Jak ograniczać: grounding + cytaty.

Ryzyko 3: Jailbreaking

Ryzyko: Jailbreaking: obejście zasad.
Jak ograniczać: red teaming + guardrails.

Checklista

Czy masz politykę użycia AI?
Czy testowałeś obejścia (red teaming)?
Czy masz logi i audyt?
Czy jest proces eskalacji błędów?
Czy odpowiedzi mają źródła?

Dalsza lektura

Miejsce w mapie

RLHF → wspiera: Guardrails
RLHF → ogranicza: Jailbreaking
RLHF → nie zastępuje: Ewaluacja

Co to w zasadzie jest?

Dzięki temu model nie tylko „generuje tekst”, ale stara się wykonywać polecenie.
RLHF pomaga ograniczać toksyczność i wprowadza zachowania „bardziej bezpieczne”.
To nie gwarantuje prawdy — tylko lepszą zgodność z instrukcją.

Typowe błędy i pułapki

Przekonanie, że „model jest już bezpieczny” i nie trzeba kontroli.
Brak własnych zasad organizacji (policy).

Diagram

Diagram pokazuje, że model uczy się lepiej wykonywać instrukcje dzięki przykładom i ocenom ludzi.

Powiązane hasła

Jailbreaking
Prompt systemowy
Guardrails
Red teaming
Halucynacje

Jailbreaking

Kategoria: Bezpieczeństwo Tagi: bezpieczeństwo ryzyko ochrona jailbreaking

Definicja

Jailbreaking to próby obejścia ograniczeń modelu, aby wykonywał działania sprzeczne z zasadami. Zwykle polega na manipulowaniu promptem i kontekstem rozmowy. To problem bezpieczeństwa w aplikacjach opartych o LLM.

Po co w praktyce

Scenariusz 1: Testy bezpieczeństwa asystenta

Cel: testy bezpieczeństwa asystenta.
Wejście: lista prób obejścia.
Kroki: test → analiza → poprawki.
Rezultat: większa odporność.
Zabezpieczenie: stały monitoring.

Scenariusz 2: Ochrona automatyzacji

Cel: ochrona automatyzacji.
Wejście: nietypowe prompty.
Kroki: wykrycie → blokada → eskalacja.
Rezultat: bezpieczne działanie.
Zabezpieczenie: log i alerty.

Scenariusz 3: Polityka użycia AI

Cel: polityka użycia AI.
Wejście: scenariusze ryzyk.
Kroki: opis zakazów → szkolenie → kontrola.
Rezultat: mniejsze nadużycia.
Zabezpieczenie: audyty.

Ryzyka i jak je ograniczać

Ryzyko 1: Obejście zasad

Ryzyko: Obejście zasad.
Jak ograniczać: guardrails i monitoring.

Ryzyko 2: Ujawnienie danych

Ryzyko: Ujawnienie danych.
Jak ograniczać: ograniczenia dostępu i DLP.

Ryzyko 3: Treści ryzykowne

Ryzyko: Treści ryzykowne.
Jak ograniczać: filtry treści i review.

Checklista

Czy masz politykę użycia AI?
Czy testowałeś próby obejścia?
Czy logujesz podejrzane zachowania?
Czy masz procedurę eskalacji?
Czy wiesz, jakie dane są szczególnie wrażliwe?

Dalsza lektura

Miejsce w mapie

Jailbreaking → atak na: Prompt systemowy
Jailbreaking → ograniczany przez: Guardrails
Jailbreaking → wymaga: Red teaming

Co to w zasadzie jest?

Użytkownik stara się „przekonać” model do złamania zasad.
Często wykorzystuje podstępne scenariusze i role.
Skuteczny jailbreaking może prowadzić do ujawnień lub ryzykownych treści.
Potrzebne są testy i guardrails.

Typowe błędy i pułapki

Przekonanie, że model „sam z siebie” jest bezpieczny.
Brak testów red teaming.
Brak procedury reagowania.

Diagram

Diagram pokazuje, że jailbreaking to próba obejścia zasad systemu i wymaga blokady na etapie kontroli.

Powiązane hasła

Prompt injection
Prompt systemowy
Guardrails
Red teaming
Polityka AI

Knowledge cutoff (granica wiedzy modelu)

Kategoria: Modele i dane Tagi: ai modele wiarygodnosc aktualnosc dane

Definicja

Knowledge cutoff to data, do której model miał dostęp do informacji podczas treningu. Po tej dacie model nie „wie”, co się wydarzyło - chyba że dostanie dane w kontekście, np. przez RAG albo narzędzie.

Po co w praktyce

Scenariusz 1: Sprawdzenie zmian w prawie

Cel: ograniczenie ryzyka nieaktualnej odpowiedzi.
Wejście: pytanie o nowe przepisy.
Kroki: podaj źródła -> sprawdź datę -> wygeneruj odpowiedź.
Rezultat: odpowiedź oparta na aktualnym materiale.
Zabezpieczenie: fact-checking i cytowanie źródeł.

Scenariusz 2: Streszczenie świeżego raportu

Cel: praca na materiale, którego model nie zna z treningu.
Wejście: raport lub jego fragmenty.
Kroki: wklej materiał -> wskaż zakres -> poproś o streszczenie.
Rezultat: streszczenie oparte na dostarczonym tekście.
Zabezpieczenie: kontrola, czy odpowiedź nie wychodzi poza źródło.

Scenariusz 3: Porównanie ofert na dziś

Cel: uniknięcie zgadywania cen i parametrów.
Wejście: aktualne dane z ofert.
Kroki: zbierz dane -> podaj je w kontekście -> porównaj kryteria.
Rezultat: porównanie aktualne dla wskazanej daty.
Zabezpieczenie: data porównania i lista źródeł.

Ryzyka i jak je ograniczać

Ryzyko 1: Nieaktualne odpowiedzi

Ryzyko: Nieaktualne odpowiedzi.
Jak ograniczać: podawaj daty, źródła i stosuj fact-checking.

Ryzyko 2: Mieszanie starych i nowych informacji

Ryzyko: Mieszanie starych i nowych informacji.
Jak ograniczać: dopisz w prompcie, że model ma wskazać braki danych.

Ryzyko 3: Fałszywa pewność

Ryzyko: Fałszywa pewność.
Jak ograniczać: wymagaj cytowania źródeł przy tematach zmiennych w czasie.

Checklista

Czy pytanie dotyczy aktualnych informacji?
Czy model dostał źródło nowsze niż jego granica wiedzy?
Czy odpowiedź ma datę i źródła?
Czy weryfikujesz fakty przed publikacją?

Dalsza lektura

Miejsce w mapie

Knowledge cutoff → zwiększa wagę: Fact-checking
Knowledge cutoff → wymaga aktualnych danych przez: RAG
Knowledge cutoff → łączy się z: Grounding

Co to w zasadzie jest?

Model jest jak książka wydana w konkretnym dniu. Może dobrze tłumaczyć i łączyć fakty, ale nie dopisuje automatycznie nowych rozdziałów o tym, co wydarzyło się później.

W praktyce oznacza to, że gdy pytasz o coś najnowszego, model może podać odpowiedź, która brzmi sensownie, ale nie jest aktualna. Dotyczy to zmian przepisów, cen, wydarzeń, funkcji narzędzi albo świeżych raportów.

Jeśli potrzebujesz aktualności, musisz dostarczyć je modelowi: wkleić materiał, dodać plik, użyć RAG albo narzędzia, które pobierze dane ze źródła.

Diagram

Diagram pokazuje, że po granicy wiedzy model potrzebuje aktualnych źródeł, aby nie zgadywać.

Powiązane hasła

RAG
Okno kontekstowe
Fact-checking
Grounding
Cytowanie źródeł
Halucynacje

Konektory danych

Kategoria: Retrieval / RAG Tagi: modele dane ai data connectors rag retrieval wyszukiwanie

Definicja

Konektory danych to bezpieczne „wtyczki”, które łączą system AI z repozytoriami dokumentów (np. dyskiem, intranetem, stroną WWW/FAQ lub bazą wiedzy).

Po co w praktyce

Scenariusz 1: Podłączenie procedur z intranetu do RAG

Cel: podłączenie procedur z intranetu do RAG.
Wejście: źródło danych i zasady dostępu.
Kroki: podłącz źródło -> sprawdź uprawnienia -> odśwież indeks.
Rezultat: asystent korzysta z właściwych danych.
Zabezpieczenie: kontrola dostępu i wersjonowanie źródeł.

Scenariusz 2: Podłączenie FAQ ze strony WWW/FAQ do asystenta

Cel: podłączenie FAQ ze strony WWW/FAQ do asystenta.
Wejście: źródło danych i zasady dostępu.
Kroki: podłącz źródło -> sprawdź uprawnienia -> odśwież indeks.
Rezultat: asystent korzysta z właściwych danych.
Zabezpieczenie: kontrola dostępu i wersjonowanie źródeł.

Scenariusz 3: Aktualizacja bazy wiedzy po publikacji dokumentu

Cel: aktualizacja bazy wiedzy po publikacji dokumentu.
Wejście: źródło danych i zasady dostępu.
Kroki: podłącz źródło -> sprawdź uprawnienia -> odśwież indeks.
Rezultat: asystent korzysta z właściwych danych.
Zabezpieczenie: kontrola dostępu i wersjonowanie źródeł.

Ryzyka i jak je ograniczać

Ryzyko 1: Wycieki

Ryzyko: Wycieki.
Jak ograniczać: IAM + DLP + ograniczenia zakresu.

Ryzyko 2: Data poisoning

Ryzyko: Data poisoning.
Jak ograniczać: zatwierdzanie źródeł.

Ryzyko 3: Nieaktualność

Ryzyko: Nieaktualność.
Jak ograniczać: harmonogram odświeżania + monitoring.

Checklista

Czy konektor ma minimalne uprawnienia?
Czy są filtry po typie i dacie?
Czy źródła są zatwierdzone?
Czy logujesz pobrania?
Czy jest proces aktualizacji i rollback?

Dalsza lektura

Miejsce w mapie

Konektory → zasilają: RAG
Konektory → narażone na: Data poisoning
Konektory → kontroluje: SSO/IAM

Co to w zasadzie jest?

Dzięki konektorom AI nie musi mieć wszystkiego „wklejonego ręcznie”.
Ważne: konektor musi respektować uprawnienia (kto co widzi).
Konektor to częsty punkt ryzyka — trzeba go kontrolować.

Typowe błędy i pułapki

Konektor pobiera „za dużo” (brak filtrów).
Brak wersjonowania i przeglądu zmian.

Diagram

Diagram pokazuje, że konektor łączy system AI ze źródłami danych i dostarcza treści do dalszego użycia.

Powiązane hasła

RAG
SSO / IAM
DLP
Audit trail
Baza wektorowa

Kwantyzacja (Quantization)

Kategoria: Wdrożenia i operacje (LLMOps) Tagi: kwantyzacja model lokalny optymalizacja inferencja koszty

Definicja

Kwantyzacja to technika optymalizacji modelu polegająca na zmniejszeniu precyzji zapisu jego parametrów, na przykład z 16-bit do 8-bit albo 4-bit, aby ograniczyć zużycie pamięci i zasobów.

Po co w praktyce

Scenariusz 1: Uruchomienie modelu na laptopie

Cel: uruchomić model lokalny bez drogiego serwera GPU.
Wejście: model bazowy i dostępny sprzęt.
Kroki: wybór formatu -> kwantyzacja -> test jakości.
Rezultat: model działa na tańszym sprzęcie.
Zabezpieczenie: porównanie jakości przed i po zmianie.

Scenariusz 2: Obniżenie kosztu wdrożenia

Cel: zmniejszyć koszt utrzymania modelu w produkcji.
Wejście: obecna architektura, koszt zasobów i metryki jakości.
Kroki: test wersji skwantyzowanej -> pomiar kosztu -> decyzja wdrożeniowa.
Rezultat: niższy koszt działania systemu.
Zabezpieczenie: benchmark i monitoring jakości.

Scenariusz 3: Wdrożenie modelu na urządzeniu brzegowym

Cel: uruchomić model bliżej użytkownika albo danych.
Wejście: ograniczone zasoby urządzenia i model do wdrożenia.
Kroki: dobór wariantu -> kwantyzacja -> test wydajności.
Rezultat: model działa w środowisku o małej mocy obliczeniowej.
Zabezpieczenie: testy błędów i testy wydajności.

Ryzyka i jak je ograniczać

Ryzyko 1: Spadek jakości odpowiedzi

Ryzyko: spadek jakości odpowiedzi.
Jak ograniczać: testuj model na realnych scenariuszach.

Ryzyko 2: Nieprzewidywalne zachowanie

Ryzyko: nieprzewidywalne zachowanie.
Jak ograniczać: porównuj wyniki z wersją bazową.

Ryzyko 3: Problemy kompatybilności

Ryzyko: problemy kompatybilności.
Jak ograniczać: dobieraj format do konkretnego środowiska wdrożenia.

Ryzyko 4: Fałszywa oszczędność

Ryzyko: fałszywa oszczędność.
Jak ograniczać: licz koszt razem z ryzykiem błędów jakościowych.

Checklista

Czy wiesz, jaki jest cel kwantyzacji?
Czy masz wersję bazową do porównania?
Czy wykonano benchmark jakości?
Czy środowisko obsługuje wybrany format?
Czy spadek jakości jest akceptowalny?

Miejsce w mapie

Kwantyzacja (Quantization) → wspiera: Model lokalny

Kwantyzacja (Quantization) → wspiera: Zarządzanie kosztami AI

Kwantyzacja (Quantization) → wymaga: Ewaluacja

Co to w zasadzie jest?

To sposób „odchudzenia” modelu. Model dalej wykonuje to samo zadanie, ale potrzebuje mniej pamięci i słabszego sprzętu.

W praktyce kwantyzacja pomaga:

uruchamiać modele lokalnie,
obniżać koszt inferencji,
skracać czas odpowiedzi,
zmniejszać wymagania infrastrukturalne.

Czasem jednak dzieje się to kosztem części jakości.

Typowe błędy i pułapki

Zakładanie, że każda kwantyzacja daje taki sam efekt.
Brak testów jakości po zmianie formatu.
Zbyt agresywne obniżenie precyzji.
Mylenie kwantyzacji z fine-tuningiem.

Diagram

Diagram pokazuje, że kwantyzacja zmniejsza rozmiar modelu i koszt działania, ale wymaga sprawdzenia jakości po zmianie.

Powiązane hasła

Model lokalny

Inferencja (inference)

Zarządzanie kosztami AI

Benchmark

Monitoring jakości

---

Latency (opóźnienie odpowiedzi)

Kategoria: Wdrożenia i operacje (LLMOps) Tagi: llmops wdrozenia operacje latency

Definicja

Latency to czas od wysłania pytania do otrzymania odpowiedzi (lub pierwszego sensownego fragmentu odpowiedzi).

Po co w praktyce

Scenariusz 1: Chat

Cel: 1–2 sekundy jest „komfortowe”, 10 sekund często frustruje.
Wejście: żądanie użytkownika i pomiar czasu.
Kroki: zmierz czas -> znajdź wąskie gardło -> uprość proces.
Rezultat: krótsze oczekiwanie na odpowiedź.
Zabezpieczenie: monitoring i limity czasu.

Scenariusz 2: RAG

Cel: długi retrieval + reranking = dłuższa odpowiedź, ale lepsza jakość.
Wejście: żądanie użytkownika i pomiar czasu.
Kroki: zmierz czas -> znajdź wąskie gardło -> uprość proces.
Rezultat: krótsze oczekiwanie na odpowiedź.
Zabezpieczenie: monitoring i limity czasu.

Scenariusz 3: Agent

Cel: kilka kroków narzędzi = rośnie latency, ale „robi więcej”.
Wejście: żądanie użytkownika i pomiar czasu.
Kroki: zmierz czas -> znajdź wąskie gardło -> uprość proces.
Rezultat: krótsze oczekiwanie na odpowiedź.
Zabezpieczenie: monitoring i limity czasu.

Ryzyka i jak je ograniczać

Ryzyko 1: Użytkownik porzuca proces

Ryzyko: użytkownik porzuca proces.
Jak ograniczać: streaming odpowiedzi + krótkie komunikaty „co się dzieje”.

Ryzyko 2: Próby przyspieszenia obniżą jakość

Ryzyko: próby przyspieszenia obniżą jakość.
Jak ograniczać: profilowanie i testy; przyspieszaj to, co nie zmienia jakości (cache, top-k).

Ryzyko 3: Przeciążenie

Ryzyko: przeciążenie.
Jak ograniczać: rate limiting, skalowanie, priorytety.

Dalsza lektura

NIST — niezawodność i ryzyko systemów (nist.gov)

Miejsce w mapie

Token / Okno kontekstowe → dłuższe wejście = często wolniej.
RAG / Retrieval / Reranking → etapy zwiększają latency.
Caching → zmniejsza latency.
Monitoring jakości → obserwacja czasu odpowiedzi.
Mini-przepływ: Wejście → przetwarzanie → odpowiedź (czas)

Co to w zasadzie jest?

Użytkownik czuje „czy to działa szybko?”. To właśnie latency. W AI opóźnienie rośnie m.in. gdy:

prompt jest bardzo długi,
retrieval pobiera dużo fragmentów,
agent wykonuje wiele narzędzi,
system jest obciążony.

Diagram

Diagram pokazuje, z jakich etapów bierze się czas odpowiedzi systemu.

LLM

Kategoria: Modele i dane Tagi: modele dane ai llm

Definicja

LLM (Large Language Model, czyli duży model językowy) to model uczony na dużych zbiorach tekstu, który przewiduje i generuje kolejne fragmenty tekstu. LLM działa na wzorcach językowych i statystyce, a nie na „wiedzy” w ludzkim sensie. To pojęcie o modelu, a nie o konkretnej aplikacji czy produkcie.

Po co w praktyce

Scenariusz 1: Szybkie streszczenie raportu

Cel: szybkie streszczenie raportu.
Wejście: raport PDF.
Kroki: wklej treść → poproś o 5 punktów → sprawdź kluczowe liczby.
Rezultat: zwięzłe podsumowanie.
Zabezpieczenie: weryfikacja przez osobę merytoryczną.

Scenariusz 2: Szkic odpowiedzi do klienta

Cel: szkic odpowiedzi do klienta.
Wejście: zapytanie + polityka firmy.
Kroki: polecenie → odpowiedź → korekta tonu.
Rezultat: gotowy szkic.
Zabezpieczenie: kontrola zgodności z polityką.

Scenariusz 3: Opis produktu na WWW

Cel: opis produktu na WWW.
Wejście: specyfikacja + USP.
Kroki: prompt → wersja języka prostego → redakcja.
Rezultat: czytelny opis.
Zabezpieczenie: review brandowy.

Ryzyka i jak je ograniczać

Ryzyko 1: Halucynacje

Ryzyko: Halucynacje.
Jak ograniczać: weryfikacja faktów i źródeł.

Ryzyko 2: Dane osobowe

Ryzyko: Dane osobowe.
Jak ograniczać: anonimizacja i polityki RODO.

Ryzyko 3: Stronniczość

Ryzyko: Stronniczość.
Jak ograniczać: testy na różnych przykładach.

Ryzyko 4: Prompt injection

Ryzyko: Prompt injection.
Jak ograniczać: filtracja wejść i guardrails.

Ryzyko 5: Vendor lock-in

Ryzyko: Vendor lock-in.
Jak ograniczać: plan migracji i standardy danych.

Checklista

Czy masz aktualne źródła do weryfikacji?
Czy usunąłeś dane wrażliwe?
Czy wynik przejdzie review człowieka?
Czy wiesz, gdzie LLM może się mylić?
Czy logujesz zapytania i wersje?

Dalsza lektura

Miejsce w mapie

LLM → używa: Token
LLM → ograniczany przez: Okno kontekstowe
LLM → wspierany przez: RAG

Co to w zasadzie jest?

To „silnik do pracy z tekstem”, który dopisuje kolejne słowa na podstawie kontekstu.
Nie sprawdza faktów sam z siebie, dlatego może popełniać błędy.
Działa w ramach okna kontekstowego, więc widzi tylko część rozmowy lub dokumentu.
Dobre polecenie i źródła znacząco poprawiają jakość odpowiedzi.
W firmie LLM jest wsparciem, a nie samodzielnym decydentem.

Typowe błędy i pułapki

Traktowanie LLM jak wyszukiwarki faktów.
Zbyt ogólne polecenia bez kontekstu.
Publikacja treści bez weryfikacji.

Diagram

Diagram pokazuje podstawowy mechanizm działania dużego modelu językowego.

Powiązane hasła

Token
Okno kontekstowe
RAG
Prompt
NLP

LLM Firewall

Kategoria: Bezpieczeństwo Tagi: llm firewall bezpieczeństwo guardrails prompt injection dlp

Definicja

LLM Firewall to dodatkowa warstwa ochronna umieszczona przed modelem i za modelem, która filtruje wejścia i wyjścia w celu wykrywania zagrożeń, takich jak prompt injection, wyciek danych wrażliwych albo naruszenie polityki.

Po co w praktyce

Scenariusz 1: Ochrona przed prompt injection

Cel: zablokować próby wymuszenia niepożądanego działania modelu.
Wejście: prompt użytkownika i reguły bezpieczeństwa.
Kroki: analiza wejścia -> wykrycie ryzyka -> blokada albo oznaczenie.
Rezultat: mniejsze ryzyko wykonania szkodliwego polecenia.
Zabezpieczenie: aktualizowane reguły i testy red teaming.

Scenariusz 2: Ochrona odpowiedzi przed wyciekiem danych

Cel: nie dopuścić do ujawnienia danych osobowych albo poufnych.
Wejście: odpowiedź modelu i polityka danych.
Kroki: analiza wyjścia -> wykrycie wrażliwej treści -> ukrycie albo blokada.
Rezultat: bezpieczniejsza odpowiedź dla użytkownika.
Zabezpieczenie: integracja z DLP i logowanie incydentów.

Scenariusz 3: Kontrola zgodności z polityką treści

Cel: pilnować, by bot nie łamał zasad organizacji.
Wejście: pytanie użytkownika, odpowiedź modelu i reguły polityki.
Kroki: analiza wejścia i wyjścia -> porównanie z polityką -> decyzja o publikacji.
Rezultat: mniejsze ryzyko odpowiedzi niedozwolonej albo szkodliwej.
Zabezpieczenie: przegląd reguł i monitoring jakości.

Ryzyka i jak je ograniczać

Ryzyko 1: Fałszywe poczucie bezpieczeństwa

Ryzyko: fałszywe poczucie bezpieczeństwa.
Jak ograniczać: łącz firewall z guardrails, DLP i review.

Ryzyko 2: Fałszywe alarmy

Ryzyko: fałszywe alarmy.
Jak ograniczać: testuj reguły na rzeczywistych scenariuszach.

Ryzyko 3: Pominięcie nowych typów ataków

Ryzyko: pominięcie nowych typów ataków.
Jak ograniczać: aktualizuj zasady i prowadź red teaming.

Ryzyko 4: Brak śladu incydentów

Ryzyko: brak śladu incydentów.
Jak ograniczać: loguj blokady i decyzje filtrów.

Checklista

Czy filtrujesz wejście i wyjście modelu?
Czy reguły obejmują prompt injection i dane wrażliwe?
Czy incydenty są logowane?
Czy prowadzisz testy red teaming?
Czy polityka treści jest powiązana z filtrowaniem?

Miejsce w mapie

LLM Firewall → wspiera: Guardrails (barierki bezpieczeństwa)

LLM Firewall → wspiera: DLP

LLM Firewall → ogranicza ryzyko: Prompt injection

Co to w zasadzie jest?

To nie jest jeden konkretny produkt. To raczej sposób zabezpieczania aplikacji opartej na modelu językowym.

LLM Firewall może:

analizować prompty wejściowe,
blokować niebezpieczne żądania,
filtrować odpowiedzi modelu,
wykrywać dane wrażliwe,
ograniczać skutki ataków i błędów konfiguracji.

Typowe błędy i pułapki

Traktowanie LLM Firewall jako rozwiązania wszystkich problemów.
Brak testów na realnych atakach.
Ograniczenie ochrony tylko do wejścia albo tylko do wyjścia.
Brak połączenia z polityką danych i bezpieczeństwa.

Diagram

Diagram pokazuje, że LLM Firewall działa jako warstwa ochronna przed modelem i po modelu.

Powiązane hasła

Guardrails (barierki bezpieczeństwa)

Prompt injection

Prompt leakage (wyciek instrukcji)

Security review (przegląd bezpieczeństwa)

LLMOps

Kategoria: Wdrożenia i operacje (LLMOps) Tagi: llmops wdrozenia operacje

Definicja

LLMOps to praktyki operacyjne do wdrażania, monitorowania i utrzymania systemów opartych na LLM w produkcji.

Po co w praktyce

Scenariusz 1: Kontrolowany rollout nowej wersji promptu

Cel: kontrolowany rollout nowej wersji promptu.
Wejście: wersja A i B.
Kroki: testy -> canary -> rollout.
Rezultat: mniejsze ryzyko regresji.
Zabezpieczenie: rollback.

Scenariusz 2: Centralny rejestr zmian

Cel: centralny rejestr zmian.
Wejście: zmiany modelu i ustawień.
Kroki: commit -> review -> deploy.
Rezultat: historia zmian.
Zabezpieczenie: audit trail.

Scenariusz 3: Ciągła ocena jakości

Cel: ciągła ocena jakości.
Wejście: logi i metryki.
Kroki: monitoring -> alert -> poprawka.
Rezultat: stabilna usługa.
Zabezpieczenie: SLA i owner procesu.

Ryzyka i jak je ograniczać

Ryzyko 1: Regresja jakości

Ryzyko: Regresja jakości.
Jak ograniczać: testy i benchmarki.

Ryzyko 2: Dryf procesu

Ryzyko: Dryf procesu.
Jak ograniczać: monitoring i alerty.

Ryzyko 3: Brak rozliczalności

Ryzyko: Brak rozliczalności.
Jak ograniczać: audit trail i review.

Checklista

Czy zmiany mają wersje i opis?
Czy wykonano testy automatyczne i ręczne?
Czy jest plan rollbacku?
Czy metryki są monitorowane?
Czy jest właściciel procesu?

Dalsza lektura

Miejsce w mapie

LLMOps -> wspiera: Ewaluacja (evaluation)
LLMOps -> wspiera: Monitoring jakości
LLMOps -> wspiera: Audit trail

Co to w zasadzie jest?

To odpowiednik DevOps/MLOps dla aplikacji z LLM.
Obejmuje wersjonowanie promptów, testy, monitoring i rollback.
Celem jest stabilność, bezpieczeństwo i powtarzalność.

Typowe błędy i pułapki

Brak wersjonowania promptów.
Brak testów przed wdrożeniem.
Brak planu rollbacku.

Diagram

Diagram pokazuje operacyjny cykl utrzymania systemu opartego na LLM.

Powiązane hasła

Ewaluacja (evaluation)
Monitoring jakości
Audit trail
Benchmark
Orkiestracja (workflow)

Lokalizacja danych (Data Residency)

Kategoria: Prawo i etyka Tagi: data residency dane chmura zgodność prywatność

Definicja

Lokalizacja danych to wymóg albo zasada określająca, w jakim kraju lub regionie geograficznym dane mają być przechowywane i przetwarzane.

Po co w praktyce

Scenariusz 1: Wybór dostawcy chmury AI

Cel: wybrać dostawcę zgodnego z polityką danych organizacji.
Wejście: oferta dostawcy, regiony przetwarzania i warunki usługi.
Kroki: analiza lokalizacji -> ocena zgodności -> decyzja zakupowa.
Rezultat: wiadomo, gdzie będą trafiały dane.
Zabezpieczenie: zapis umowny o regionie i sposobie przetwarzania.

Scenariusz 2: Praca na danych klientów

Cel: nie dopuścić do transferu danych poza dopuszczony obszar.
Wejście: typ danych, system AI i architektura usługi.
Kroki: identyfikacja danych -> sprawdzenie ścieżki przetwarzania -> kontrola konfiguracji.
Rezultat: mniejsze ryzyko naruszenia zasad ochrony danych.
Zabezpieczenie: DPIA i przegląd bezpieczeństwa.

Scenariusz 3: Audyt usług AI w organizacji

Cel: sprawdzić, które systemy wysyłają dane poza wymagany region.
Wejście: lista usług, dostawców i konfiguracji regionów.
Kroki: przegląd środowiska -> porównanie z polityką -> plan naprawczy.
Rezultat: organizacja wie, gdzie ma luki zgodności.
Zabezpieczenie: rejestr usług i okresowe przeglądy.

Ryzyka i jak je ograniczać

Ryzyko 1: Naruszenie zasad ochrony danych

Ryzyko: naruszenie zasad ochrony danych.
Jak ograniczać: sprawdzaj pełną ścieżkę przetwarzania.

Ryzyko 2: Brak zgodności audytowej

Ryzyko: brak zgodności audytowej.
Jak ograniczać: dokumentuj lokalizację danych i decyzje.

Ryzyko 3: Zależność od dostawcy

Ryzyko: zależność od dostawcy.
Jak ograniczać: analizuj warunki migracji i vendor lock-in.

Ryzyko 4: Błędna konfiguracja regionu

Ryzyko: błędna konfiguracja regionu.
Jak ograniczać: stosuj checklisty wdrożeniowe i przeglądy.

Checklista

Czy wiadomo, gdzie dane są przechowywane?
Czy wiadomo, gdzie dane są przetwarzane?
Czy backupy i logi też są w tym samym regionie?
Czy dostawca potwierdza to umownie?
Czy wykonano ocenę prawną i bezpieczeństwa?

Miejsce w mapie

Lokalizacja danych (Data Residency) → wymaga: RODO / DPIA

Lokalizacja danych (Data Residency) → powiązane z: Tenant

Lokalizacja danych (Data Residency) → zwiększa wagę: Vendor lock-in

Co to w zasadzie jest?

To odpowiedź na pytanie: gdzie fizycznie albo organizacyjnie znajdują się dane i gdzie są obsługiwane. W praktyce chodzi nie tylko o główną lokalizację systemu, ale też o backupy, replikację, logi i usługi pomocnicze.

To ważne, gdy organizacja:

ma wymagania prawne,
pracuje na danych wrażliwych,
wybiera dostawcę chmury,
musi wykazać zgodność audytową.

Typowe błędy i pułapki

Skupienie się tylko na lokalizacji serwera głównego.
Brak sprawdzenia backupów i logów.
Założenie, że „region UE” rozwiązuje wszystko.
Niesprawdzenie warunków dostawcy po zmianie usługi.

Diagram

Diagram pokazuje, że lokalizacja danych musi być ustalona i sprawdzona przed użyciem usługi AI.

Powiązane hasła

RODO / DPIA

Tenant

Vendor lock-in

Dane osobowe (PII)

Security review (przegląd bezpieczeństwa)

---

LRM

Kategoria: Modele i dane Tagi: modele dane ai lrm

Definicja

LRM (Large Reasoning Model) to model ukierunkowany na rozumowanie krok po kroku i rozwiązywanie złożonych zadań. W praktyce jest to wariant modelu językowego, który lepiej radzi sobie z zadaniami logicznymi. Nie jest to osobna aplikacja, tylko typ modelu.

Po co w praktyce

Scenariusz 1: Plan wdrożenia automatyzacji

Cel: plan wdrożenia automatyzacji.
Wejście: opis procesu.
Kroki: rozbicie na kroki → weryfikacja → poprawki.
Rezultat: plan działań.
Zabezpieczenie: review właściciela procesu.

Scenariusz 2: Analiza ryzyk projektu

Cel: analiza ryzyk projektu.
Wejście: opis projektu.
Kroki: lista ryzyk → priorytety → mitygacje.
Rezultat: matryca ryzyk.
Zabezpieczenie: konsultacja eksperta.

Scenariusz 3: Przygotowanie procedury krok po kroku

Cel: przygotowanie procedury krok po kroku.
Wejście: wymagania biznesowe.
Kroki: generacja kroków → dopasowanie → testy.
Rezultat: procedura.
Zabezpieczenie: test na realnym przypadku.

Ryzyka i jak je ograniczać

Ryzyko 1: Błędne wnioskowanie

Ryzyko: Błędne wnioskowanie.
Jak ograniczać: testy i recenzja eksperta.

Ryzyko 2: Zbytnie uproszczenia

Ryzyko: Zbytnie uproszczenia.
Jak ograniczać: wymagaj wariantów i założeń.

Ryzyko 3: Halucynacje

Ryzyko: Halucynacje.
Jak ograniczać: proś o źródła i ogranicz zakres.

Checklista

Czy zadanie wymaga wieloetapowego rozumowania?
Czy dane wejściowe są kompletne?
Czy wynik będzie sprawdzony przez człowieka?
Czy znasz ograniczenia modelu?
Czy masz alternatywny plan działania?

Dalsza lektura

Miejsce w mapie

LRM → jest wariantem: LLM
LRM → wspiera: Ewaluacja
LRM → wymaga: Prompt

Co to w zasadzie jest?

LRM „myśli dłużej”, aby dojść do wyniku.
Sprawdza się w zadaniach z wieloma krokami i zależnościami.
Nadal może się mylić, dlatego wymaga weryfikacji.
Używa się go tam, gdzie liczy się poprawne rozumowanie.

Typowe błędy i pułapki

Zbyt duże zaufanie do „logiki” modelu.
Brak jasnych danych wejściowych.
Pomijanie weryfikacji kroków.

Diagram

Diagram pokazuje model nastawiony na wieloetapowe rozumowanie i składanie odpowiedzi z kroków.

Powiązane hasła

LLM
Prompt
Ewaluacja
Okno kontekstowe
Benchmark

Minimalizacja danych

Kategoria: Prawo i etyka Tagi: prawo etyka zgodność data minimization

Definicja

Minimalizacja danych to zasada: zbieraj, przetwarzaj i przechowuj tylko tyle danych, ile naprawdę potrzebujesz do celu.

Po co w praktyce

Scenariusz 1: Zamiast pełnych danych osobowych używaj identyfikatorów (ID) i pobieraj szczegóły dopiero, gdy konieczne

Cel: zamiast pełnych danych osobowych używaj identyfikatorów (ID) i pobieraj szczegóły dopiero, gdy konieczne.
Wejście: proces i zakres danych.
Kroki: usuń zbędne pola -> zostaw minimum -> sprawdź cel.
Rezultat: mniejsze ryzyko prywatnościowe.
Zabezpieczenie: przegląd DPIA i DLP.

Scenariusz 2: Maskuj PII w promptach

Cel: „Jan K.” zamiast „Jan Kowalski”.
Wejście: proces i zakres danych.
Kroki: usuń zbędne pola -> zostaw minimum -> sprawdź cel.
Rezultat: mniejsze ryzyko prywatnościowe.
Zabezpieczenie: przegląd DPIA i DLP.

Scenariusz 3: W logach zapisuj tylko skrót (hash) albo metadane, nie pełną treść

Cel: w logach zapisuj tylko skrót (hash) albo metadane, nie pełną treść.
Wejście: proces i zakres danych.
Kroki: usuń zbędne pola -> zostaw minimum -> sprawdź cel.
Rezultat: mniejsze ryzyko prywatnościowe.
Zabezpieczenie: przegląd DPIA i DLP.

Ryzyka i jak je ograniczać

Ryzyko 1: Za mocne cięcie danych pogorszy jakość

Ryzyko: za mocne cięcie danych pogorszy jakość.
Jak ograniczać: testy jakości i stopniowe minimalizowanie.

Ryzyko 2: Ludzie „wrzucają wszystko” do promptu z przyzwyczajenia

Ryzyko: ludzie „wrzucają wszystko” do promptu z przyzwyczajenia.
Jak ograniczać: szkolenie, checklisty, guardrails, automatyczne wykrywanie PII.

Ryzyko 3: Dane zostają w cache/logach

Ryzyko: dane zostają w cache/logach.
Jak ograniczać: retencja, czyszczenie, kontrola dostępu.

Dalsza lektura

EUR-Lex — ogólne zasady ochrony danych (eur-lex.europa.eu)

Miejsce w mapie

PII / RODO/DPIA → kontekst prywatności.
DLP → wykrywanie i blokowanie wycieków.
Caching → minimalizacja dotyczy też cache.
Audit trail → loguj mądrze, bez nadmiaru treści.
Mini-przepływ: Cel → minimalny zestaw danych → przetwarzanie → retencja

Co to w zasadzie jest?

Jeśli do odpowiedzi wystarczy „miejscowość”, nie podawaj „pełnego adresu”. Jeśli wystarczy „rola”, nie podawaj „PESEL”. W AI to kluczowe, bo:

dane trafiają do promptów, logów, cache,
narzędzia mogą je przenosić między systemami,
każda nadmiarowa informacja zwiększa ryzyko wycieku.

Minimalizacja działa jak „odchudzanie” danych: mniej = bezpieczniej i często taniej.

Diagram

Diagram pokazuje, że najpierw określa się cel, a potem używa tylko minimum danych potrzebnych do jego realizacji.

Model collapse (zapaść modelu)

Kategoria: Modele i dane Tagi: modele dane ai model collapse

Definicja

Model collapse to zjawisko, w którym jakość modeli generatywnych pogarsza się, gdy uczą się coraz bardziej na treściach generowanych przez inne modele (a nie na wiarygodnych danych „z rzeczywistości”).

Po co w praktyce

Scenariusz 1: W sieci przybywa tekstów AI, a modele uczą się na tych tekstach → spadek jakości języka i faktów

Cel: w sieci przybywa tekstów AI, a modele uczą się na tych tekstach → spadek jakości języka i faktów.
Wejście: dane treningowe i źródła syntetyczne.
Kroki: oznacz dane AI -> kontroluj jakość -> mieszaj ze źródłami referencyjnymi.
Rezultat: mniejsze ryzyko degradacji modelu.
Zabezpieczenie: provenance i audyt danych.

Scenariusz 2: Automatyczne generowanie opisów produktów i ponowne trenowanie na nich

Cel: automatyczne generowanie opisów produktów i ponowne trenowanie na nich.
Wejście: dane treningowe i źródła syntetyczne.
Kroki: oznacz dane AI -> kontroluj jakość -> mieszaj ze źródłami referencyjnymi.
Rezultat: mniejsze ryzyko degradacji modelu.
Zabezpieczenie: provenance i audyt danych.

Scenariusz 3: Bazy wiedzy zalewane treściami bez weryfikacji

Cel: bazy wiedzy zalewane treściami bez weryfikacji.
Wejście: dane treningowe i źródła syntetyczne.
Kroki: oznacz dane AI -> kontroluj jakość -> mieszaj ze źródłami referencyjnymi.
Rezultat: mniejsze ryzyko degradacji modelu.
Zabezpieczenie: provenance i audyt danych.

Ryzyka i jak je ograniczać

Ryzyko 1: Obniżenie jakości i zaufania do treści

Ryzyko: obniżenie jakości i zaufania do treści.
Jak ograniczać: dbałość o źródła, oznaczanie treści AI, weryfikacja i selekcja danych.

Ryzyko 2: Wzmacnianie halucynacji i błędów

Ryzyko: wzmacnianie halucynacji i błędów.
Jak ograniczać: fact-checking, grounding, testy jakości.

Ryzyko 3: Trudność w rozróżnieniu, co jest „prawdziwe”

Ryzyko: trudność w rozróżnieniu, co jest „prawdziwe”.
Jak ograniczać: transparentność, polityka źródeł, watermarking.

Dalsza lektura

NIST — podejście do jakości i ryzyka AI (nist.gov)

Miejsce w mapie

Data poisoning → „śmieciowe” dane też psują modele.
Fact-checking / Grounding → utrzymanie odpowiedzi w faktach.
Transparentność → oznaczanie treści i źródeł.
Dalsza lektura → polityka jakości danych i źródeł.
Mini-przepływ: Treści AI w danych → trening → spadek jakości → więcej treści AI…

Co to w zasadzie jest?

Jeśli AI karmi się AI, może zacząć „kręcić się w kółko”. Z czasem:

rośnie powtarzalność,
pojawia się więcej błędów,
znika różnorodność,
model robi się mniej „przydatny” i bardziej „średni”.

To trochę jak wielokrotne kopiowanie tego samego dokumentu — każda kolejna kopia bywa gorsza.

Diagram

Diagram pokazuje pętlę, w której model uczy się coraz bardziej na treściach AI i przez to stopniowo traci jakość.

Model Context Protocol (MCP)

Kategoria: Wdrożenia i operacje (LLMOps) Tagi: mcp protokół konektory narzędzia integracje

Definicja

Model Context Protocol (MCP) to otwarty protokół, który pozwala w ujednolicony sposób łączyć aplikacje AI z zewnętrznymi źródłami danych, narzędziami i usługami.

Po co w praktyce

Scenariusz 1: Połączenie z bazą danych

Cel: dać aplikacji AI dostęp do danych firmowych w kontrolowany sposób.
Wejście: źródło danych, uprawnienia i opis zapytań.
Kroki: konfiguracja połączenia -> udostępnienie narzędzia -> test działania.
Rezultat: model może pobierać potrzebne dane bez ręcznego kopiowania.
Zabezpieczenie: ograniczone uprawnienia i logowanie działań.

Scenariusz 2: Dostęp do systemu plików lub repozytorium

Cel: umożliwić agentowi czytanie dokumentów i plików.
Wejście: katalogi, reguły dostępu i zakres działania.
Kroki: podłączenie zasobu -> nadanie uprawnień -> test odczytu.
Rezultat: AI może korzystać z aktualnych plików jako kontekstu.
Zabezpieczenie: sandboxing i whitelist zasobów.

Scenariusz 3: Ujednolicenie integracji w organizacji

Cel: nie budować każdej integracji od zera.
Wejście: zestaw narzędzi i systemów używanych przez AI.
Kroki: wybór protokołu -> standaryzacja połączeń -> wdrożenie w aplikacji.
Rezultat: prostsza architektura i łatwiejsze utrzymanie integracji.
Zabezpieczenie: przegląd bezpieczeństwa i wersjonowanie połączeń.

Ryzyka i jak je ograniczać

Ryzyko 1: Nadmierny dostęp do danych

Ryzyko: nadmierny dostęp do danych.
Jak ograniczać: stosuj minimalne uprawnienia.

Ryzyko 2: Nieprzewidywalne działanie narzędzi

Ryzyko: nieprzewidywalne działanie narzędzi.
Jak ograniczać: testuj integracje na konkretnych scenariuszach.

Ryzyko 3: Ryzyko bezpieczeństwa

Ryzyko: ryzyko bezpieczeństwa.
Jak ograniczać: prowadź security review i sandboxing.

Ryzyko 4: Chaos integracyjny

Ryzyko: chaos integracyjny.
Jak ograniczać: opisuj połączenia i wersjonuj konfigurację.

Checklista

Czy wiadomo, do jakich zasobów AI ma dostęp?
Czy uprawnienia są ograniczone do minimum?
Czy działania są logowane?
Czy integracja była testowana na realnych zadaniach?
Czy masz plan wyłączenia połączenia w razie incydentu?

Dalsza lektura

Model Context Protocol — oficjalna dokumentacja

Miejsce w mapie

Model Context Protocol (MCP) → wspiera: Konektory danych

Model Context Protocol (MCP) → wspiera: Tool calling (wywoływanie narzędzi)

Model Context Protocol (MCP) → wymaga: Security review (przegląd bezpieczeństwa)

Co to w zasadzie jest?

To wspólny „język połączeń” między aplikacją AI a światem zewnętrznym. Zamiast budować osobne integracje dla każdego narzędzia, można korzystać z jednego podejścia do komunikacji.

MCP pomaga wtedy, gdy model albo agent ma:

czytać dane z systemów,
uruchamiać narzędzia,
pobierać kontekst z różnych źródeł,
działać w bardziej przewidywalny sposób.

Typowe błędy i pułapki

Traktowanie MCP jako gotowego produktu zamiast protokołu.
Zbyt szerokie uprawnienia dla narzędzi.
Brak kontroli nad tym, do czego AI ma dostęp.
Brak logowania działań integracyjnych.

Diagram

Diagram pokazuje, że MCP pośredniczy między aplikacją AI a zewnętrznymi danymi i narzędziami.

Powiązane hasła

Konektory danych

Tool calling (wywoływanie narzędzi)

Function calling (wywoływanie funkcji)

Security review (przegląd bezpieczeństwa)

---

Model lokalny

Kategoria: Modele i dane Tagi: llmops wdrozenia operacje model lokalny modele dane ai

Definicja

Model lokalny to model AI uruchamiany na infrastrukturze organizacji lub firmazeniu użytkownika, bez wysyłania danych do zewnętrznej chmury. Daje większą kontrolę nad danymi, ale wymaga zasobów sprzętowych i utrzymania. To wybór architektury wdrożenia.

Po co w praktyce

Scenariusz 1: Analiza wrażliwych dokumentów

Cel: analiza wrażliwych dokumentów.
Wejście: dokumenty wewnętrzne.
Kroki: uruchom model lokalnie → analiza → review.
Rezultat: streszczenie.
Zabezpieczenie: polityki dostępu.

Scenariusz 2: Praca offline w terenie

Cel: praca offline w terenie.
Wejście: zestaw formularzy.
Kroki: lokalny model → podsumowanie → zapis.
Rezultat: notatki.
Zabezpieczenie: szyfrowanie firmazeń.

Scenariusz 3: Ograniczenie kosztów chmury

Cel: ograniczenie kosztów chmury.
Wejście: powtarzalne zadania.
Kroki: migracja → testy → monitorowanie.
Rezultat: stabilne koszty.
Zabezpieczenie: plan aktualizacji.

Ryzyka i jak je ograniczać

Ryzyko 1: Bezpieczeństwo firmazeń

Ryzyko: Bezpieczeństwo firmazeń.
Jak ograniczać: polityki IT i aktualizacje.

Ryzyko 2: Spadek jakości względem chmury

Ryzyko: Spadek jakości względem chmury.
Jak ograniczać: testy porównawcze.

Ryzyko 3: Brak wsparcia

Ryzyko: Brak wsparcia.
Jak ograniczać: plan utrzymania i SLA.

Checklista

Czy masz odpowiedni sprzęt?
Czy dane są naprawdę wrażliwe?
Czy masz plan aktualizacji modelu?
Czy firmazenia są zabezpieczone?
Czy znasz koszty utrzymania?

Dalsza lektura

Miejsce w mapie

Model lokalny → alternatywa dla: Tenant
Model lokalny → wymaga: Polityka AI
Model lokalny → wpływa na: DLP

Co to w zasadzie jest?

Model działa „na miejscu”, więc dane nie opuszczają organizacji.
Zwykle wymaga mocniejszego sprzętu i administrowania.
Może działać offline lub w sieci wewnętrznej.
W praktyce to kompromis między kontrolą a kosztami.

Typowe błędy i pułapki

Niedoszacowanie kosztów sprzętu i utrzymania.
Brak aktualizacji modelu.
Brak procedur bezpieczeństwa firmazeń.

Diagram

Diagram pokazuje, że model lokalny działa na infrastrukturze organizacji, co daje większą kontrolę nad danymi, ale wymaga utrzymania.

Powiązane hasła

Tenant
Stack
DLP
PII / dane osobowe
Polityka AI

Model multimodalny

Kategoria: Modele i dane Tagi: modele dane ai model multimodalny

Definicja

Model multimodalny to model AI, który przetwarza więcej niż jeden typ danych, np. tekst i obraz. Potrafi łączyć informacje z różnych formatów w jednej odpowiedzi. To rodzina modeli, a nie pojedyncza aplikacja.

Po co w praktyce

Scenariusz 1: Opis zdjęć produktowych

Cel: opis zdjęć produktowych.
Wejście: zdjęcia + specyfikacja.
Kroki: analiza obrazu → opis → redakcja.
Rezultat: spójne opisy.
Zabezpieczenie: kontrola brandowa.

Scenariusz 2: Analiza skanów dokumentów

Cel: analiza skanów dokumentów.
Wejście: skan PDF.
Kroki: odczyt → streszczenie → weryfikacja.
Rezultat: krótkie podsumowanie.
Zabezpieczenie: kontrola poprawności.

Scenariusz 3: Weryfikacja materiałów marketingowych

Cel: weryfikacja materiałów marketingowych.
Wejście: grafika i tekst.
Kroki: analiza → lista uwag → poprawki.
Rezultat: spójność komunikacji.
Zabezpieczenie: review kreatywny.

Ryzyka i jak je ograniczać

Ryzyko 1: Błędne rozpoznanie

Ryzyko: Błędne rozpoznanie.
Jak ograniczać: testy na przykładach.

Ryzyko 2: Dane wrażliwe na obrazach

Ryzyko: Dane wrażliwe na obrazach.
Jak ograniczać: anonimizacja.

Ryzyko 3: Deepfake

Ryzyko: Deepfake.
Jak ograniczać: procedury oznaczania treści.

Checklista

Czy obrazy nie zawierają danych wrażliwych?
Czy wynik jest zweryfikowany przez człowieka?
Czy masz procedurę oznaczania treści?
Czy testowano model na realnych przykładach?
Czy logujesz użycie i wyniki?

Dalsza lektura

ISO/IEC 22989:2022 Artificial intelligence — Concepts and terminology

Miejsce w mapie

Model multimodalny → rozszerza: GenAI
Model multimodalny → zwiększa ryzyko: Deepfake
Model multimodalny → wymaga: Fact-checking

Co to w zasadzie jest?

Taki model „widzi” obrazy i czyta tekst naraz.
Może opisywać zdjęcia, analizować skany i tworzyć treści.
Jest przydatny tam, gdzie dane nie są tylko tekstem.
Wymaga kontroli jakości, bo może się mylić w rozpoznawaniu.

Typowe błędy i pułapki

Zbyt duże zaufanie do rozpoznawania obrazu.
Brak weryfikacji tekstu generowanego na podstawie obrazu.
Pomijanie danych wrażliwych w obrazach.

Diagram

Diagram pokazuje, że model multimodalny łączy różne typy danych w jednej odpowiedzi.

Powiązane hasła

GenAI
Deepfake
Fact-checking
Transparentność
Dostępność treści AI

Model zapasowy (Fallback model)

Kategoria: Wdrożenia i operacje (LLMOps) Tagi: fallback niezawodność model operacje dostępność

Definicja

Model zapasowy to drugi model albo tryb działania uruchamiany wtedy, gdy główny model nie działa, jest zbyt drogi, za wolny albo nie spełnia warunków jakości.

Po co w praktyce

Scenariusz 1: Awaria głównego dostawcy

Cel: utrzymać działanie usługi mimo problemu po stronie dostawcy.
Wejście: niedostępność API albo przekroczony timeout.
Kroki: wykrycie awarii -> przełączenie na model zapasowy -> zwrot odpowiedzi.
Rezultat: usługa działa dalej, choć w ograniczonym trybie.
Zabezpieczenie: testy przełączenia i monitoring awarii.

Scenariusz 2: Zbyt wysoki koszt zapytania

Cel: ograniczyć koszt przy prostych zadaniach.
Wejście: typ zapytania, koszt prognozowany i polityka routingu.
Kroki: ocena złożoności -> wybór tańszego modelu -> wykonanie zadania.
Rezultat: niższy koszt bez utraty działania systemu.
Zabezpieczenie: benchmark jakości dla klas zadań.

Scenariusz 3: Brak pewności odpowiedzi

Cel: nie wysyłać słabej odpowiedzi z głównego modelu.
Wejście: wynik głównego modelu i reguły jakości.
Kroki: ocena jakości -> odrzucenie wyniku -> przejście do trybu bezpiecznego.
Rezultat: użytkownik dostaje odpowiedź bardziej przewidywalną albo informację o ograniczeniu.
Zabezpieczenie: progi jakości i logika eskalacji.

Ryzyka i jak je ograniczać

Ryzyko 1: Ukryty spadek jakości

Ryzyko: ukryty spadek jakości.
Jak ograniczać: mierz różnicę między trybami działania.

Ryzyko 2: Chaos operacyjny

Ryzyko: chaos operacyjny.
Jak ograniczać: jasno opisz warunki przełączenia.

Ryzyko 3: Brak przewidywalności

Ryzyko: brak przewidywalności.
Jak ograniczać: stosuj routing i progi jakości.

Ryzyko 4: Niezauważone awarie

Ryzyko: niezauważone awarie.
Jak ograniczać: monitoruj przełączenia i alerty.

Checklista

Czy wiadomo, kiedy uruchamia się fallback?
Czy model zapasowy był testowany?
Czy użytkownik wie, że działa tryb ograniczony?
Czy przełączenia są logowane?
Czy masz plan powrotu do trybu głównego?

Miejsce w mapie

Model zapasowy (Fallback model) → wspiera: Prompt routing (kierowanie zapytań)

Model zapasowy (Fallback model) → wspiera: Timeout (limit czasu)

Model zapasowy (Fallback model) → wymaga: Monitoring jakości

Co to w zasadzie jest?

To plan awaryjny dla aplikacji AI. Zamiast całkowitego błędu system może przełączyć się na prostszy model, odpowiedź szablonową albo bezpieczniejszy tryb działania.

Fallback pomaga wtedy, gdy:

usługa główna ma awarię,
odpowiedź trwa za długo,
koszt jednego zapytania jest za wysoki,
model nie daje wystarczającej jakości.

Typowe błędy i pułapki

Brak testów fallbacku w praktyce.
Zapasowy model bez znanego poziomu jakości.
Przełączanie bez logowania decyzji.
Założenie, że model zapasowy „jakoś sobie poradzi”.

Diagram

Diagram pokazuje, że fallback uruchamia się wtedy, gdy główny model nie spełnia warunków działania albo jakości.

Powiązane hasła

Prompt routing (kierowanie zapytań)

Timeout (limit czasu)

Latency (opóźnienie odpowiedzi)

Monitoring jakości

Zarządzanie kosztami AI

---

Monitoring jakości

Kategoria: Jakość i ewaluacja Tagi: jakosc ewaluacja metryki monitoring jakosci

Definicja

Monitoring jakości to ciągłe sprawdzanie, czy odpowiedzi AI są poprawne, bezpieczne i zgodne z wymaganiami procesu.

Po co w praktyce

Scenariusz 1: Stabilność odpowiedzi supportu

Cel: stabilność odpowiedzi supportu.
Wejście: logi rozmów.
Kroki: metryki -> alerty -> poprawki.
Rezultat: mniej błędów.
Zabezpieczenie: próg alarmowy i eskalacja.

Scenariusz 2: Kontrola zgodności treści

Cel: kontrola zgodności treści.
Wejście: odpowiedzi do publikacji.
Kroki: sampling -> review -> korekta.
Rezultat: spójność i jakość.
Zabezpieczenie: approval workflow.

Scenariusz 3: Kontrola regresji po wdrożeniu

Cel: kontrola regresji po wdrożeniu.
Wejście: nowa wersja promptu/modelu.
Kroki: porównanie wyników -> raport -> decyzja.
Rezultat: bezpieczny rollout.
Zabezpieczenie: testy A/B.

Ryzyka i jak je ograniczać

Ryzyko 1: Niewidoczna regresja

Ryzyko: Niewidoczna regresja.
Jak ograniczać: automatyczne alerty.

Ryzyko 2: Brak odpowiedzialności

Ryzyko: Brak odpowiedzialności.
Jak ograniczać: role i właściciel metryk.

Ryzyko 3: Brak audytu

Ryzyko: Brak audytu.
Jak ograniczać: audit trail i historia zmian.

Checklista

Czy metryki są zdefiniowane?
Czy są progi alarmowe?
Czy jest harmonogram przeglądu?
Czy logi są kompletne?
Czy jest proces eskalacji?

Dalsza lektura

Miejsce w mapie

Monitoring jakości -> wspiera: Ewaluacja (evaluation)
Monitoring jakości -> wspiera: Benchmark
Monitoring jakości -> wspiera: AB testy

Co to w zasadzie jest?

To regularny pomiar jakości, nie jednorazowy test.
Obejmuje metryki, alerty i przeglądy próbek.
Pomaga szybko wykrywać regresje po zmianach.

Typowe błędy i pułapki

Brak stałego zestawu metryk.
Brak alertów i reakcji.
Brak dokumentacji zmian.

Diagram

Diagram pokazuje ciągły cykl monitorowania jakości, a nie jednorazowy test.

Powiązane hasła

Ewaluacja (evaluation)
Benchmark
AB testy
Fact-checking (weryfikacja faktów)
Audit trail

Nadmierne zaufanie (Overreliance)

Kategoria: Prawo i etyka Tagi: overreliance ryzyko człowiek w pętli halucynacje weryfikacja

Definicja

Nadmierne zaufanie to sytuacja, w której użytkownik zbyt łatwo ufa odpowiedziom AI i przestaje je sprawdzać, mimo że system może się mylić, halucynować albo pomijać ważny kontekst.

Po co w praktyce

Scenariusz 1: Wysłanie raportu bez sprawdzenia

Cel: szybko przygotować dokument do wysyłki.
Wejście: dane liczbowe, szkic raportu i prompt do AI.
Kroki: generowanie treści -> brak weryfikacji -> wysyłka.
Rezultat: oszczędność czasu, ale ryzyko błędu merytorycznego.
Zabezpieczenie: obowiązkowy przegląd przez człowieka.

Scenariusz 2: Odpowiedź do klienta na podstawie halucynacji

Cel: szybciej obsługiwać pytania klientów.
Wejście: pytanie klienta i odpowiedź wygenerowana przez AI.
Kroki: wygenerowanie odpowiedzi -> akceptacja bez sprawdzenia -> wysyłka.
Rezultat: możliwa dezinformacja albo obietnica bez pokrycia.
Zabezpieczenie: cytowanie źródeł i checklista weryfikacyjna.

Scenariusz 3: Użycie AI w decyzjach wewnętrznych

Cel: przyspieszyć analizę albo rekomendację.
Wejście: dane wejściowe i sugestia modelu.
Kroki: analiza przez AI -> przyjęcie rekomendacji -> działanie.
Rezultat: szybsza decyzja, ale ryzyko błędnego wniosku.
Zabezpieczenie: human-in-the-loop i ocena niepewności.

Ryzyka i jak je ograniczać

Ryzyko 1: Błędne decyzje

Ryzyko: błędne decyzje.
Jak ograniczać: wymagaj weryfikacji w kluczowych procesach.

Ryzyko 2: Utrata jakości pracy

Ryzyko: utrata jakości pracy.
Jak ograniczać: ucz użytkowników ograniczeń modelu.

Ryzyko 3: Powielanie halucynacji

Ryzyko: powielanie halucynacji.
Jak ograniczać: stosuj fact-checking i cytowanie źródeł.

Ryzyko 4: Rozmycie odpowiedzialności

Ryzyko: rozmycie odpowiedzialności.
Jak ograniczać: jasno określ, kto zatwierdza wynik.

Checklista

Czy wynik został sprawdzony przez człowieka?
Czy są źródła albo dane potwierdzające odpowiedź?
Czy zadanie ma wysokie ryzyko błędu?
Czy użytkownik zna ograniczenia narzędzia?
Czy wiadomo, kto odpowiada za końcową decyzję?

Miejsce w mapie

Nadmierne zaufanie (Overreliance) → wymaga: Human-in-the-loop (człowiek w pętli)

Nadmierne zaufanie (Overreliance) → zwiększa wagę: Fact-checking (weryfikacja faktów)

Nadmierne zaufanie (Overreliance) → powiązane z: Halucynacje

Co to w zasadzie jest?

To błąd po stronie człowieka, nie tylko modelu. AI brzmi pewnie i przekonująco, więc użytkownik może zacząć traktować wynik jak gotową prawdę.

Problem pojawia się wtedy, gdy:

odpowiedź nie jest weryfikowana,
nikt nie sprawdza źródeł,
AI trafia do procesów o dużych skutkach,
użytkownik nie rozumie ograniczeń systemu.

Typowe błędy i pułapki

Traktowanie AI jak źródła prawdy.
Brak kontroli nad ważnymi odpowiedziami.
Mylenie płynnego stylu z poprawnością.
Zakładanie, że jeśli odpowiedź brzmi dobrze, to jest dobra.

Diagram

Diagram pokazuje, że ten sam wynik AI może prowadzić do błędu albo do bezpieczniejszej decyzji, zależnie od tego, czy został sprawdzony.

Powiązane hasła

Human-in-the-loop (człowiek w pętli)

Halucynacje

Fact-checking (weryfikacja faktów)

Monitoring jakości

Transparentność

---

Niepewność odpowiedzi (Uncertainty)

Kategoria: Jakość i ewaluacja Tagi: niepewność jakość weryfikacja ryzyko odpowiedzi

Definicja

Niepewność odpowiedzi to informacja, że model albo system nie ma wystarczającej podstawy, aby dać pewną odpowiedź, albo że wynik wymaga dodatkowej weryfikacji.

Po co w praktyce

Scenariusz 1: Asystent odpowiada na pytanie spoza bazy wiedzy

Cel: nie tworzyć pewnej, ale błędnej odpowiedzi.
Wejście: pytanie użytkownika i ograniczona baza źródeł.
Kroki: ocena pokrycia -> wykrycie braku danych -> odpowiedź z zastrzeżeniem.
Rezultat: użytkownik wie, że potrzebna jest weryfikacja.
Zabezpieczenie: wymóg cytowania źródeł albo odmowa odpowiedzi bez podstawy.

Scenariusz 2: Wsparcie decyzji operacyjnej

Cel: nie dopuścić do zbyt pewnej rekomendacji bez danych.
Wejście: dane wejściowe, pytanie i polityka procesu.
Kroki: analiza -> oznaczenie niepewności -> przekazanie do człowieka.
Rezultat: decyzja nie opiera się wyłącznie na pewnym tonie modelu.
Zabezpieczenie: human-in-the-loop.

Scenariusz 3: Generowanie odpowiedzi do klienta

Cel: unikać odpowiedzi, które brzmią wiarygodnie, ale nie mają podstaw.
Wejście: pytanie klienta i dane ze źródeł firmowych.
Kroki: wyszukiwanie źródeł -> ocena pokrycia -> odpowiedź albo eskalacja.
Rezultat: mniej halucynacji i mniej obietnic bez pokrycia.
Zabezpieczenie: grounding i checklista jakości.

Ryzyka i jak je ograniczać

Ryzyko 1: Halucynacje

Ryzyko: halucynacje.
Jak ograniczać: każ systemowi wskazywać brak podstaw i źródeł.

Ryzyko 2: Nadmierne zaufanie użytkownika

Ryzyko: nadmierne zaufanie użytkownika.
Jak ograniczać: pokazuj granice wiedzy modelu.

Ryzyko 3: Błędne decyzje

Ryzyko: błędne decyzje.
Jak ograniczać: eskaluj trudne przypadki do człowieka.

Ryzyko 4: Rozmyta odpowiedzialność

Ryzyko: rozmyta odpowiedzialność.
Jak ograniczać: wprowadź zasady, kiedy wynik nie może iść dalej bez weryfikacji.

Checklista

Czy system potrafi wskazać brak danych?
Czy odpowiedź ma źródła albo uzasadnienie?
Czy użytkownik widzi, kiedy wynik jest niepewny?
Czy są reguły eskalacji?
Czy mierzysz, kiedy model powinien odpowiedzieć „nie wiem”?

Miejsce w mapie

Niepewność odpowiedzi (Uncertainty) → ogranicza ryzyko: Halucynacje

Niepewność odpowiedzi (Uncertainty) → wspiera: Fact-checking (weryfikacja faktów)

Niepewność odpowiedzi (Uncertainty) → wymaga: Human-in-the-loop (człowiek w pętli)

Co to w zasadzie jest?

To ważny sygnał jakości. Model nie powinien zawsze brzmieć tak, jakby wszystko wiedział. W praktyce lepszy system potrafi pokazać, kiedy ma za mało danych, kiedy źródła są słabe albo kiedy pytanie jest niejasne.

Niepewność można pokazywać przez:

prośbę o doprecyzowanie,
wskazanie braków w danych,
podanie źródeł,
oznaczenie odpowiedzi jako wymagającej sprawdzenia.

Typowe błędy i pułapki

Ukrywanie niepewności za płynnym stylem.
Traktowanie każdej odpowiedzi jako równie wiarygodnej.
Brak reguł, kiedy system ma odmówić albo poprosić o doprecyzowanie.
Mylenie pewności językowej z poprawnością.

Diagram

Diagram pokazuje, że system powinien odróżniać odpowiedzi dobrze ugruntowane od tych, które wymagają sprawdzenia.

Powiązane hasła

Halucynacje

Fact-checking (weryfikacja faktów)

Grounding (ugruntowanie odpowiedzi)

Human-in-the-loop (człowiek w pętli)

Monitoring jakości

---

NLP

Kategoria: Modele i dane Tagi: modele dane ai nlp

Definicja

NLP (Natural Language Processing, czyli przetwarzanie języka naturalnego) to dziedzina, która uczy komputery pracy z językiem: analizą, rozumieniem i generowaniem tekstu lub mowy. Obejmuje zarówno klasyczne metody językoznawcze, jak i nowoczesne modele, w tym LLM. NLP to pojęcie o metodach i zadaniach, a nie o jednym konkretnym produkcie.

Po co w praktyce

Scenariusz 1: Kategoryzacja wiadomości klientów

Cel: kategoryzacja wiadomości klientów.
Wejście: skróty maili.
Kroki: klasyfikacja → weryfikacja próbki → korekta etykiet.
Rezultat: uporządkowana skrzynka.
Zabezpieczenie: kontrola jakości.

Scenariusz 2: Analiza opinii z ankiet

Cel: analiza opinii z ankiet.
Wejście: odpowiedzi otwarte.
Kroki: anonimizacja → grupowanie tematów → podsumowanie.
Rezultat: lista trendów.
Zabezpieczenie: dodatkowy przegląd ręczny.

Scenariusz 3: Wyszukiwanie w dokumentach firmowych

Cel: wyszukiwanie w dokumentach firmowych.
Wejście: baza regulaminów.
Kroki: indeks → zapytanie naturalne → źródła.
Rezultat: trafne fragmenty.
Zabezpieczenie: weryfikacja źródeł.

Ryzyka i jak je ograniczać

Ryzyko 1: Dane osobowe

Ryzyko: Dane osobowe.
Jak ograniczać: anonimizacja i polityki RODO.

Ryzyko 2: Stronniczość danych

Ryzyko: Stronniczość danych.
Jak ograniczać: testy na różnych zbiorach.

Ryzyko 3: Błędna klasyfikacja

Ryzyko: Błędna klasyfikacja.
Jak ograniczać: metryki jakości i poprawki.

Checklista

Czy dane są zanonimizowane?
Czy masz jasny cel analizy?
Czy wynik będzie sprawdzony przez człowieka?
Czy masz proces poprawy błędów?
Czy logujesz wersje danych i wyniki?

Dalsza lektura

Miejsce w mapie

NLP → obejmuje: LLM
NLP → wspiera: RAG
NLP → korzysta z: Token

Co to w zasadzie jest?

NLP to „narzędzia do języka”, które pomagają analizować i porządkować tekst.
Może wykrywać temat, intencję, sentyment, a także streszczać.
Działa dobrze, gdy dane są spójne i zadanie jest jasno zdefiniowane.
To nie zawsze wymaga LLM — czasem prostsze metody są lepsze.

Typowe błędy i pułapki

Mylenie NLP z pełną „inteligencją”.
Brak czyszczenia danych wejściowych.
Brak weryfikacji wyników.

Diagram

Diagram pokazuje, że NLP zamienia tekst w uporządkowany wynik, taki jak etykieta, streszczenie albo dopasowanie.

Powiązane hasła

LLM
RAG
Token
Prompt
Okno kontekstowe

Observability (obserwowalność)

Kategoria: Wdrożenia i operacje (LLMOps) Tagi: llmops wdrozenia operacje observability

Definicja

Observability to zdolność „zrozumienia, co się dzieje w systemie” na podstawie logów, metryk i śladów (traces) — tak, aby szybko wykrywać błędy i poprawiać działanie.

Po co w praktyce

Scenariusz 1: Widzisz, że jakość spadła — sprawdzasz, czy zmieniły się źródła RAG

Cel: widzisz, że jakość spadła — sprawdzasz, czy zmieniły się źródła RAG.
Wejście: logi, metryki, ślady i identyfikator żądania.
Kroki: zbierz sygnały -> porównaj wersje -> znajdź przyczynę.
Rezultat: szybsza diagnoza problemu.
Zabezpieczenie: maskowanie danych i kontrola dostępu do logów.

Scenariusz 2: Ktoś zgłasza błąd — odtwarzasz dokładny prompt i kontekst

Cel: ktoś zgłasza błąd — odtwarzasz dokładny prompt i kontekst.
Wejście: logi, metryki, ślady i identyfikator żądania.
Kroki: zbierz sygnały -> porównaj wersje -> znajdź przyczynę.
Rezultat: szybsza diagnoza problemu.
Zabezpieczenie: maskowanie danych i kontrola dostępu do logów.

Scenariusz 3: Analizujesz koszty — widzisz które zadania zjadają najwięcej tokenów

Cel: analizujesz koszty — widzisz które zadania zjadają najwięcej tokenów.
Wejście: logi, metryki, ślady i identyfikator żądania.
Kroki: zbierz sygnały -> porównaj wersje -> znajdź przyczynę.
Rezultat: szybsza diagnoza problemu.
Zabezpieczenie: maskowanie danych i kontrola dostępu do logów.

Ryzyka i jak je ograniczać

Ryzyko 1: Logi zawierają dane wrażliwe

Ryzyko: logi zawierają dane wrażliwe.
Jak ograniczać: maskowanie PII, minimalizacja, kontrola dostępu do logów.

Ryzyko 2: Za dużo danych i chaos

Ryzyko: za dużo danych i chaos.
Jak ograniczać: standard formatów, tagi, dashboardy, retencja.

Ryzyko 3: Brak spójności (nie da się porównać wersji)

Ryzyko: brak spójności (nie da się porównać wersji).
Jak ograniczać: wersjonowanie promptów i źródeł + identyfikatory żądań.

Dalsza lektura

NIST — zarządzanie ryzykiem i jakością (nist.gov)

Miejsce w mapie

LLMOps → observability to fundament operacji.
Audit trail → kto/co/kiedy.
Monitoring jakości → metryki jakości.
DLP / PII → bezpieczeństwo logów.
Mini-przepływ: Metryki + logi + ślady → diagnoza → poprawka

Co to w zasadzie jest?

Monitoring to „czy działa”. Observability to „dlaczego działa / dlaczego nie działa”. W systemach AI jest to ważne, bo odpowiedź zależy od wielu elementów:

promptów,
retrieval i źródeł,
narzędzi,
ustawień modelu,
wersji treści.

Bez obserwowalności trudno odtworzyć: „czemu AI powiedziała X?”

Diagram

Diagram pokazuje, że obserwowalność łączy metryki, logi i ślady, aby zrozumieć działanie systemu.

Okno kontekstowe

Kategoria: Modele i dane Tagi: modele dane ai okno kontekstowe

Definicja

Okno kontekstowe to maksymalna ilość tekstu, którą model może uwzględnić w jednej odpowiedzi. Obejmuje polecenie, historię rozmowy i treści źródłowe. Jest to techniczne ograniczenie modelu.

Po co w praktyce

Scenariusz 1: Analiza długiego raportu

Cel: analiza długiego raportu.
Wejście: raport PDF.
Kroki: podział na części → analiza → synteza.
Rezultat: spójne podsumowanie.
Zabezpieczenie: kontrola kompletności.

Scenariusz 2: Obsługa rozmowy z klientem

Cel: obsługa rozmowy z klientem.
Wejście: historia czatu.
Kroki: streszczenie → kontynuacja → weryfikacja.
Rezultat: spójny dialog.
Zabezpieczenie: zapis kluczowych ustaleń.

Scenariusz 3: RAG z wieloma źródłami

Cel: RAG z wieloma źródłami.
Wejście: wiele dokumentów.
Kroki: selekcja fragmentów → odpowiedź → cytaty.
Rezultat: zwięzła odpowiedź.
Zabezpieczenie: ograniczenie liczby fragmentów.

Ryzyka i jak je ograniczać

Ryzyko 1: Ucięte informacje

Ryzyko: Ucięte informacje.
Jak ograniczać: podział i streszczenia.

Ryzyko 2: Wysokie koszty

Ryzyko: Wysokie koszty.
Jak ograniczać: kontrola długości odpowiedzi.

Ryzyko 3: Niespójność

Ryzyko: Niespójność.
Jak ograniczać: przypominanie kluczowych punktów.

Checklista

Czy znasz limit kontekstu modelu?
Czy dokumenty są podzielone na fragmenty?
Czy masz streszczenia kluczowych punktów?
Czy odpowiedź zawiera najważniejsze informacje?
Czy kontrolujesz długość odpowiedzi?

Dalsza lektura

ISO/IEC 22989:2022 Artificial intelligence — Concepts and terminology

Miejsce w mapie

Okno kontekstowe → zależy od: Token
Okno kontekstowe → ogranicza: RAG
Okno kontekstowe → wpływa na: Prompt

Co to w zasadzie jest?

Model „pamięta” tylko tyle, ile zmieści się w oknie.
Długi kontekst oznacza wyższe koszty i ryzyko pominięć.
Gdy limit jest przekroczony, część treści wypada.
Dlatego trzeba dzielić dokumenty i streszczać.

Typowe błędy i pułapki

Wklejanie całych dokumentów bez selekcji.
Zbyt długie prompty systemowe.
Brak streszczeń między turami.

Diagram

Diagram pokazuje, że ograniczenie kontekstu wymusza selekcję treści przed wysłaniem jej do modelu.

Powiązane hasła

Token
RAG
Prompt
LLM
Chunking

Orkiestracja (workflow)

Kategoria: Wdrożenia i operacje (LLMOps) Tagi: llmops wdrozenia operacje orkiestracja

Definicja

Orkiestracja to układanie procesu z kroków: pobierz dane → przygotuj → wygeneruj → sprawdź → opublikuj.

Po co w praktyce

Scenariusz 1: Zgłoszenie → kategoria → odpowiedź → akceptacja → wysyłka

Cel: zgłoszenie → kategoria → odpowiedź → akceptacja → wysyłka.
Wejście: zadanie, kroki procesu i systemy pomocnicze.
Kroki: ustal kolejność -> wykonaj kroki -> zapisz wynik.
Rezultat: proces przechodzi przez przewidywalny przepływ.
Zabezpieczenie: logowanie i punkt akceptacji.

Scenariusz 2: Dokument → streszczenie → kontrola → publikacja na WWW

Cel: dokument → streszczenie → kontrola → publikacja na WWW.
Wejście: zadanie, kroki procesu i systemy pomocnicze.
Kroki: ustal kolejność -> wykonaj kroki -> zapisz wynik.
Rezultat: proces przechodzi przez przewidywalny przepływ.
Zabezpieczenie: logowanie i punkt akceptacji.

Scenariusz 3: Zapytanie → RAG → cytaty → odpowiedź → log

Cel: zapytanie → RAG → cytaty → odpowiedź → log.
Wejście: zadanie, kroki procesu i systemy pomocnicze.
Kroki: ustal kolejność -> wykonaj kroki -> zapisz wynik.
Rezultat: proces przechodzi przez przewidywalny przepływ.
Zabezpieczenie: logowanie i punkt akceptacji.

Ryzyka i jak je ograniczać

Ryzyko 1: Błędy masowe

Ryzyko: Błędy masowe.
Jak ograniczać: bramki jakości, testy.

Ryzyko 2: Wycieki

Ryzyko: Wycieki.
Jak ograniczać: DLP i anonimizacja.

Ryzyko 3: Chaos

Ryzyko: Chaos.
Jak ograniczać: wersjonowanie workflow.

Checklista

Czy jest etap review?
Czy każdy krok ma log?
Czy dane wejściowe są bez PII?
Czy masz fallback (gdy model nie wie)?
Czy masz monitoring?

Dalsza lektura

Miejsce w mapie

Orkiestracja → łączy: API
Orkiestracja → zawiera: Human-in-the-loop
Orkiestracja → wymaga: Audit trail

Co to w zasadzie jest?

To „przepis” na automatyzację pracy z AI.
Każdy krok można kontrolować i logować.
Dzięki temu AI działa powtarzalnie, a nie losowo.

Typowe błędy i pułapki

Brak etapu akceptacji.
Brak logów.

Diagram

Diagram pokazuje proces złożony z kontrolowanych kroków od danych do publikacji.

Powiązane hasła

API
LLMOps
Monitoring jakości
Human-in-the-loop
RAG

Polityka treści

Kategoria: Prawo i etyka Tagi:

Definicja

Polityka treści to zestaw zasad określających, jakie treści system AI może tworzyć, a jakich nie powinien. Dotyczy to na przykład mowy nienawiści, szkodliwych instrukcji i danych osobowych.

Po co w praktyce

Scenariusz 1: Chatbot nie podaje danych osobowych i prosi o anonimizację

Cel: chatbot nie podaje danych osobowych i prosi o anonimizację.
Wejście: treść do wygenerowania i zasady organizacji.
Kroki: sprawdź politykę -> wygeneruj treść -> oceń zgodność.
Rezultat: treść zgodna z zasadami.
Zabezpieczenie: review i lista zakazów.

Scenariusz 2: Asystent odmawia tworzenia deepfake w celu oszustwa

Cel: asystent odmawia tworzenia deepfake w celu oszustwa.
Wejście: treść do wygenerowania i zasady organizacji.
Kroki: sprawdź politykę -> wygeneruj treść -> oceń zgodność.
Rezultat: treść zgodna z zasadami.
Zabezpieczenie: review i lista zakazów.

Scenariusz 3: Narzędzie do publikacji ma checklistę

Cel: „czy to jest zgodne z zasadami?”.
Wejście: treść do wygenerowania i zasady organizacji.
Kroki: sprawdź politykę -> wygeneruj treść -> oceń zgodność.
Rezultat: treść zgodna z zasadami.
Zabezpieczenie: review i lista zakazów.

Ryzyka i jak je ograniczać

Ryzyko 1: Zasady są niejasne i różnie interpretowane

Ryzyko: zasady są niejasne i różnie interpretowane.
Jak ograniczać: proste przykłady „dozwolone vs niedozwolone”.

Ryzyko 2: Nadmierne blokady (utrudniają użycie)

Ryzyko: nadmierne blokady (utrudniają użycie).
Jak ograniczać: jasne wyjątki i ścieżka odwołania/eskalacji.

Ryzyko 3: Polityka istnieje, ale nikt jej nie stosuje

Ryzyko: polityka istnieje, ale nikt jej nie stosuje.
Jak ograniczać: szkolenia, automatyczne zabezpieczenia i monitoring incydentów.

Dalsza lektura

EUR-Lex — regulacje dot. AI i odpowiedzialności (eur-lex.europa.eu)

Miejsce w mapie

Guardrails → techniczne wdrożenie polityki.
Instrukcja systemowa → miejsce na zasady zapisane dla modelu.
Red teaming → testowanie, czy zasady działają.
DLP / PII → prywatność w polityce treści.
Mini-przepływ: Zasady → wdrożenie → testy → reakcje na naruszenia

Co to w zasadzie jest?

To „regulamin” dla AI: co jest OK, a co jest niebezpieczne albo nielegalne. Polityka treści często obejmuje:

zakazane tematy (np. przemoc, pornografia dziecięca),
ograniczenia (np. medycyna/prawo — ostrożność),
zasady prywatności,
wymaganie cytowania/oznaczania.

W praktyce polityka treści przekłada się na:

instrukcję systemową,
filtry,
procedury reagowania,
szkolenie użytkowników.

Diagram

Diagram pokazuje, że polityka treści działa dopiero wtedy, gdy zasady są wdrożone jako filtry i kontrola odpowiedzi.

Polityka użycia AI w organizacji

Kategoria: Organizacja i zarządzanie Tagi: organizacja zarzadzanie procesy polityka ai

Definicja

Polityka użycia AI to zestaw zasad, które określają: kto, do czego, jakim narzędziem i na jakich danych może używać AI.

Po co w praktyce

Scenariusz 1: Zasady

Cel: zasady: co wolno wrzucać do promptów, a czego nie.
Wejście: proces, narzędzie i zasady organizacji.
Kroki: sprawdź zgodność -> wybierz narzędzie -> zapisz decyzję.
Rezultat: użycie AI zgodne z zasadami organizacji.
Zabezpieczenie: zatwierdzona lista narzędzi i okresowy przegląd.

Scenariusz 2: Lista zatwierdzonych narzędzi i kont

Cel: lista zatwierdzonych narzędzi i kont.
Wejście: proces, narzędzie i zasady organizacji.
Kroki: sprawdź zgodność -> wybierz narzędzie -> zapisz decyzję.
Rezultat: użycie AI zgodne z zasadami organizacji.
Zabezpieczenie: zatwierdzona lista narzędzi i okresowy przegląd.

Scenariusz 3: Proces akceptacji treści do publikacji

Cel: proces akceptacji treści do publikacji.
Wejście: proces, narzędzie i zasady organizacji.
Kroki: sprawdź zgodność -> wybierz narzędzie -> zapisz decyzję.
Rezultat: użycie AI zgodne z zasadami organizacji.
Zabezpieczenie: zatwierdzona lista narzędzi i okresowy przegląd.

Ryzyka i jak je ograniczać

Ryzyko 1: Wycieki danych

Ryzyko: Wycieki danych.
Jak ograniczać: PII + DLP + IAM.

Ryzyko 2: Błędy merytoryczne

Ryzyko: Błędy merytoryczne.
Jak ograniczać: human-in-the-loop + fact-checking.

Ryzyko 3: Niespójna komunikacja

Ryzyko: Niespójna komunikacja.
Jak ograniczać: szablony i standardy.

Checklista

Czy mam narzędzie zatwierdzone?
Czy dane są bezpieczne (bez PII)?
Czy odpowiedź ma źródła?
Czy treść publiczna ma akceptację?
Czy wynik jest zapisany w śladzie audytowym?

Dalsza lektura

Miejsce w mapie

Polityka AI → wymaga: Human-in-the-loop
Polityka AI → wspiera: DLP
Polityka AI → wspiera: Audit trail

Co to w zasadzie jest?

To instrukcja bezpieczeństwa i jakości, nie „zakaz”.
Pomaga uniknąć chaosu: każdy używa inaczej, na innych danych.
Wspiera zgodność z RODO, bezpieczeństwem i standardem komunikacji.

Typowe błędy i pułapki

Polityka bez wdrożenia (brak szkoleń i kontroli).
Zbyt ogólne zapisy („używać odpowiedzialnie”).

Diagram

Diagram pokazuje, że polityka AI porządkuje użycie narzędzi, danych i akceptacji wyniku.

Powiązane hasła

Human-in-the-loop
PII
DLP
Audit trail
Transparentność

Ponowienia z przerwą

Kategoria: Wdrożenia i operacje (LLMOps) Tagi:

Definicja

Retry to ponowienie żądania po błędzie. Backoff to plan tych ponowień. Każda kolejna próba następuje po dłuższej przerwie.

Po co w praktyce

Scenariusz 1: Wywołanie narzędzia przez API

Cel: przy błędzie 503 ponów próbę z przerwą.
Wejście: błąd chwilowy albo limit API.
Kroki: odczekaj -> ponów próbę -> przerwij po limicie.
Rezultat: większa odporność na krótkie awarie.
Zabezpieczenie: maksymalna liczba prób i logowanie.

Scenariusz 2: Pobieranie źródła

Cel: ponów próbę, jeśli minął limit czasu.
Wejście: błąd chwilowy albo limit API.
Kroki: odczekaj -> ponów próbę -> przerwij po limicie.
Rezultat: większa odporność na krótkie awarie.
Zabezpieczenie: maksymalna liczba prób i logowanie.

Scenariusz 3: Agent

Cel: jeśli narzędzie nie działa, spróbuj raz, a potem poproś o decyzję człowieka.
Wejście: błąd chwilowy albo limit API.
Kroki: odczekaj -> ponów próbę -> przerwij po limicie.
Rezultat: większa odporność na krótkie awarie.
Zabezpieczenie: maksymalna liczba prób i logowanie.

Ryzyka i jak je ograniczać

Ryzyko 1: Pętle ponowień i koszty

Ryzyko: pętle ponowień i koszty.
Jak ograniczać: limit ponowień, limit czasu i limity zapytań.

Ryzyko 2: Tworzenie duplikatów przy ponowieniu

Ryzyko: tworzenie duplikatów przy ponowieniu.
Jak ograniczać: stosuj Idempotencję.

Ryzyko 3: Ukrywanie problemów („jakoś działa”)

Ryzyko: ukrywanie problemów („jakoś działa”).
Jak ograniczać: logi, alerty i monitoring.

Miejsce w mapie

API → retry/backoff to praktyka przy API.
Timeout → retry nie ma sensu bez timeoutów.
Idempotencja → bezpieczne ponawianie.
Observability → widoczność błędów i ponowień.
Mini-przepływ: Błąd → czekaj → ponów → sukces / eskalacja

Co to w zasadzie jest?

Gdy coś chwilowo nie działa, warto spróbować jeszcze raz. Nie warto jednak wysyłać wielu prób naraz, bo to może przeciążyć system. Backoff mówi: spróbuj ponownie, ale z przerwą. Na przykład po 1, 2 i 4 sekundach. To ważne w AI, bo narzędzia i API czasem mają krótkie przerwy lub limity.

Diagram

Diagram pokazuje, że po błędzie system ponawia operację z przerwą, zamiast obciążać usługę natychmiastowymi próbami.

Prompt

Kategoria: Prompting Tagi: prompting prompty ai prompt

Definicja

Prompt to polecenie i kontekst, które przekazujemy modelowi, aby uzyskać określoną odpowiedź. To podstawowy sposób sterowania działaniem modeli językowych i generatywnych. Prompt nie jest programem, ale ma duży wpływ na jakość wyniku.

Po co w praktyce

Scenariusz 1: Szkic posta marketingowego

Cel: szkic posta marketingowego.
Wejście: brief i ton marki.
Kroki: prompt → warianty → wybór.
Rezultat: 3 szkice do oceny.
Zabezpieczenie: kontrola brandowa.

Scenariusz 2: Streszczenie dokumentu

Cel: streszczenie dokumentu.
Wejście: raport.
Kroki: polecenie → streszczenie → weryfikacja faktów.
Rezultat: krótki opis.
Zabezpieczenie: sprawdzenie liczb i dat.

Scenariusz 3: Automatyzacja odpowiedzi w support

Cel: automatyzacja odpowiedzi w support.
Wejście: treść zgłoszenia + polityka.
Kroki: prompt → szkic → korekta.
Rezultat: gotowa odpowiedź.
Zabezpieczenie: zgodność z polityką.

Ryzyka i jak je ograniczać

Ryzyko 1: Błędy merytoryczne

Ryzyko: Błędy merytoryczne.
Jak ograniczać: podawaj źródła i kryteria.

Ryzyko 2: Dane osobowe

Ryzyko: Dane osobowe.
Jak ograniczać: anonimizacja i zasady RODO.

Ryzyko 3: Prompt injection

Ryzyko: Prompt injection.
Jak ograniczać: oddzielaj dane od instrukcji.

Checklista

Czy polecenie jest konkretne i mierzalne?
Czy określiłeś format odpowiedzi?
Czy usunąłeś dane wrażliwe?
Czy przewidziałeś weryfikację wyniku?
Czy logujesz prompty w procesach produkcyjnych?

Dalsza lektura

OWASP LLM Top 10

Miejsce w mapie

Prompt → steruje: LLM
Prompt → wspiera: RAG
Prompt → narażony na: Prompt injection

Co to w zasadzie jest?

To instrukcja „co, dla kogo i w jakim formacie”.
Im bardziej konkretne polecenie, tym lepsza odpowiedź.
Prompt może zawierać dane, zasady i przykład wyniku.
Dobry prompt ogranicza ryzyko błędów i nieporozumień.

Typowe błędy i pułapki

Zbyt ogólne polecenie.
Brak formatu odpowiedzi.
Wrzucanie danych wrażliwych do promptu.

Diagram

Diagram pokazuje, że jakość odpowiedzi zależy od tego, jak zbudowany jest prompt i czy wynik został sprawdzony.

Powiązane hasła

Prompt systemowy
Prompt injection
LLM
RAG
Guardrails

Prompt chaining (łańcuchowanie promptów)

Kategoria: Prompting Tagi: prompting prompty ai prompt chaining

Definicja

Prompt chaining to technika, w której jedno zadanie dzieli się na kilka krótszych promptów (kroków), a wynik jednego kroku staje się wejściem do następnego.

Po co w praktyce

Scenariusz 1: Tekst

Cel: „Zrób plan → napisz szkic → uprość język → sprawdź fakty.”.
Wejście: zadanie złożone z kilku etapów.
Kroki: podziel zadanie -> wykonaj kroki -> scal wynik.
Rezultat: bardziej kontrolowany proces.
Zabezpieczenie: walidacja między krokami.

Scenariusz 2: RAG

Cel: „Zdefiniuj pytanie → wybierz źródła → streszcz → odpowiedz.”.
Wejście: zadanie złożone z kilku etapów.
Kroki: podziel zadanie -> wykonaj kroki -> scal wynik.
Rezultat: bardziej kontrolowany proces.
Zabezpieczenie: walidacja między krokami.

Scenariusz 3: Bezpieczeństwo

Cel: „Wypisz ryzyka → zaproponuj zabezpieczenia → ułóż checklistę.”.
Wejście: zadanie złożone z kilku etapów.
Kroki: podziel zadanie -> wykonaj kroki -> scal wynik.
Rezultat: bardziej kontrolowany proces.
Zabezpieczenie: walidacja między krokami.

Ryzyka i jak je ograniczać

Ryzyko 1: Utrata kontekstu między krokami

Ryzyko: utrata kontekstu między krokami.
Jak ograniczać: krótkie podsumowania po każdym kroku + jasny format przekazywania wyniku.

Ryzyko 2: „nadpisanie” celu (kroki rozjeżdżają się)

Ryzyko: „nadpisanie” celu (kroki rozjeżdżają się).
Jak ograniczać: stałe kryteria jakości i przypominanie celu w każdym kroku.

Ryzyko 3: Koszt rośnie (więcej kroków = więcej tokenów)

Ryzyko: koszt rośnie (więcej kroków = więcej tokenów).
Jak ograniczać: minimalizuj tekst w przejściach, używaj bulletów, tnij zbędne fragmenty.

Dalsza lektura

NIST — dobre praktyki zarządzania ryzykiem (nist.gov)

Miejsce w mapie

Prompt → chaining to sposób używania promptów.
Prompt systemowy → może trzymać stałe zasady w tle.
Okno kontekstowe → ogranicza, ile „zmieści się” w procesie.
Ewaluacja → łatwiej ocenić jakość krok po kroku.
Mini-przepływ: Krok 1 → wynik → Krok 2 → wynik → Krok 3 → final

Co to w zasadzie jest?

Zamiast prosić AI o „wszystko naraz”, prowadzisz ją etapami. To działa podobnie jak praca z człowiekiem: 1) najpierw zbieramy informacje, 2) potem robimy szkic, 3) na końcu dopracowujemy styl i poprawność.

Efekt: mniej chaosu, lepsza kontrola jakości, łatwiej znaleźć miejsce, gdzie coś się psuje.

Diagram

Diagram pokazuje, że złożone zadanie można rozłożyć na kilka krótkich promptów połączonych w sekwencję.

Prompt format (format promptu)

Kategoria: Prompting Tagi: prompting prompty ai prompt format

Definicja

Prompt format to sposób, w jaki zapisujesz polecenie do AI — struktura, nagłówki, listy, role, wymagania, ograniczenia i format wyjścia.

Po co w praktyce

Scenariusz 1: „Zwróć odpowiedź w 5 punktach + lista ryzyk.”

Cel: „Zwróć odpowiedź w 5 punktach + lista ryzyk.”.
Wejście: zadanie i wymagany format odpowiedzi.
Kroki: opisz format -> wygeneruj wynik -> sprawdź zgodność.
Rezultat: bardziej przewidywalna odpowiedź.
Zabezpieczenie: walidacja struktury.

Scenariusz 2: „Użyj prostego języka, unikaj żargonu, podaj 3 przykłady.”

Cel: „Użyj prostego języka, unikaj żargonu, podaj 3 przykłady.”.
Wejście: zadanie i wymagany format odpowiedzi.
Kroki: opisz format -> wygeneruj wynik -> sprawdź zgodność.
Rezultat: bardziej przewidywalna odpowiedź.
Zabezpieczenie: walidacja struktury.

Scenariusz 3: „Jeśli nie wiesz, napisz ‘nie wiem’ i zaproponuj co sprawdzić.”

Cel: „Jeśli nie wiesz, napisz ‘nie wiem’ i zaproponuj co sprawdzić.”.
Wejście: zadanie i wymagany format odpowiedzi.
Kroki: opisz format -> wygeneruj wynik -> sprawdź zgodność.
Rezultat: bardziej przewidywalna odpowiedź.
Zabezpieczenie: walidacja struktury.

Ryzyka i jak je ograniczać

Ryzyko 1: Zbyt długi prompt (koszt, chaos)

Ryzyko: zbyt długi prompt (koszt, chaos).
Jak ograniczać: krótko i konkretnie, używaj szablonów.

Ryzyko 2: Sprzeczne wymagania („krótko” i „bardzo szczegółowo”)

Ryzyko: sprzeczne wymagania („krótko” i „bardzo szczegółowo”).
Jak ograniczać: priorytety: co najważniejsze.

Ryzyko 3: Wyciek zasad (prompt leakage)

Ryzyko: wyciek zasad (prompt leakage).
Jak ograniczać: nie wkładaj do promptu poufnych instrukcji, używaj systemowego i uprawnień.

Dalsza lektura

NIST — jakość i ryzyko (nist.gov)

Miejsce w mapie

Prompt → prompt format to praktyka pisania promptów.
Prompt systemowy → stałe zasady w tle.
Okno kontekstowe → limit długości.
Prompt leakage → ryzyko ujawniania instrukcji.
Mini-przepływ: Brief → prompt → odpowiedź → poprawki

Co to w zasadzie jest?

AI często działa lepiej, gdy dostaje „czytelne zadanie”. Format promptu to jak dobrze napisany brief:

co ma zrobić,
dla kogo,
w jakim stylu,
na jakich danych,
w jakim formacie ma zwrócić wynik (np. tabela, JSON, markdown).

Im mniej domysłów, tym mniej niespodzianek.

Diagram

Diagram pokazuje, że uporządkowany format promptu zmniejsza liczbę domysłów i poprawia przewidywalność wyniku.

Prompt guard (osłona promptu)

Kategoria: Prompting Tagi: prompting prompty ai prompt guard

Definicja

Prompt guard to zestaw technik i reguł, które chronią prompt i działanie systemu przed manipulacją (np. przez prompt injection) oraz przed wyciekiem zasad.

Po co w praktyce

Scenariusz 1: W RAG

Cel: dokumenty są traktowane jako „dane”, nie „polecenia”.
Wejście: prompt użytkownika i reguły bezpieczeństwa.
Kroki: sprawdź wejście -> zablokuj ryzyko -> przekaż bezpieczny prompt.
Rezultat: mniejsze ryzyko nadużyć.
Zabezpieczenie: testy red-team i logowanie incydentów.

Scenariusz 2: W tool calling

Cel: tylko allowlist narzędzi, brak „dowolnej komendy”.
Wejście: prompt użytkownika i reguły bezpieczeństwa.
Kroki: sprawdź wejście -> zablokuj ryzyko -> przekaż bezpieczny prompt.
Rezultat: mniejsze ryzyko nadużyć.
Zabezpieczenie: testy red-team i logowanie incydentów.

Scenariusz 3: W publikacji

Cel: aI nie może sama opublikować bez akceptacji.
Wejście: prompt użytkownika i reguły bezpieczeństwa.
Kroki: sprawdź wejście -> zablokuj ryzyko -> przekaż bezpieczny prompt.
Rezultat: mniejsze ryzyko nadużyć.
Zabezpieczenie: testy red-team i logowanie incydentów.

Ryzyka i jak je ograniczać

Ryzyko 1: Złudne zabezpieczenie („mamy filtr i wystarczy”)

Ryzyko: złudne zabezpieczenie („mamy filtr i wystarczy”).
Jak ograniczać: testy red teaming, aktualizacje i monitoring.

Ryzyko 2: Zbyt agresywne filtry psują UX

Ryzyko: zbyt agresywne filtry psują UX.
Jak ograniczać: jasne komunikaty i dobre wyjątki.

Ryzyko 3: Brak spójności w całym systemie

Ryzyko: brak spójności w całym systemie.
Jak ograniczać: jedna polityka + wdrożenie w każdym miejscu.

Miejsce w mapie

Guardrails → prompt guard to część guardrails.
Prompt injection → główny powód wdrożenia.
Prompt leakage → ochrona zasad systemu.
Tool calling → szczególnie istotne przy narzędziach.
Mini-przepływ: Wejście → filtr → kontekst → odpowiedź/akcja → log

Co to w zasadzie jest?

To „osłona” wokół tego, co mówisz AI i co AI może zrobić. Obejmuje:

separację instrukcji od danych,
blokowanie podejrzanych treści,
ograniczanie narzędzi,
weryfikację działań,
logowanie i alerty.

Prompt guard nie jest jednym trikiem — to warstwy ochrony.

Diagram

Diagram pokazuje warstwową ochronę promptu i kontekstu przed manipulacją i nadużyciem.

Prompt injection

Kategoria: Bezpieczeństwo Tagi: bezpieczeństwo ryzyko ochrona prompt injection

Definicja

Prompt injection to atak polegający na wstrzyknięciu złośliwych instrukcji do treści wejściowych, aby zmienić zachowanie modelu. Może wystąpić w wiadomościach, dokumentach, stronach WWW lub bazach wiedzy. To problem bezpieczeństwa aplikacji, nie samego modelu.

Po co w praktyce

Scenariusz 1: Ochrona asystenta w helpdesk

Cel: ochrona asystenta w helpdesk.
Wejście: treść zgłoszenia.
Kroki: filtr → detekcja → blokada.
Rezultat: bezpieczna odpowiedź.
Zabezpieczenie: logowanie incydentów.

Scenariusz 2: Bezpieczeństwo bazy wiedzy

Cel: bezpieczeństwo bazy wiedzy.
Wejście: dokumenty do RAG.
Kroki: skan → review → publikacja.
Rezultat: czysta baza.
Zabezpieczenie: whitelist źródeł.

Scenariusz 3: Automatyzacja maili

Cel: automatyzacja maili.
Wejście: mail klienta.
Kroki: izolacja danych → prompt systemowy → odpowiedź.
Rezultat: brak przejęcia instrukcji.
Zabezpieczenie: testy red teaming.

Ryzyka i jak je ograniczać

Ryzyko 1: Ujawnienie danych

Ryzyko: Ujawnienie danych.
Jak ograniczać: ogranicz dostęp i stosuj DLP.

Ryzyko 2: Zmiana zachowania modelu

Ryzyko: Zmiana zachowania modelu.
Jak ograniczać: separuj instrukcje od danych.

Ryzyko 3: Automatyczne wykonanie zadań

Ryzyko: Automatyczne wykonanie zadań.
Jak ograniczać: wymuszaj zatwierdzenia.

Checklista

Czy dane wejściowe są traktowane jako nieufne?
Czy są filtry i walidacja treści?
Czy instrukcje są odseparowane od danych?
Czy testowano prompt injection?
Czy logujesz podejrzane przypadki?

Dalsza lektura

Miejsce w mapie

Prompt injection → atak na: RAG
Prompt injection → wymaga: Guardrails
Prompt injection → zwiększa ryzyko: Data poisoning

Co to w zasadzie jest?

Atakujący „przemyca” instrukcje w treści, które mają przejąć kontrolę.
Model może potraktować złośliwą treść jak polecenie.
Najczęściej dotyczy systemów z RAG lub automatyzacji.
Ochrona wymaga filtrów, izolacji danych i testów.

Typowe błędy i pułapki

Wkładanie nieufnych danych do promptu systemowego.
Brak filtrów na wejściu.
Brak testów z przykładowymi atakami.

Diagram

Diagram pokazuje, że prompt injection polega na przemyceniu instrukcji w danych wejściowych i wymaga ochrony przed ich wykonaniem.

Powiązane hasła

Jailbreaking
Guardrails
Prompt systemowy
RAG
Data poisoning

Prompt leakage (wyciek instrukcji)

Kategoria: Bezpieczeństwo Tagi: bezpieczeństwo ryzyko ochrona prompt leakage

Definicja

Prompt leakage to sytuacja, gdy model ujawnia instrukcje systemowe, zasady działania lub treści, które powinny pozostać ukryte.

Po co w praktyce

Scenariusz 1: Asystent procedur

Cel: asystent procedur: próby „pokaż instrukcje administratora”.
Wejście: prompt użytkownika i instrukcje systemowe.
Kroki: wykryj próbę ujawnienia -> odmów -> zaloguj incydent.
Rezultat: mniejsze ryzyko wycieku instrukcji.
Zabezpieczenie: separacja instrukcji i testy red-team.

Scenariusz 2: Chat na stronie

Cel: chat na stronie: próby wyciągnięcia listy dokumentów lub promptów.
Wejście: prompt użytkownika i instrukcje systemowe.
Kroki: wykryj próbę ujawnienia -> odmów -> zaloguj incydent.
Rezultat: mniejsze ryzyko wycieku instrukcji.
Zabezpieczenie: separacja instrukcji i testy red-team.

Ryzyka i jak je ograniczać

Ryzyko 1: Wyciek reguł i danych

Ryzyko: Wyciek reguł i danych.
Jak ograniczać: nie umieszczaj sekretów w promptach.

Ryzyko 2: Ułatwienie ataku

Ryzyko: Ułatwienie ataku.
Jak ograniczać: guardrails + red teaming.

Ryzyko 3: Reputacja

Ryzyko: Reputacja.
Jak ograniczać: monitoring i szybkie reagowanie.

Checklista

Czy w promptach nie ma sekretów?
Czy model ma zakaz ujawniania instrukcji?
Czy testowano ataki?
Czy logujesz podejrzane próby?
Czy masz procedurę incydentu?

Dalsza lektura

Miejsce w mapie

Prompt leakage → powiązane z: Prompt injection
Prompt leakage → ogranicza: Guardrails
Prompt leakage → testuje: Red teaming

Co to w zasadzie jest?

To jak wyciągnięcie „notatek wewnętrznych” z systemu.
Może ujawnić polityki, klucze lub fragmenty danych z kontekstu.
Często jest skutkiem sprytnych pytań lub prompt injection.

Typowe błędy i pułapki

Trzymanie w promptach tajnych informacji.
Brak testów bezpieczeństwa (red teaming).

Diagram

Diagram pokazuje próbę wydobycia ukrytych instrukcji i reakcję systemu w postaci blokady i logu.

Powiązane hasła

Prompt injection
Guardrails
Red teaming
Audit trail
Polityka użycia AI

Prompt library (biblioteka promptów)

Kategoria: Prompting Tagi: prompting prompty ai prompt library

Definicja

Prompt library to uporządkowany zestaw sprawdzonych promptów (szablonów), które można wielokrotnie wykorzystywać w pracy.

Po co w praktyce

Scenariusz 1: Szablon

Cel: „Zrób tekst w prostym języku + 3 przykłady + ryzyka”.
Wejście: szablon promptu i zadanie zespołu.
Kroki: wybierz szablon -> uzupełnij dane -> oceń wynik.
Rezultat: spójniejsza praca zespołu.
Zabezpieczenie: wersjonowanie promptów i testy.

Scenariusz 2: Szablon

Cel: „Wygeneruj opis pojęcia w strukturze pojęciownika”.
Wejście: szablon promptu i zadanie zespołu.
Kroki: wybierz szablon -> uzupełnij dane -> oceń wynik.
Rezultat: spójniejsza praca zespołu.
Zabezpieczenie: wersjonowanie promptów i testy.

Scenariusz 3: Szablon

Cel: „Sprawdź tekst pod kątem PII i zaproponuj anonimizację”.
Wejście: szablon promptu i zadanie zespołu.
Kroki: wybierz szablon -> uzupełnij dane -> oceń wynik.
Rezultat: spójniejsza praca zespołu.
Zabezpieczenie: wersjonowanie promptów i testy.

Ryzyka i jak je ograniczać

Ryzyko 1: Prompty się starzeją (drift)

Ryzyko: prompty się starzeją (drift).
Jak ograniczać: wersjonowanie + przegląd co miesiąc/kwartał.

Ryzyko 2: Prompty zawierają wrażliwe instrukcje

Ryzyko: prompty zawierają wrażliwe instrukcje.
Jak ograniczać: osobne repo prywatne, kontrola dostępu, prompt guard.

Ryzyko 3: Ludzie kopiują bez zrozumienia

Ryzyko: ludzie kopiują bez zrozumienia.
Jak ograniczać: krótka instrukcja „kiedy używać / kiedy nie”.

Dalsza lektura

NIST — dobre praktyki jakości (nist.gov)

Miejsce w mapie

Prompt → biblioteka to praktyka pracy z promptami.
Prompt format → standaryzacja.
Prompt systemowy → zasady globalne.
Model versioning → prompty też wersjonujesz.
Mini-przepływ: Szablon → użycie → poprawka → wersja

Co to w zasadzie jest?

Zamiast za każdym razem pisać prompt od zera, masz „gotowce”:

do streszczeń,
do pisania postów,
do analizy dokumentów,
do checklist.

To oszczędza czas i poprawia spójność jakości.

Diagram

Diagram pokazuje, że biblioteka promptów jest żywym zbiorem szablonów rozwijanych po użyciu.

Prompt routing (kierowanie zapytań)

Kategoria: Prompting Tagi: prompting prompty ai prompt routing

Definicja

Prompt routing to mechanizm, który decyduje, „gdzie wysłać zapytanie”: do jakiego modelu, jakiego trybu (RAG/bez RAG), jakich narzędzi i jakich zasad.

Po co w praktyce

Scenariusz 1: Krótkie FAQ → szybki tryb bez narzędzi

Cel: krótkie FAQ → szybki tryb bez narzędzi.
Wejście: zapytanie i lista możliwych ścieżek.
Kroki: rozpoznaj typ -> wybierz ścieżkę -> przekaż do właściwego modelu lub narzędzia.
Rezultat: lepsze dopasowanie odpowiedzi.
Zabezpieczenie: reguły routingu i monitoring błędów.

Scenariusz 2: Pytanie „na podstawie plików” → RAG + reranking

Cel: pytanie „na podstawie plików” → RAG + reranking.
Wejście: zapytanie i lista możliwych ścieżek.
Kroki: rozpoznaj typ -> wybierz ścieżkę -> przekaż do właściwego modelu lub narzędzia.
Rezultat: lepsze dopasowanie odpowiedzi.
Zabezpieczenie: reguły routingu i monitoring błędów.

Scenariusz 3: Prośba o działanie (np. commit) → agent + tool calling

Cel: prośba o działanie (np. commit) → agent + tool calling.
Wejście: zapytanie i lista możliwych ścieżek.
Kroki: rozpoznaj typ -> wybierz ścieżkę -> przekaż do właściwego modelu lub narzędzia.
Rezultat: lepsze dopasowanie odpowiedzi.
Zabezpieczenie: reguły routingu i monitoring błędów.

Ryzyka i jak je ograniczać

Ryzyko 1: Zła decyzja routingu = zła odpowiedź

Ryzyko: zła decyzja routingu = zła odpowiedź.
Jak ograniczać: testy na zbiorze pytań, fallbacki (gdy niepewne tryb bezpieczny).

Ryzyko 2: Routing ujawnia zasady (prompt leakage)

Ryzyko: routing ujawnia zasady (prompt leakage).
Jak ograniczać: nie pokazuj reguł użytkownikowi, loguj wewnętrznie.

Ryzyko 3: Skomplikowanie systemu

Ryzyko: skomplikowanie systemu.
Jak ograniczać: proste reguły, stopniowe dodawanie.

Dalsza lektura

NIST — zarządzanie ryzykiem AI (nist.gov)

Miejsce w mapie

RAG / Retrieval → routing wybiera kiedy używać.
Agentic workflow → routing uruchamia agenta.
Guardrails → routing może włączać ostrzejsze zasady.
LLMOps → utrzymanie i testowanie routingu.
Mini-przepływ: Zapytanie → klasyfikacja → wybór trybu → odpowiedź

Co to w zasadzie jest?

To jak centrala telefoniczna:

pytanie o definicję → słownik,
pytanie o dokument → RAG,
pytanie o działanie → agent + narzędzia,
pytanie wrażliwe → dodatkowe zasady bezpieczeństwa.

Routing poprawia jakość i obniża koszty, bo nie każde pytanie wymaga „najmocniejszego” trybu.

Diagram

Diagram pokazuje, że system najpierw rozpoznaje typ pytania, a potem kieruje je do właściwego trybu działania.

Prompt systemowy

Kategoria: Prompting Tagi: prompting prompty ai prompt systemowy

Definicja

Prompt systemowy to zestaw nadrzędnych instrukcji, które definiują rolę modelu, styl odpowiedzi i ograniczenia bezpieczeństwa. Jest wyżej w hierarchii niż zwykłe polecenia użytkownika. To element konfiguracji aplikacji, a nie pojedynczej rozmowy.

Po co w praktyce

Scenariusz 1: Spójny ton odpowiedzi

Cel: spójny ton odpowiedzi.
Wejście: wytyczne marki.
Kroki: ustaw prompt systemowy → testy → korekty.
Rezultat: jednolity styl.
Zabezpieczenie: review treści.

Scenariusz 2: Ograniczenie ryzyk

Cel: ograniczenie ryzyk.
Wejście: polityka bezpieczeństwa.
Kroki: zasady + zakazy → testy próbne.
Rezultat: mniej niepożądanych odpowiedzi.
Zabezpieczenie: monitoring.

Scenariusz 3: Format odpowiedzi dla automatyzacji

Cel: format odpowiedzi dla automatyzacji.
Wejście: specyfikacja formatu.
Kroki: ustaw JSON → walidacja.
Rezultat: przewidywalny output.
Zabezpieczenie: walidacja schema.

Ryzyka i jak je ograniczać

Ryzyko 1: Prompt injection

Ryzyko: Prompt injection.
Jak ograniczać: izolacja danych wejściowych.

Ryzyko 2: Nadinterpretacja

Ryzyko: Nadinterpretacja.
Jak ograniczać: wymagaj źródeł i cytatów.

Ryzyko 3: Niespójność stylu

Ryzyko: Niespójność stylu.
Jak ograniczać: testy regresji odpowiedzi.

Checklista

Czy zasady są jasne i konkretne?
Czy prompt nie zawiera danych wrażliwych?
Czy przetestowano próby obejścia?
Czy masz monitoring i logi?
Czy jest procedura aktualizacji?

Dalsza lektura

OWASP LLM Top 10

Miejsce w mapie

Prompt systemowy → ustawia: Guardrails
Prompt systemowy → chroni przed: Jailbreaking
Prompt systemowy → wspiera: Polityka AI

Co to w zasadzie jest?

To „zasady gry”, których model ma zawsze przestrzegać.
Określa ton, zakres i ograniczenia odpowiedzi.
Chroni przed niepożądanymi zachowaniami i błędami.
Jest szczególnie ważny w rozwiązaniach produkcyjnych.

Typowe błędy i pułapki

Zbyt ogólne zasady bez przykładów.
Umieszczanie danych wrażliwych w promptach.
Brak testów bezpieczeństwa.

Diagram

Diagram pokazuje, że zasady systemowe ustawiają granice i sposób działania modelu ponad zwykłym poleceniem użytkownika.

Powiązane hasła

Prompt
Prompt injection
Jailbreaking
Guardrails
Polityka AI

Przepływ agentowy

Kategoria: Organizacja i zarządzanie Tagi:

Definicja

Przepływ agentowy to sposób działania, w którym AI realizuje cel w kilku krokach. Najpierw planuje, potem używa narzędzi, sprawdza wynik i w razie potrzeby go poprawia. Dopiero na końcu zamyka zadanie.

Po co w praktyce

Scenariusz 1: Tworzenie treści

Cel: plan -> szkic -> dopracowanie -> lista kontrolna -> gotowa wersja.
Wejście: cel procesu, dostępne narzędzia i granice działania.
Kroki: zaplanuj kroki -> wykonaj etap -> sprawdź wynik.
Rezultat: zadanie domknięte w kontrolowanym przepływie.
Zabezpieczenie: punkt akceptacji i limity działań.

Scenariusz 2: Porządkowanie repo

Cel: analiza plików → propozycja struktury → PR → opis PR.
Wejście: cel procesu, dostępne narzędzia i granice działania.
Kroki: zaplanuj kroki -> wykonaj etap -> sprawdź wynik.
Rezultat: zadanie domknięte w kontrolowanym przepływie.
Zabezpieczenie: punkt akceptacji i limity działań.

Scenariusz 3: Badanie tematu

Cel: lista źródeł → streszczenie → wnioski → weryfikacja.
Wejście: cel procesu, dostępne narzędzia i granice działania.
Kroki: zaplanuj kroki -> wykonaj etap -> sprawdź wynik.
Rezultat: zadanie domknięte w kontrolowanym przepływie.
Zabezpieczenie: punkt akceptacji i limity działań.

Ryzyka i jak je ograniczać

Ryzyko 1: Agent wykona niechciane akcje

Ryzyko: agent wykona niechciane akcje.
Jak ograniczać: tryb „tylko propozycja” lub osobny etap akceptacji.

Ryzyko 2: Zbyt długi proces (koszt i czas)

Ryzyko: zbyt długi proces (koszt i czas).
Jak ograniczać: limity kroków, limity tokenów, przerwania i punkty kontrolne.

Ryzyko 3: Błędy narastają (zły krok kolejne złe kroki)

Ryzyko: błędy narastają (zły krok kolejne złe kroki).
Jak ograniczać: ewaluacja po ważnych etapach, sprawdzanie faktów i udział człowieka.

Dalsza lektura

NIST — zarządzanie ryzykiem (nist.gov)

Miejsce w mapie

Agent AI → agent to „wykonawca” przepływu.
Orkiestracja → projektuje kroki i kolejność.
Tool calling → agent używa narzędzi.
Human-in-the-loop → bezpiecznik i akceptacja.
Monitoring jakości / Ewaluacja → kontrola efektów.
Mini-przepływ: Cel → Plan → Narzędzia → Wynik → Sprawdzenie → Final

Co to w zasadzie jest?

Zwykły model odpowiada „na raz”. Przepływ agentowy działa jak człowiek przy zadaniu:

najpierw robi plan,
potem zbiera dane,
wykonuje czynności po kolei,
sprawdza, czy rezultat ma sens,
ewentualnie poprawia.

To podejście dobrze działa przy zadaniach typu „zrób to od A do Z”. Wymaga jednak kontroli. Bez niej agent może wykonać zbyt wiele akcji.

Diagram

Diagram pokazuje, że przepływ agentowy prowadzi od celu przez plan i wykonanie do sprawdzenia wyniku, zanim zadanie zostanie zakończone.

RAG

Kategoria: Retrieval / RAG Tagi: rag retrieval wyszukiwanie

Definicja

RAG (Retrieval-Augmented Generation, czyli generowanie wzbogacone wyszukiwaniem) to podejście, w którym model najpierw wyszukuje fragmenty z dokumentów, a potem tworzy odpowiedź na ich podstawie. RAG nie jest osobnym modelem, tylko sposobem łączenia wyszukiwania z generowaniem. To rozwiązanie zwiększa wiarygodność odpowiedzi, gdy źródła są aktualne.

Po co w praktyce

Scenariusz 1: Odpowiedzi na pytania klientów

Cel: odpowiedzi na pytania klientów.
Wejście: pytanie + baza regulaminów.
Kroki: wyszukaj → odpowiedz → cytuj źródło.
Rezultat: spójna odpowiedź.
Zabezpieczenie: aktualizacja bazy.

Scenariusz 2: Wsparcie działu sprzedaży

Cel: wsparcie działu sprzedaży.
Wejście: oferta i FAQ.
Kroki: RAG → szkic odpowiedzi → review.
Rezultat: szybsze odpowiedzi.
Zabezpieczenie: kontrola obietnic.

Scenariusz 3: Wewnętrzna baza wiedzy

Cel: wewnętrzna baza wiedzy.
Wejście: instrukcje i procedury.
Kroki: indeks → zapytanie → cytaty.
Rezultat: odpowiedź z linkami.
Zabezpieczenie: wersjonowanie dokumentów.

Ryzyka i jak je ograniczać

Ryzyko 1: Prompt injection w źródłach

Ryzyko: Prompt injection w źródłach.
Jak ograniczać: filtracja i review dokumentów.

Ryzyko 2: Halucynacje mimo źródeł

Ryzyko: Halucynacje mimo źródeł.
Jak ograniczać: weryfikacja odpowiedzi.

Ryzyko 3: Dane osobowe

Ryzyko: Dane osobowe.
Jak ograniczać: anonimizacja i dostęp rolowy.

Checklista

Czy baza dokumentów jest aktualna?
Czy odpowiedzi mają cytaty i źródła?
Czy dane wrażliwe są usunięte?
Czy wynik jest sprawdzany przez człowieka?
Czy logujesz zapytania i odpowiedzi?

Dalsza lektura

Miejsce w mapie

RAG → używa: Embedding
RAG → wspiera: Grounding
RAG → wymaga: Baza wektorowa

Co to w zasadzie jest?

Model „zagląda” do dokumentów, zamiast odpowiadać z pamięci.
Dzięki temu łatwiej ograniczyć halucynacje i podać źródła.
Jakość zależy od jakości bazy wiedzy.
RAG to część aplikacji, a nie samodzielny produkt.

Typowe błędy i pułapki

Nieaktualna baza wiedzy.
Brak cytatów lub źródeł.
Mieszanie dokumentów z różnych obszarów.

Diagram

Diagram pokazuje, że RAG łączy wyszukiwanie dokumentów z generowaniem odpowiedzi na ich podstawie.

Powiązane hasła

Embedding
Baza wektorowa
Grounding
Prompt injection
Okno kontekstowe

Rate limiting (limitowanie zapytań)

Kategoria: Wdrożenia i operacje (LLMOps) Tagi: llmops wdrozenia operacje rate limiting

Definicja

Rate limiting to ograniczanie liczby zapytań do systemu w danym czasie (np. 60/min), żeby chronić usługę przed przeciążeniem i nadużyciami.

Po co w praktyce

Scenariusz 1: Chatbot

Cel: limit per użytkownik, żeby uniknąć spamu.
Wejście: ruch użytkowników i limity systemu.
Kroki: policz żądania -> zastosuj limit -> zwróć komunikat.
Rezultat: stabilniejsze działanie usługi.
Zabezpieczenie: czytelne limity i obsługa wyjątków.

Scenariusz 2: API

Cel: limit per klucz, żeby kontrolować koszty i stabilność.
Wejście: ruch użytkowników i limity systemu.
Kroki: policz żądania -> zastosuj limit -> zwróć komunikat.
Rezultat: stabilniejsze działanie usługi.
Zabezpieczenie: czytelne limity i obsługa wyjątków.

Scenariusz 3: Agent

Cel: limit kroków narzędzi (max 20 wywołań).
Wejście: ruch użytkowników i limity systemu.
Kroki: policz żądania -> zastosuj limit -> zwróć komunikat.
Rezultat: stabilniejsze działanie usługi.
Zabezpieczenie: czytelne limity i obsługa wyjątków.

Ryzyka i jak je ograniczać

Ryzyko 1: Blokowanie „dobrych” użytkowników

Ryzyko: blokowanie „dobrych” użytkowników.
Jak ograniczać: różne limity dla różnych ról + jasny komunikat „spróbuj później”.

Ryzyko 2: Obchodzenie limitów

Ryzyko: obchodzenie limitów.
Jak ograniczać: identyfikacja po kluczu + IP + zachowaniu, analiza nadużyć.

Ryzyko 3: Brak widoczności, kiedy limit działa

Ryzyko: brak widoczności, kiedy limit działa.
Jak ograniczać: monitoring i alerty + logi.

Miejsce w mapie

API → rate limiting jest częścią API.
SSO/IAM → limity często zależą od roli/użytkownika.
LLMOps / Monitoring jakości → obserwacja stabilności.
Agentic workflow → limity chronią przed pętlami.
Mini-przepływ: Żądanie → limit? → OK / odrzuć z informacją

Co to w zasadzie jest?

To „bramka”, która mówi: „OK, możesz pytać, ale nie 1000 razy na minutę”. W AI ma to znaczenie, bo:

modele i narzędzia kosztują,
ataki i błędy potrafią generować lawinę żądań,
pętle agentów mogą zrobić „samozapętlenie”.

Diagram

Diagram pokazuje, że system ogranicza liczbę zapytań w czasie, aby chronić stabilność i koszty.

Red teaming

Kategoria: Bezpieczeństwo Tagi: bezpieczeństwo ryzyko ochrona red teaming

Definicja

Red teaming to kontrolowane testy, które sprawdzają, jak system AI zachowuje się przy próbach nadużyć i obejść zabezpieczeń.

Po co w praktyce

Scenariusz 1: Test prompt injection

Cel: test prompt injection.
Wejście: zestaw złośliwych promptów.
Kroki: testy -> analiza -> poprawki.
Rezultat: mocniejsze zabezpieczenia.
Zabezpieczenie: zakres testu i logi.

Scenariusz 2: Test wycieku instrukcji

Cel: test wycieku instrukcji.
Wejście: scenariusze prompt leakage.
Kroki: próby ujawnienia -> raport -> zmiany.
Rezultat: mniejsze ryzyko ujawnień.
Zabezpieczenie: izolowane środowisko.

Scenariusz 3: Test nadużyć API

Cel: test nadużyć API.
Wejście: reguły dostępu.
Kroki: próba auth bypass -> walidacja -> hardening.
Rezultat: lepsza kontrola dostępu.
Zabezpieczenie: IAM i rate limiting.

Ryzyka i jak je ograniczać

Ryzyko 1: False negative

Ryzyko: False negative.
Jak ograniczać: regularne testy cykliczne.

Ryzyko 2: Zakłócenie produkcji

Ryzyko: Zakłócenie produkcji.
Jak ograniczać: testy na środowisku testowym.

Ryzyko 3: Brak rozliczalności

Ryzyko: Brak rozliczalności.
Jak ograniczać: raport i audit trail.

Checklista

Czy jest zakres i plan testów?
Czy testy są w środowisku bezpiecznym?
Czy wyniki są udokumentowane?
Czy są terminy poprawek?
Czy wykonano retest?

Dalsza lektura

Miejsce w mapie

Red teaming -> testuje: Guardrails (barierki bezpieczeństwa)
Red teaming -> ogranicza: Jailbreaking
Red teaming -> wspiera: Prompt leakage (wyciek instrukcji)

Co to w zasadzie jest?

To symulacja ataku w bezpiecznych warunkach.
Celem jest znalezienie słabych punktów przed produkcją.
Wynik testów prowadzi do poprawek technicznych i procesowych.

Typowe błędy i pułapki

Test bez zakresu i kryteriów.
Brak dokumentacji wyników.
Brak wdrożenia poprawek po testach.

Diagram

Diagram pokazuje kontrolowany cykl testów nadużyć i poprawek zabezpieczeń.

Powiązane hasła

Guardrails (barierki bezpieczeństwa)
Jailbreaking
Prompt leakage (wyciek instrukcji)
Prompt injection
Audit trail

Redakcja danych wrażliwych (AI redaction)

Kategoria: Bezpieczeństwo Tagi: redaction dane wrażliwe pii dlp bezpieczeństwo

Definicja

Redakcja danych wrażliwych to wykrywanie i usuwanie albo ukrywanie informacji wrażliwych z tekstu, dokumentów, obrazów lub nagrań przed dalszym użyciem albo udostępnieniem.

Po co w praktyce

Scenariusz 1: Przygotowanie dokumentów do analizy przez AI

Cel: usunąć dane, które nie są potrzebne do zadania.
Wejście: dokument źródłowy z danymi osobowymi albo poufnymi.
Kroki: wykrycie danych -> ukrycie lub usunięcie -> kontrola wyniku.
Rezultat: materiał bezpieczniejszy do dalszej pracy.
Zabezpieczenie: drugi przegląd i checklista prywatności.

Scenariusz 2: Publikacja dokumentu wewnętrznego

Cel: udostępnić treść bez ujawnienia wrażliwych fragmentów.
Wejście: wersja robocza dokumentu i zasady publikacji.
Kroki: identyfikacja wrażliwych danych -> redakcja -> zatwierdzenie.
Rezultat: dokument gotowy do bezpieczniejszego udostępnienia.
Zabezpieczenie: kontrola właściciela dokumentu.

Scenariusz 3: Ochrona obrazów i skanów

Cel: ukryć dane widoczne na załącznikach, zrzutach ekranu albo zdjęciach.
Wejście: plik graficzny albo PDF.
Kroki: wykrycie elementów -> zasłonięcie -> sprawdzenie eksportu.
Rezultat: obraz nie ujawnia danych wrażliwych.
Zabezpieczenie: test na finalnym pliku, nie tylko w podglądzie.

Ryzyka i jak je ograniczać

Ryzyko 1: Wyciek danych

Ryzyko: wyciek danych.
Jak ograniczać: stosuj drugi przegląd i trwałe usuwanie danych.

Ryzyko 2: Fałszywe poczucie bezpieczeństwa

Ryzyko: fałszywe poczucie bezpieczeństwa.
Jak ograniczać: testuj plik końcowy po eksporcie.

Ryzyko 3: Pominięcie ważnych danych

Ryzyko: pominięcie ważnych danych.
Jak ograniczać: łącz automatyzację z kontrolą człowieka.

Ryzyko 4: Niespójność procesu

Ryzyko: niespójność procesu.
Jak ograniczać: wprowadź standard redakcji i checklisty.

Checklista

Czy wiadomo, jakie dane trzeba ukryć?
Czy redakcja jest trwała, a nie tylko wizualna?
Czy ktoś sprawdził plik końcowy?
Czy usunięto dane pośrednie?
Czy proces jest zgodny z polityką danych?

Miejsce w mapie

Redakcja danych wrażliwych (AI redaction) → wspiera: Dane osobowe (PII)

Redakcja danych wrażliwych (AI redaction) → wspiera: DLP

Redakcja danych wrażliwych (AI redaction) → wymaga: Anonimizacja / pseudonimizacja

Co to w zasadzie jest?

To praktyczny etap ochrony danych. Zanim dokument trafi do analizy, szkolenia, publikacji albo do zewnętrznego narzędzia AI, usuwa się z niego to, czego nie powinno tam być.

Redakcja może dotyczyć:

danych osobowych,
danych kontaktowych,
numerów identyfikacyjnych,
tajemnic organizacji,
elementów wrażliwych na obrazach i skanach.

Typowe błędy i pułapki

Zostawienie danych pośrednich pozwalających zidentyfikować osobę.
Zasłanianie danych tylko wizualnie bez trwałego usunięcia.
Brak sprawdzenia finalnego eksportu.
Założenie, że automatyczna redakcja zawsze wystarczy.

Diagram

Diagram pokazuje, że redakcja danych wrażliwych wymaga nie tylko wykrycia, ale też kontroli końcowego pliku.

Powiązane hasła

Dane osobowe (PII)

Anonimizacja / pseudonimizacja

RODO / DPIA

Human-in-the-loop (człowiek w pętli)

---

Rejestr systemów AI (AI inventory)

Kategoria: Organizacja i zarządzanie Tagi: inventory rejestr governance zgodność nadzór

Definicja

Rejestr systemów AI to uporządkowana lista narzędzi, modeli, agentów i zastosowań AI używanych w organizacji wraz z ich właścicielami, celem, ryzykami i statusem.

Po co w praktyce

Scenariusz 1: Przegląd użycia AI w firmie

Cel: ustalić, gdzie w organizacji działa AI.
Wejście: lista narzędzi, zespołów i przypadków użycia.
Kroki: identyfikacja systemów -> opis zastosowań -> wpis do rejestru.
Rezultat: organizacja widzi pełniejszy obraz użycia AI.
Zabezpieczenie: właściciel procesu i regularna aktualizacja.

Scenariusz 2: Przygotowanie do audytu albo kontroli

Cel: szybko pokazać, jakie systemy AI są używane i na jakich zasadach.
Wejście: dane z rejestru, dokumentacja i właściciele systemów.
Kroki: przegląd wpisów -> uzupełnienie braków -> raportowanie.
Rezultat: łatwiejsze wykazanie zgodności i nadzoru.
Zabezpieczenie: spójny format wpisów i przypisane odpowiedzialności.

Scenariusz 3: Reakcja na incydent

Cel: szybko ustalić, które systemy mogą być dotknięte problemem.
Wejście: opis incydentu i lista systemów AI.
Kroki: wyszukanie systemów -> sprawdzenie właścicieli -> działania naprawcze.
Rezultat: szybsza reakcja i mniej chaosu.
Zabezpieczenie: aktualne dane w rejestrze i powiązanie z audit trail.

Ryzyka i jak je ograniczać

Ryzyko 1: Brak widoczności użycia AI

Ryzyko: brak widoczności użycia AI.
Jak ograniczać: wprowadź obowiązek zgłaszania nowych systemów.

Ryzyko 2: Nieaktualne wpisy

Ryzyko: nieaktualne wpisy.
Jak ograniczać: planuj przeglądy okresowe.

Ryzyko 3: Brak odpowiedzialności

Ryzyko: brak odpowiedzialności.
Jak ograniczać: przypisuj właściciela biznesowego i technicznego.

Ryzyko 4: Luki zgodności

Ryzyko: luki zgodności.
Jak ograniczać: połącz rejestr z governance i oceną ryzyka.

Checklista

Czy system jest wpisany do rejestru?
Czy ma właściciela?
Czy opisano dane i cel użycia?
Czy oceniono ryzyko i zgodność?
Czy wiadomo, kiedy był ostatni przegląd?

Miejsce w mapie

Rejestr systemów AI (AI inventory) → wspiera: AI Governance (Ład korporacyjny AI)

Rejestr systemów AI (AI inventory) → wspiera: AI Act (Akt w sprawie sztucznej inteligencji)

Rejestr systemów AI (AI inventory) → wymaga: Ślad audytowy

Co to w zasadzie jest?

To podstawowe narzędzie porządkowania wdrożeń AI. Organizacja wie dzięki niemu, jakie systemy ma, kto za nie odpowiada, jakie dane wykorzystują i które procesy wspierają.

Bez takiego rejestru trudno:

prowadzić governance,
oceniać zgodność,
planować przeglądy,
reagować na incydenty,
kontrolować shadow AI.

Typowe błędy i pułapki

Trzymanie rejestru tylko „na papierze”.
Brak aktualizacji po nowych wdrożeniach.
Brak właścicieli systemów.
Pomijanie małych narzędzi i nieformalnych zastosowań.

Diagram

Diagram pokazuje, że rejestr AI porządkuje wdrożenia od momentu zgłoszenia do późniejszego nadzoru.

Powiązane hasła

AI Governance (Ład korporacyjny AI)

AI Act (Akt w sprawie sztucznej inteligencji)

Polityka użycia AI w organizacji

Ślad audytowy

Shadow AI (Szara strefa AI)

---

Reranking (ponowne sortowanie wyników)

Kategoria: Retrieval / RAG Tagi: rag retrieval wyszukiwanie reranking

Definicja

Reranking to etap, w którym system bierze wstępną listę wyników wyszukiwania (np. 20 fragmentów) i ponownie je sortuje, żeby na górze były najbardziej trafne.

Po co w praktyce

Scenariusz 1: W pojęciowniku

Cel: zapytanie „prompt injection” → reranking wybiera fragmenty o ataku, a nie ogólnie o promptach.
Wejście: lista wyników wyszukiwania.
Kroki: pobierz kandydatów -> ponownie oceń -> wybierz najlepsze fragmenty.
Rezultat: trafniejszy kontekst dla modelu.
Zabezpieczenie: limity wyników i testy jakości.

Scenariusz 2: W firmie

Cel: „procedura urlopowa” → reranking wybiera aktualny dokument, a nie stary.
Wejście: lista wyników wyszukiwania.
Kroki: pobierz kandydatów -> ponownie oceń -> wybierz najlepsze fragmenty.
Rezultat: trafniejszy kontekst dla modelu.
Zabezpieczenie: limity wyników i testy jakości.

Scenariusz 3: W aplikacji

Cel: „jak zresetować hasło” → reranking podbija artykuł „Reset hasła”, a nie „polityka haseł”.
Wejście: lista wyników wyszukiwania.
Kroki: pobierz kandydatów -> ponownie oceń -> wybierz najlepsze fragmenty.
Rezultat: trafniejszy kontekst dla modelu.
Zabezpieczenie: limity wyników i testy jakości.

Ryzyka i jak je ograniczać

Ryzyko 1: Reranker promuje „ładne” teksty, a nie prawdziwe

Ryzyko: reranker promuje „ładne” teksty, a nie prawdziwe.
Jak ograniczać: testy na zestawach pytań + metryki jakości + ręczna kontrola.

Ryzyko 2: Koszty i opóźnienia

Ryzyko: koszty i opóźnienia.
Jak ograniczać: rerank tylko top-k, cache, profilowanie.

Ryzyko 3: Bias w wynikach

Ryzyko: bias w wynikach.
Jak ograniczać: audyt i obserwacja, różne typy pytań, analiza błędów.

Dalsza lektura

NIST — ocena i ryzyko systemów AI (nist.gov)

Miejsce w mapie

Retrieval → reranking poprawia wyniki retrieval.
RAG → kluczowy element jakości RAG.
Embedding / Benchmark / Ewaluacja → jak mierzyć, czy jest lepiej.
Monitoring jakości → wykrywanie pogorszeń.
Mini-przepływ: Wyniki top-20 → Rerank → top-5 → Kontekst

Co to w zasadzie jest?

Wyszukiwarka często zwraca „coś podobnego”. Reranking to dodatkowe sito: „z tych 20 wybierz 5 najlepszych”. Dzięki temu AI dostaje lepszy kontekst, a odpowiedzi są bardziej na temat.

Diagram

Diagram pokazuje, że po wstępnym wyszukaniu system wybiera najbardziej trafne fragmenty do odpowiedzi.

Retrieval (wyszukiwanie informacji)

Kategoria: Retrieval / RAG Tagi: rag retrieval wyszukiwanie

Definicja

Retrieval to etap „znajdź pasujące informacje”, zanim AI zacznie generować odpowiedź — np. przeszukanie plików, bazy wiedzy lub internetu (jeśli jest dozwolony).

Po co w praktyce

Scenariusz 1: „Znajdź w repo wszystkie definicje związane z bezpieczeństwem.”

Cel: „Znajdź w repo wszystkie definicje związane z bezpieczeństwem.”.
Wejście: pytanie użytkownika i zbiór dokumentów.
Kroki: wyszukaj fragmenty -> oceń trafność -> przekaż kontekst.
Rezultat: odpowiedź oparta na znalezionych materiałach.
Zabezpieczenie: kontrola źródeł i cytowanie.

Scenariusz 2: „Odszukaj fragment w PDF i streść go prostym językiem.”

Cel: „Odszukaj fragment w PDF i streść go prostym językiem.”.
Wejście: pytanie użytkownika i zbiór dokumentów.
Kroki: wyszukaj fragmenty -> oceń trafność -> przekaż kontekst.
Rezultat: odpowiedź oparta na znalezionych materiałach.
Zabezpieczenie: kontrola źródeł i cytowanie.

Scenariusz 3: „Pokaż porównanie dwóch pojęć na podstawie słownika.”

Cel: „Pokaż porównanie dwóch pojęć na podstawie słownika.”.
Wejście: pytanie użytkownika i zbiór dokumentów.
Kroki: wyszukaj fragmenty -> oceń trafność -> przekaż kontekst.
Rezultat: odpowiedź oparta na znalezionych materiałach.
Zabezpieczenie: kontrola źródeł i cytowanie.

Ryzyka i jak je ograniczać

Ryzyko 1: Złe wyniki wyszukiwania (AI dostaje nie to, co trzeba)

Ryzyko: złe wyniki wyszukiwania (AI dostaje nie to, co trzeba).
Jak ograniczać: dobre tagi, chunking, testy zapytań, reranking.

Ryzyko 2: Wrażliwe dane trafiają do kontekstu

Ryzyko: wrażliwe dane trafiają do kontekstu.
Jak ograniczać: filtry DLP, maskowanie PII, polityka dostępu.

Ryzyko 3: „stare” treści mieszają się z nowymi

Ryzyko: „stare” treści mieszają się z nowymi.
Jak ograniczać: wersjonowanie źródeł + daty aktualizacji + źródła priorytetowe.

Dalsza lektura

NIST — podejście do wiarygodności i ryzyka AI (nist.gov)

Miejsce w mapie

RAG → retrieval to pierwszy krok RAG.
Chunking → dzielenie treści poprawia wyszukiwanie.
Embedding / Vector database → techniczne zaplecze retrieval.
Fact-checking → retrieval dostarcza materiał do sprawdzenia.
Mini-przepływ: Pytanie → Retrieval → Kontekst → Odpowiedź

Co to w zasadzie jest?

Model językowy świetnie układa zdania, ale nie ma gwarancji, że „pamięta” Twoje dokumenty. Retrieval to moment, kiedy system mówi: „najpierw poszukajmy w źródłach, potem piszmy”. To podstawa pracy opartej na faktach, bo:

zmniejsza halucynacje,
pozwala cytować i weryfikować,
ułatwia aktualizacje (zmieniasz dokument, a nie „uczenie” modelu).

Diagram

Diagram pokazuje etap wyszukiwania informacji przed generowaniem odpowiedzi przez model.

RODO / DPIA

Kategoria: Prawo i etyka Tagi: prawo etyka zgodność rodo dpia

Definicja

RODO to przepisy o ochronie danych osobowych, a DPIA to ocena skutków dla ochrony danych przy procesach podwyższonego ryzyka.

Po co w praktyce

Scenariusz 1: Ocena nowego chatbota

Cel: ocena nowego chatbota.
Wejście: zakres danych i proces.
Kroki: mapowanie danych → ocena ryzyk → plan zabezpieczeń.
Rezultat: decyzja o wdrożeniu.
Zabezpieczenie: akceptacja właściciela procesu.

Scenariusz 2: Analiza danych klientów

Cel: analiza danych klientów.
Wejście: zbiór danych.
Kroki: minimalizacja → anonimizacja → test.
Rezultat: bezpieczniejszy proces.
Zabezpieczenie: log i kontrola dostępu.

Scenariusz 3: Audyt dostawcy AI

Cel: audyt dostawcy AI.
Wejście: umowa i dokumentacja.
Kroki: checklista RODO → identyfikacja luk → poprawki.
Rezultat: zgodność formalna.
Zabezpieczenie: przegląd prawny.

Ryzyka i jak je ograniczać

Ryzyko 1: Naruszenie danych

Ryzyko: Naruszenie danych.
Jak ograniczać: minimalizacja i szyfrowanie.

Ryzyko 2: Brak podstawy prawnej

Ryzyko: Brak podstawy prawnej.
Jak ograniczać: weryfikacja celu i podstawy.

Ryzyko 3: Brak rozliczalności

Ryzyko: Brak rozliczalności.
Jak ograniczać: audit trail i dokumentacja.

Checklista

Czy zidentyfikowano dane osobowe?
Czy wykonano ocenę DPIA?
Czy zakres danych jest minimalny?
Czy są role i dostępy?
Czy proces ma właściciela?

Dalsza lektura

Miejsce w mapie

RODO / DPIA -> wspiera: Dane osobowe (PII)
RODO / DPIA -> wymaga: Anonimizacja / pseudonimizacja
RODO / DPIA -> wspiera: Polityka użycia AI w organizacji

Co to w zasadzie jest?

RODO określa zasady legalnego przetwarzania danych.
DPIA pomaga sprawdzić ryzyka przed wdrożeniem AI.
To wymaganie procesowe, nie tylko formalność.

Typowe błędy i pułapki

Brak DPIA dla wysokiego ryzyka.
Zbyt szeroki zakres danych.
Brak dokumentacji decyzji.

Diagram

Diagram pokazuje, że przy pracy z danymi osobowymi trzeba przejść przez ocenę ryzyka i plan zabezpieczeń przed wdrożeniem.

Powiązane hasła

Dane osobowe (PII)
Anonimizacja / pseudonimizacja
DLP (Data Loss Prevention)
Polityka użycia AI w organizacji
Audit trail

Rozliczanie kosztów AI (AI chargeback)

Kategoria: Organizacja i zarządzanie Tagi: chargeback koszty budżet governance finops

Definicja

Rozliczanie kosztów AI to przypisywanie kosztów użycia modeli, narzędzi i usług AI do konkretnych zespołów, procesów, projektów albo jednostek organizacyjnych.

Po co w praktyce

Scenariusz 1: Rozliczenie użycia AI między działami

Cel: wiedzieć, który dział generuje jaki koszt.
Wejście: logi użycia, identyfikator zespołu i koszt zapytań.
Kroki: zbieranie logów -> przypisanie do działu -> raport kosztowy.
Rezultat: przejrzystość kosztów w organizacji.
Zabezpieczenie: spójne tagowanie i standard raportowania.

Scenariusz 2: Ocena opłacalności asystenta AI

Cel: porównać koszt działania z efektem biznesowym.
Wejście: koszt modelu, liczba zapytań i wynik procesu.
Kroki: pomiar kosztu -> porównanie z korzyścią -> decyzja o zmianie.
Rezultat: bardziej świadome zarządzanie budżetem AI.
Zabezpieczenie: wspólne metryki kosztu i wartości.

Scenariusz 3: Ograniczanie nadużyć i nieefektywności

Cel: wykrywać użycia, które generują wysoki koszt bez uzasadnienia.
Wejście: dane kosztowe, typy zadań i wzorce użycia.
Kroki: analiza kosztów -> identyfikacja anomalii -> korekta polityki.
Rezultat: mniej marnowania budżetu.
Zabezpieczenie: alerty kosztowe i limity użycia.

Ryzyka i jak je ograniczać

Ryzyko 1: Nieprzewidywalny wzrost kosztów

Ryzyko: nieprzewidywalny wzrost kosztów.
Jak ograniczać: wprowadź tagowanie i regularne raporty.

Ryzyko 2: Złe decyzje optymalizacyjne

Ryzyko: złe decyzje optymalizacyjne.
Jak ograniczać: łącz koszt z jakością i czasem odpowiedzi.

Ryzyko 3: Brak odpowiedzialności budżetowej

Ryzyko: brak odpowiedzialności budżetowej.
Jak ograniczać: przypisz właścicieli kosztów.

Ryzyko 4: Ukryte marnotrawstwo

Ryzyko: ukryte marnotrawstwo.
Jak ograniczać: monitoruj odchylenia i alerty.

Checklista

Czy wiadomo, kto płaci za dane użycie?
Czy koszty są tagowane do projektu albo zespołu?
Czy mierzysz koszt razem z efektem?
Czy masz progi alarmowe?
Czy raport kosztowy jest regularny i czytelny?

Miejsce w mapie

Rozliczanie kosztów AI (AI chargeback) → wspiera: Zarządzanie kosztami AI

Rozliczanie kosztów AI (AI chargeback) → wspiera: Prompt routing (kierowanie zapytań)

Rozliczanie kosztów AI (AI chargeback) → wymaga: Observability (obserwowalność)

Co to w zasadzie jest?

To sposób kontrolowania, kto generuje koszt i za co dokładnie płaci organizacja. Bez tego łatwo zauważyć tylko rosnący rachunek, ale trudno zrozumieć, które zastosowania są opłacalne, a które nie.

Chargeback pomaga:

widzieć koszt per zespół,
porównywać opłacalność zastosowań,
ograniczać marnowanie zasobów,
wspierać decyzje o routingu i fallbacku.

Typowe błędy i pułapki

Brak tagowania kosztów do zespołów.
Analiza tylko łącznego rachunku.
Oderwanie kosztów od jakości i efektu biznesowego.
Brak progów alarmowych.

Diagram

Diagram pokazuje, że rozliczanie kosztów AI zaczyna się od logów i tagów, a kończy na decyzjach budżetowych i optymalizacji.

Powiązane hasła

Zarządzanie kosztami AI

Prompt routing (kierowanie zapytań)

Observability (obserwowalność)

Monitoring jakości

Model zapasowy (Fallback model)

Sandboxing (piaskownica bezpieczeństwa)

Kategoria: Bezpieczeństwo Tagi: bezpieczeństwo ryzyko ochrona sandboxing

Definicja

Sandboxing to uruchamianie narzędzi lub kodu w odizolowanym środowisku, które ma ograniczony dostęp do systemu, plików i sieci.

Po co w praktyce

Scenariusz 1: Uruchamianie generatora raportu w kontenerze bez dostępu do prywatnych plików

Cel: uruchamianie generatora raportu w kontenerze bez dostępu do prywatnych plików.
Wejście: kod, narzędzie albo akcja AI.
Kroki: uruchom w izolacji -> ogranicz uprawnienia -> sprawdź wynik.
Rezultat: bezpieczniejsze wykonanie.
Zabezpieczenie: brak dostępu do produkcji i limit zasobów.

Scenariusz 2: Testowanie skryptu na kopii danych, nie na produkcji

Cel: testowanie skryptu na kopii danych, nie na produkcji.
Wejście: kod, narzędzie albo akcja AI.
Kroki: uruchom w izolacji -> ogranicz uprawnienia -> sprawdź wynik.
Rezultat: bezpieczniejsze wykonanie.
Zabezpieczenie: brak dostępu do produkcji i limit zasobów.

Scenariusz 3: Ograniczenie narzędzi AI do „read-only” w repo

Cel: ograniczenie narzędzi AI do „read-only” w repo.
Wejście: kod, narzędzie albo akcja AI.
Kroki: uruchom w izolacji -> ogranicz uprawnienia -> sprawdź wynik.
Rezultat: bezpieczniejsze wykonanie.
Zabezpieczenie: brak dostępu do produkcji i limit zasobów.

Ryzyka i jak je ograniczać

Ryzyko 1: Piaskownica źle skonfigurowana (za dużo uprawnień)

Ryzyko: piaskownica źle skonfigurowana (za dużo uprawnień).
Jak ograniczać: zasada najmniejszych uprawnień + audyt konfiguracji.

Ryzyko 2: Fałszywe poczucie bezpieczeństwa

Ryzyko: fałszywe poczucie bezpieczeństwa.
Jak ograniczać: monitoring + logi + testy bezpieczeństwa.

Ryzyko 3: Utrudnienie pracy (za mocne ograniczenia)

Ryzyko: utrudnienie pracy (za mocne ograniczenia).
Jak ograniczać: stopniowe rozszerzanie uprawnień, ale tylko gdy konieczne.

Miejsce w mapie

Tool calling → narzędzia uruchamiaj w sandboxie, gdy to możliwe.
SSO/IAM → kontrola kto ma prawo uruchamiać co.
Audit trail → loguj działania w sandboxie.
DLP → ogranicz wyciek danych z piaskownicy.
Mini-przepływ: Model → narzędzie → sandbox → wynik → model

Co to w zasadzie jest?

Jeśli AI ma wykonywać działania (np. uruchomić skrypt), to lepiej, żeby robiła to w „bezpiecznym pudełku”, z którego nie może wyjść i narobić szkód. Piaskownica ogranicza:

jakie pliki można czytać/pisać,
czy jest dostęp do internetu,
jakie komendy są dozwolone,
ile CPU/czasu można zużyć.

Diagram

Diagram pokazuje, że narzędzie wykonywane przez AI powinno działać w odizolowanym środowisku.

Secrets management (zarządzanie sekretami)

Kategoria: Bezpieczeństwo Tagi: bezpieczenstwo sekrety wdrozenia api llmops

Definicja

Secrets management to sposób bezpiecznego przechowywania i używania sekretów, np. kluczy API, tokenów dostępowych, haseł i certyfikatów.

Po co w praktyce

Scenariusz 1: Klucze API w CI/CD

Cel: bezpieczne uruchamianie automatyzacji.
Wejście: klucz API potrzebny w pipeline.
Kroki: zapisz w secrets managerze -> użyj jako zmiennej -> ukryj w logach.
Rezultat: klucz nie trafia do kodu.
Zabezpieczenie: rotacja i ograniczone uprawnienia.

Scenariusz 2: Oddzielenie środowisk

Cel: ograniczenie skutków wycieku.
Wejście: sekrety dla dev, test i prod.
Kroki: rozdziel sekrety -> nadaj role -> monitoruj użycie.
Rezultat: wyciek w dev nie daje dostępu do prod.
Zabezpieczenie: least privilege.

Scenariusz 3: Skanowanie repo

Cel: wykrycie przypadkowo dodanych sekretów.
Wejście: kod i historia repo.
Kroki: skan -> alert -> rotacja sekretu.
Rezultat: szybsza reakcja na wyciek.
Zabezpieczenie: blokady przed commitem.

Ryzyka i jak je ograniczać

Ryzyko 1: Wyciek klucza w repo lub logach

Ryzyko: Wyciek klucza w repo lub logach.
Jak ograniczać: skanuj sekrety, redaguj logi i rotuj klucze.

Ryzyko 2: Wklejenie sekretu do promptu

Ryzyko: Wklejenie sekretu do promptu.
Jak ograniczać: stosuj szkolenia, DLP i blokady wzorców.

Ryzyko 3: Za szerokie uprawnienia

Ryzyko: Za szerokie uprawnienia.
Jak ograniczać: ogranicz zakres, IP i czas ważności sekretu.

Checklista

Czy sekret jest poza kodem?
Czy ma minimalne uprawnienia?
Czy jest rotowany?
Czy użycie sekretu jest logowane?
Czy pipeline ukrywa sekret w logach?

Dalsza lektura

Miejsce w mapie

Secrets management → chroni dostęp do: API
Secrets management → wspiera: SSO / IAM
Secrets management → powinien być monitorowany przez: Audit trail

Co to w zasadzie jest?

Sekret to klucz do drzwi. Nie wkładasz go do publicznego repo i nie wklejasz do promptu. Trzymasz go w sejfie, czyli w menedżerze sekretów.

Jeśli sekret wycieknie, ktoś może podszyć się pod Twoją aplikację albo wyciągnąć dane. To częsty problem bezpieczeństwa: klucz trafia do repo, logów albo historii gita.

Dobre zarządzanie sekretami oznacza proste zasady: sekrety są w dedykowanym miejscu, mają minimalne uprawnienia, są rotowane i monitorowane.

Diagram

Diagram pokazuje, że sekrety powinny trafiać do aplikacji i pipeline z sejfu, a nie z repozytorium.

Powiązane hasła

API
SSO / IAM
DLP
Audit trail
LLMOps

Security review (przegląd bezpieczeństwa)

Kategoria: Bezpieczeństwo Tagi: bezpieczeństwo ryzyko ochrona security review

Definicja

Security review to uporządkowany przegląd systemu AI pod kątem ryzyk i zabezpieczeń: danych, narzędzi, promptów, logów i integracji.

Po co w praktyce

Scenariusz 1: Checklista przed wdrożeniem

Cel: DLP, uprawnienia, testy ataków, logi.
Wejście: zmiana systemu albo nowa integracja.
Kroki: sprawdź ryzyka -> przetestuj zabezpieczenia -> opisz decyzję.
Rezultat: mniejsze ryzyko wdrożenia podatności.
Zabezpieczenie: checklista i właściciel ryzyka.

Scenariusz 2: Przegląd RAG

Cel: jakie źródła, kto je edytuje, jak walidujemy.
Wejście: zmiana systemu albo nowa integracja.
Kroki: sprawdź ryzyka -> przetestuj zabezpieczenia -> opisz decyzję.
Rezultat: mniejsze ryzyko wdrożenia podatności.
Zabezpieczenie: checklista i właściciel ryzyka.

Scenariusz 3: Przegląd agentów

Cel: ile narzędzi, jakie limity, gdzie akceptacja człowieka.
Wejście: zmiana systemu albo nowa integracja.
Kroki: sprawdź ryzyka -> przetestuj zabezpieczenia -> opisz decyzję.
Rezultat: mniejsze ryzyko wdrożenia podatności.
Zabezpieczenie: checklista i właściciel ryzyka.

Ryzyka i jak je ograniczać

Ryzyko 1: Review jest „na papierze”

Ryzyko: review jest „na papierze”.
Jak ograniczać: testy praktyczne, red teaming, scenariusze ataków.

Ryzyko 2: Review tylko raz, a system się zmienia

Ryzyko: review tylko raz, a system się zmienia.
Jak ograniczać: cykliczność (np. kwartalnie) i po dużych zmianach.

Ryzyko 3: Brak właściciela

Ryzyko: brak właściciela.
Jak ograniczać: przypisz rolę i proces.

Miejsce w mapie

Red teaming → testy ofensywne w ramach review.
DLP / PII → ochrona danych.
Prompt injection / Prompt guard → ochrona promptów.
Audit trail / Observability → widoczność i odpowiedzialność.
Mini-przepływ: Zasoby → ryzyka → zabezpieczenia → testy → decyzja

Co to w zasadzie jest?

To kontrola: „czy to, co budujemy, nie zrobi nam krzywdy”. W AI warto sprawdzać:

czy nie wycieka PII,
czy narzędzia są ograniczone,
czy prompt injection jest uwzględniony,
czy logi są bezpieczne,
czy jest audit trail i monitoring.

Nie chodzi o „idealne bezpieczeństwo”, tylko o sensowne warstwy ochrony.

Diagram

Diagram pokazuje uporządkowany przegląd ryzyk i zabezpieczeń przed wdrożeniem systemu.

Shadow AI (Szara strefa AI)

Kategoria: Bezpieczeństwo Tagi: shadow ai bezpieczeństwo polityka ai dane ryzyko

Definicja

Shadow AI to korzystanie przez pracowników z narzędzi AI bez wiedzy, zgody albo nadzoru działu IT, bezpieczeństwa lub organizacji.

Po co w praktyce

Scenariusz 1: Marketing używa publicznego czata AI

Cel: szybko przygotować streszczenie strategii albo szkic kampanii.
Wejście: dokument wewnętrzny, opis kampanii, dane planistyczne.
Kroki: wklejenie treści -> wygenerowanie streszczenia -> wykorzystanie wyniku.
Rezultat: oszczędność czasu, ale bez kontroli nad danymi.
Zabezpieczenie: zatwierdzone narzędzie firmowe i zasady pracy na treści poufnej.

Scenariusz 2: Dział obsługi klienta tworzy odpowiedzi przez prywatne konto

Cel: szybciej odpowiadać na wiadomości klientów.
Wejście: treść zgłoszenia, historia sprawy, dane kontaktowe.
Kroki: kopiowanie zgłoszenia -> generowanie odpowiedzi -> ręczne wysłanie.
Rezultat: szybsza praca, ale ryzyko wycieku danych.
Zabezpieczenie: anonimizacja i oficjalne narzędzie z polityką bezpieczeństwa.

Scenariusz 3: Zespół projektowy używa kilku niezatwierdzonych narzędzi

Cel: przyspieszyć analizy, notatki i pracę koncepcyjną.
Wejście: notatki projektowe, ustalenia z klientem, pliki robocze.
Kroki: użycie różnych narzędzi -> mieszanie wyników -> brak śladu działań.
Rezultat: chaos narzędziowy i brak kontroli nad obiegiem informacji.
Zabezpieczenie: katalog dopuszczonych narzędzi i szkolenie użytkowników.

Ryzyka i jak je ograniczać

Ryzyko 1: Wyciek danych

Ryzyko: wyciek danych.
Jak ograniczać: stosuj DLP, anonimizację i zatwierdzone narzędzia.

Ryzyko 2: Brak zgodności

Ryzyko: brak zgodności.
Jak ograniczać: wprowadź politykę użycia AI i jasne zasady.

Ryzyko 3: Brak audytu

Ryzyko: brak audytu.
Jak ograniczać: loguj użycie narzędzi tam, gdzie to możliwe.

Ryzyko 4: Chaos operacyjny

Ryzyko: chaos operacyjny.
Jak ograniczać: ogranicz liczbę narzędzi i przypisz właścicieli procesów.

Checklista

Czy to narzędzie jest zatwierdzone przez organizację?
Czy wklejane dane są bezpieczne?
Czy można usunąć dane osobowe albo poufne?
Czy wiadomo, kto odpowiada za wynik?
Czy organizacja ma politykę użycia AI?

Miejsce w mapie

Shadow AI (Szara strefa AI) → wymaga: Polityka użycia AI w organizacji

Shadow AI (Szara strefa AI) → zwiększa wagę: DLP

Shadow AI (Szara strefa AI) → wspiera potrzebę: Ślad audytowy

Co to w zasadzie jest?

To sytuacja, w której AI działa w firmie „bokiem”. Nie ma formalnego wdrożenia, ale pracownicy i tak używają narzędzi do streszczeń, analiz, tłumaczeń albo generowania treści.

Problem nie polega na samym użyciu AI. Problem polega na tym, że organizacja nie wie:

jakie dane są wklejane,
do jakich narzędzi trafiają,
kto z nich korzysta,
jakie ryzyko prawne i bezpieczeństwa z tego wynika.

Typowe błędy i pułapki

Zakazanie AI bez dania bezpiecznej alternatywy.
Założenie, że problem dotyczy tylko działu IT.
Brak polityki użycia AI.
Ignorowanie prywatnych kont i darmowych narzędzi.

Diagram

Diagram pokazuje, że shadow AI zaczyna się od potrzeby szybkiego działania, ale kończy się brakiem kontroli nad danymi i procesem.

Powiązane hasła

Polityka użycia AI w organizacji

Dane osobowe (PII)

Ślad audytowy

SSO / IAM (zarządzanie tożsamością i dostępem)

---

Small Language Model (SLM)

Kategoria: Modele i dane Tagi: slm model językowy model lokalny inferencja optymalizacja

Definicja

Small Language Model (SLM) to mniejszy model językowy zoptymalizowany pod szybkość, koszt, wdrożenie lokalne albo konkretne zadania.

Po co w praktyce

Scenariusz 1: Klasyfikacja maili

Cel: automatycznie przypisywać wiadomości do kategorii.
Wejście: treść maila i reguły klasyfikacji.
Kroki: przygotowanie modelu -> uruchomienie na serwerze -> ocena wyników.
Rezultat: szybsze sortowanie wiadomości.
Zabezpieczenie: benchmark jakości i monitoring błędów.

Scenariusz 2: Lokalny asystent dla pracowników

Cel: dać szybkie wsparcie bez wysyłania danych do zewnętrznej chmury.
Wejście: pytania użytkowników i lokalna baza wiedzy.
Kroki: wdrożenie modelu -> podłączenie wiedzy -> test użycia.
Rezultat: prosty asystent działający blisko danych organizacji.
Zabezpieczenie: kontrola zakresu odpowiedzi i logowanie użycia.

Scenariusz 3: Działanie na słabszym sprzęcie

Cel: uruchomić model bez drogiej infrastruktury.
Wejście: model, dostępny sprzęt i wymagania procesu.
Kroki: wybór SLM -> test wydajności -> wdrożenie.
Rezultat: działające rozwiązanie przy niższym koszcie.
Zabezpieczenie: test jakości na realnych zadaniach.

Ryzyka i jak je ograniczać

Ryzyko 1: Za słaba jakość

Ryzyko: za słaba jakość.
Jak ograniczać: porównuj model z większym wariantem na benchmarku.

Ryzyko 2: Niedopasowanie do zadania

Ryzyko: niedopasowanie do zadania.
Jak ograniczać: wybieraj model pod konkretny proces, nie ogólnie.

Ryzyko 3: Błędne poczucie oszczędności

Ryzyko: błędne poczucie oszczędności.
Jak ograniczać: licz także koszt testów, integracji i utrzymania.

Ryzyko 4: Brak skalowalności

Ryzyko: brak skalowalności.
Jak ograniczać: przewiduj, kiedy SLM przestanie wystarczać.

Checklista

Czy zadanie jest dobrze zdefiniowane?
Czy mały model daje akceptowalną jakość?
Czy ważniejszy jest koszt, szybkość czy uniwersalność?
Czy model ma działać lokalnie?
Czy wykonano testy porównawcze?

Miejsce w mapie

Small Language Model (SLM) → wspiera: Model lokalny

Small Language Model (SLM) → wspiera: Kwantyzacja (Quantization)

Small Language Model (SLM) → wymaga: Ewaluacja

Co to w zasadzie jest?

To model językowy, który jest mniejszy niż klasyczne duże modele ogólnego przeznaczenia. Zwykle potrzebuje mniej pamięci, szybciej działa i łatwiej go wdrożyć bliżej danych albo użytkownika.

SLM nie musi być „gorszy”. W wielu prostszych zadaniach może być bardziej praktyczny, bo jest:

tańszy,
szybszy,
łatwiejszy do kontrolowania,
prostszy do uruchomienia lokalnie.

Typowe błędy i pułapki

Oczekiwanie, że mały model zrobi wszystko.
Brak dopasowania modelu do konkretnego zadania.
Ignorowanie ograniczeń jakościowych.
Wybór modelu tylko na podstawie rozmiaru.

Diagram

Diagram pokazuje, że SLM wybiera się wtedy, gdy potrzebne jest tańsze i prostsze wdrożenie, ale po sprawdzeniu jakości.

Powiązane hasła

Model lokalny

Kwantyzacja (Quantization)

Inferencja (inference)

Zarządzanie kosztami AI

Benchmark

---

SSO / IAM (zarządzanie tożsamością i dostępem)

Kategoria: Bezpieczeństwo Tagi: bezpieczeństwo ryzyko ochrona sso iam

Definicja

SSO (Single Sign-On) i IAM (Identity and Access Management) to rozwiązania do zarządzania kontami i uprawnieniami: kto ma dostęp do jakich danych i funkcji.

Po co w praktyce

Scenariusz 1: Asystent pokazuje tylko procedury działu użytkownika

Cel: asystent pokazuje tylko procedury działu użytkownika.
Wejście: konto użytkownika, rola i zasób.
Kroki: zaloguj użytkownika -> sprawdź rolę -> nadaj dostęp.
Rezultat: dostęp zgodny z uprawnieniami.
Zabezpieczenie: least privilege i szybkie odbieranie dostępu.

Scenariusz 2: Logowanie do narzędzi AI kontem służbowym

Cel: logowanie do narzędzi AI kontem służbowym.
Wejście: konto użytkownika, rola i zasób.
Kroki: zaloguj użytkownika -> sprawdź rolę -> nadaj dostęp.
Rezultat: dostęp zgodny z uprawnieniami.
Zabezpieczenie: least privilege i szybkie odbieranie dostępu.

Scenariusz 3: Szybkie odbieranie dostępu przy zmianie stanowiska

Cel: szybkie odbieranie dostępu przy zmianie stanowiska.
Wejście: konto użytkownika, rola i zasób.
Kroki: zaloguj użytkownika -> sprawdź rolę -> nadaj dostęp.
Rezultat: dostęp zgodny z uprawnieniami.
Zabezpieczenie: least privilege i szybkie odbieranie dostępu.

Ryzyka i jak je ograniczać

Ryzyko 1: Wycieki

Ryzyko: Wycieki.
Jak ograniczać: role, segmentacja, DLP.

Ryzyko 2: Nadużycia kont

Ryzyko: Nadużycia kont.
Jak ograniczać: MFA i monitoring.

Ryzyko 3: Brak audytu

Ryzyko: Brak audytu.
Jak ograniczać: audit trail.

Checklista

Czy jest SSO i MFA?
Czy role są zdefiniowane?
Czy dostęp do danych jest minimalny?
Czy logujesz dostęp i akcje?
Czy jest proces offboarding?

Dalsza lektura

Miejsce w mapie

SSO/IAM → kontroluje: Konektory danych
SSO/IAM → wspiera: Audit trail
SSO/IAM → ogranicza ryzyko: PII

Co to w zasadzie jest?

SSO = jedno logowanie do wielu systemów.
IAM = zasady uprawnień (role, grupy, dostęp).
Dla AI to kluczowe: asystent nie może „widzieć” więcej niż użytkownik.

Typowe błędy i pułapki

Wspólne konta „dla wszystkich”.
Brak zasady najmniejszych uprawnień.

Diagram

Diagram pokazuje, że logowanie i uprawnienia decydują, do jakich danych i funkcji ma dostęp użytkownik i asystent.

Powiązane hasła

Audit trail
DLP
PII
Konektory danych
Polityka użycia AI

Stack

Kategoria: Wdrożenia i operacje (LLMOps) Tagi: llmops wdrozenia operacje stack

Definicja

Stack to zestaw technologii i usług, które razem tworzą działające rozwiązanie AI. Obejmuje dane, modele, aplikacje, infrastrukturę i bezpieczeństwo. To pojęcie architektoniczne, nie produkt.

Po co w praktyce

Scenariusz 1: Uruchomienie asystenta AI

Cel: uruchomienie asystenta AI.
Wejście: wymagania biznesowe.
Kroki: wybór danych → model → aplikacja → zabezpieczenia.
Rezultat: działający system.
Zabezpieczenie: testy i monitoring.

Scenariusz 2: Automatyzacja raportów

Cel: automatyzacja raportów.
Wejście: źródła danych.
Kroki: integracje → analiza → publikacja.
Rezultat: raporty cykliczne.
Zabezpieczenie: kontrola jakości.

Scenariusz 3: Skalowanie rozwiązania

Cel: skalowanie rozwiązania.
Wejście: wzrost użytkowników.
Kroki: optymalizacja → monitoring → kosztorys.
Rezultat: stabilna wydajność.
Zabezpieczenie: SLA i alerty.

Ryzyka i jak je ograniczać

Ryzyko 1: Vendor lock-in

Ryzyko: Vendor lock-in.
Jak ograniczać: standardy i plan migracji.

Ryzyko 2: Braki bezpieczeństwa

Ryzyko: Braki bezpieczeństwa.
Jak ograniczać: audyty i polityki.

Ryzyko 3: Problemy z kosztami

Ryzyko: Problemy z kosztami.
Jak ograniczać: monitoring i limity.

Checklista

Czy warstwy stacku są jasno opisane?
Czy wiesz, kto odpowiada za każdą warstwę?
Czy masz plan migracji?
Czy są testy integracyjne?
Czy monitorujesz koszty i wydajność?

Dalsza lektura

Miejsce w mapie

Stack → obejmuje: RAG
Stack → wymaga: SSO / IAM
Stack → wspiera: Audit trail

Co to w zasadzie jest?

Stack to „układanka” z kilku warstw.
Każda warstwa ma swoją rolę i dostawcę.
Dobrze zaprojektowany stack ułatwia rozwój i bezpieczeństwo.
Zły stack utrudnia utrzymanie i zwiększa koszty.

Typowe błędy i pułapki

Dobór narzędzi bez testów integracji.
Zależność od jednego dostawcy.
Brak dokumentacji architektury.

Diagram

Diagram pokazuje warstwy technologiczne, które razem tworzą działające rozwiązanie AI.

Powiązane hasła

Tenant
Model lokalny
RAG
SSO / IAM
Audit trail

Stronniczość

Kategoria: Prawo i etyka Tagi:

Definicja

Stronniczość to sytuacja, w której model częściej faworyzuje jedne grupy lub rozwiązania, a inne traktuje gorzej.

Po co w praktyce

Scenariusz 1: Klasyfikacja zgłoszeń

Cel: klasyfikacja zgłoszeń: czy nie zaniża priorytetu wybranych tematów?.
Wejście: wyniki modelu dla różnych grup albo tematów.
Kroki: zbierz próbki -> porównaj wyniki -> popraw proces.
Rezultat: mniejsze ryzyko nierównego traktowania.
Zabezpieczenie: przegląd człowieka i testy na zróżnicowanych danych.

Scenariusz 2: Wzory odpowiedzi

Cel: wzory odpowiedzi: czy język nie jest wykluczający?.
Wejście: wyniki modelu dla różnych grup albo tematów.
Kroki: zbierz próbki -> porównaj wyniki -> popraw proces.
Rezultat: mniejsze ryzyko nierównego traktowania.
Zabezpieczenie: przegląd człowieka i testy na zróżnicowanych danych.

Scenariusz 3: Rekrutacje

Cel: rekrutacje: unikać automatycznych ocen bez kontroli.
Wejście: wyniki modelu dla różnych grup albo tematów.
Kroki: zbierz próbki -> porównaj wyniki -> popraw proces.
Rezultat: mniejsze ryzyko nierównego traktowania.
Zabezpieczenie: przegląd człowieka i testy na zróżnicowanych danych.

Ryzyka i jak je ograniczać

Ryzyko 1: Nierówne traktowanie

Ryzyko: Nierówne traktowanie.
Jak ograniczać: testy, kryteria oceny i przegląd wyników.

Ryzyko 2: Skargi i reputacja

Ryzyko: Skargi i reputacja.
Jak ograniczać: transparentność + poprawki.

Ryzyko 3: Błędy procesowe

Ryzyko: Błędy procesowe.
Jak ograniczać: polityka, monitoring.

Checklista

Czy testuję na różnych przykładach?
Czy mam kryteria oceny?
Czy człowiek zatwierdza wyniki?
Czy mogę wyjaśnić decyzję?
Czy mam procedurę korekty?

Dalsza lektura

Miejsce w mapie

Bias → kontroluje: Ewaluacja
Bias → wymaga: Transparentność
Bias → wpływa na: Polityka AI

Co to w zasadzie jest?

Model uczy się na danych z przeszłości. Te dane mogą być niesprawiedliwe.
Stronniczość może być ukryta i nieintencjonalna.
W firmie ryzyko dotyczy między innymi komunikacji i automatycznej klasyfikacji spraw.

Typowe błędy i pułapki

Brak testów na różnych przypadkach.
Założenie, że „model jest neutralny”.

Diagram

Diagram pokazuje, że stronniczość trzeba wykrywać i ograniczać przez testy, poprawki i stały monitoring.

Powiązane hasła

Ewaluacja
Benchmark
Polityka użycia AI
Human-in-the-loop
Transparentność

Structured output (ustrukturyzowany wynik)

Kategoria: Prompting Tagi: modele dane ai structured output prompting prompty

Definicja

Structured output to sytuacja, w której AI zwraca wynik w ściśle określonym formacie (np. JSON, YAML, tabela), zamiast „luźnego tekstu”.

Po co w praktyce

Scenariusz 1: Generowanie listy zadań jako JSON (tytuł, termin, priorytet)

Cel: generowanie listy zadań jako JSON (tytuł, termin, priorytet).
Wejście: schemat danych i prompt.
Kroki: wygeneruj wynik -> waliduj schemat -> popraw błędy.
Rezultat: dane gotowe do dalszej automatyzacji.
Zabezpieczenie: schema validation i fallback.

Scenariusz 2: Wynik analizy dokumentu jako tabela (sekcja, problem, rekomendacja)

Cel: wynik analizy dokumentu jako tabela (sekcja, problem, rekomendacja).
Wejście: schemat danych i prompt.
Kroki: wygeneruj wynik -> waliduj schemat -> popraw błędy.
Rezultat: dane gotowe do dalszej automatyzacji.
Zabezpieczenie: schema validation i fallback.

Scenariusz 3: Dane do publikacji jako YAML (tytuł, lead, CTA)

Cel: dane do publikacji jako YAML (tytuł, lead, CTA).
Wejście: schemat danych i prompt.
Kroki: wygeneruj wynik -> waliduj schemat -> popraw błędy.
Rezultat: dane gotowe do dalszej automatyzacji.
Zabezpieczenie: schema validation i fallback.

Ryzyka i jak je ograniczać

Ryzyko 1: Model psuje format (brakuje przecinka, pola)

Ryzyko: model psuje format (brakuje przecinka, pola).
Jak ograniczać: walidacja schematu + poprawki automatyczne + krótkie formaty.

Ryzyko 2: Model „dopisuje” pola, których nie chcesz

Ryzyko: model „dopisuje” pola, których nie chcesz.
Jak ograniczać: whitelist pól + odrzucanie nieznanych.

Ryzyko 3: W formacie ukryją się dane wrażliwe

Ryzyko: w formacie ukryją się dane wrażliwe.
Jak ograniczać: filtry PII, DLP, minimalizacja.

Miejsce w mapie

Function calling → wymaga ustrukturyzowanych parametrów.
API → integracje lubią JSON.
DLP / PII → bezpieczeństwo danych w strukturze.
Ewaluacja → łatwiej mierzyć poprawność.
Mini-przepływ: Prompt → JSON → walidacja → użycie w systemie

Co to w zasadzie jest?

Gdy chcesz, aby AI współpracowała z innymi systemami, „ładny tekst” nie wystarczy. Potrzebujesz formatu, który da się:

zaczytać,
zwalidować,
automatycznie przetworzyć.

To ogranicza błędy i ułatwia automatyzacje.

Diagram

Diagram pokazuje, że wynik modelu może być zwracany w ustalonym formacie gotowym do dalszego użycia.

System wieloagentowy (Multi-agent system)

Kategoria: Organizacja i zarządzanie Tagi: agenci orkiestracja automatyzacja workflow architektura

Definicja

System wieloagentowy to architektura, w której kilka wyspecjalizowanych agentów AI współpracuje przy jednym zadaniu, wymieniając informacje i wyniki pośrednie.

Po co w praktyce

Scenariusz 1: Tworzenie raportu z dokumentów

Cel: przygotować raport na podstawie wielu źródeł.
Wejście: zestaw dokumentów, pytanie użytkownika i format raportu.
Kroki: agent wyszukuje -> agent analizuje -> agent redaguje wynik.
Rezultat: raport końcowy z podziałem pracy między agentami.
Zabezpieczenie: weryfikacja wyniku przez człowieka albo agenta kontrolnego.

Scenariusz 2: Obsługa zgłoszeń klientów

Cel: szybciej przetwarzać zgłoszenia.
Wejście: treść zgłoszenia, dane sprawy i reguły obsługi.
Kroki: klasyfikacja -> wybór ścieżki -> przygotowanie odpowiedzi.
Rezultat: sprawa trafia do właściwego procesu.
Zabezpieczenie: reguły eskalacji i logowanie kroków.

Scenariusz 3: Audyt jakości treści

Cel: sprawdzić tekst pod kątem zgodności, stylu i braków.
Wejście: dokument roboczy i kryteria oceny.
Kroki: agent ocenia zgodność -> agent sprawdza styl -> agent zbiera poprawki.
Rezultat: uporządkowana lista uwag do poprawy.
Zabezpieczenie: stała rubryka oceny i nadzór właściciela treści.

Ryzyka i jak je ograniczać

Ryzyko 1: Błąd jednego agenta psuje cały proces

Ryzyko: błąd jednego agenta psuje cały proces.
Jak ograniczać: wprowadź etap kontroli i walidacji.

Ryzyko 2: Chaos w przepływie pracy

Ryzyko: chaos w przepływie pracy.
Jak ograniczać: opisz role, wejścia i wyjścia każdego agenta.

Ryzyko 3: Brak śladu audytowego

Ryzyko: brak śladu audytowego.
Jak ograniczać: loguj działania i decyzje pośrednie.

Ryzyko 4: Zbyt duża autonomia

Ryzyko: zbyt duża autonomia.
Jak ograniczać: ogranicz uprawnienia i stosuj human-in-the-loop.

Checklista

Czy role agentów są jasno rozdzielone?
Czy każdy etap ma wejście i wyjście?
Czy jest etap kontroli jakości?
Czy wiadomo, kto odpowiada za wynik końcowy?
Czy system ma logowanie działań?

Miejsce w mapie

System wieloagentowy (Multi-agent system) → wspiera: Przepływ agentowy

System wieloagentowy (Multi-agent system) → wymaga: Orkiestracja (workflow)

System wieloagentowy (Multi-agent system) → zwiększa wagę: Human-in-the-loop (człowiek w pętli)

Co to w zasadzie jest?

Zamiast jednego agenta do wszystkiego, masz kilka agentów z różnymi rolami. Jeden szuka danych, drugi je analizuje, trzeci sprawdza jakość, a czwarty przygotowuje wynik końcowy.

To podejście przydaje się wtedy, gdy zadanie:

ma kilka etapów,
wymaga różnych kompetencji,
potrzebuje kontroli jakości albo podziału odpowiedzialności.

Typowe błędy i pułapki

Zbyt skomplikowany podział ról.
Dublowanie pracy przez kilku agentów.
Brak jasnych zasad przekazywania danych.
Brak odpowiedzialności za wynik końcowy.

Diagram

Diagram pokazuje, że system wieloagentowy dzieli złożone zadanie na kilka ról i przekazuje wynik etapami.

Powiązane hasła

Agent AI

Przepływ agentowy

Orkiestracja (workflow)

Human-in-the-loop (człowiek w pętli)

Ślad audytowy

---

Temperatura / sampling

Kategoria: Modele i dane Tagi: modele dane ai temperatura sampling

Definicja

Temperatura i sampling to ustawienia, które sterują tym, jak bardzo odpowiedzi modelu są „zachowawcze” albo „kreatywne”.

Po co w praktyce

Scenariusz 1: Pismo firmowe

Cel: pismo firmowe.
Wejście: zadanie i ustawienia generowania.
Kroki: dobierz ustawienie: niska temperatura -> wygeneruj wynik -> sprawdź jakość.
Rezultat: spójny styl.
Zabezpieczenie: review.

Scenariusz 2: Burza mózgów do kampanii informacyjnej

Cel: burza mózgów do kampanii informacyjnej.
Wejście: zadanie i ustawienia generowania.
Kroki: dobierz ustawienie: średnia/wysoka -> wygeneruj wynik -> sprawdź jakość.
Rezultat: więcej pomysłów.
Zabezpieczenie: selekcja i weryfikacja faktów.

Scenariusz 3: Podsumowania spotkań

Cel: podsumowania spotkań.
Wejście: zadanie i ustawienia generowania.
Kroki: dobierz ustawienie: niska/średnia -> wygeneruj wynik -> sprawdź jakość.
Rezultat: mniej „fantazji”.
Zabezpieczenie: porównanie z notatkami.

Ryzyka i jak je ograniczać

Ryzyko 1: Niespójność odpowiedzi

Ryzyko: Niespójność odpowiedzi.
Jak ograniczać: ustal profile (np. „firmowy”, „kreatywny”).

Ryzyko 2: Halucynacje

Ryzyko: Halucynacje.
Jak ograniczać: grounding + źródła.

Ryzyko 3: Trudna kontrola jakości

Ryzyko: Trudna kontrola jakości.
Jak ograniczać: ewaluacja + monitoring.

Checklista

Czy to treść formalna czy kreatywna?
Czy masz zdefiniowane profile ustawień?
Czy wynik ma źródła?
Czy ktoś zatwierdza treści publiczne?
Czy logujesz parametry?

Dalsza lektura

Miejsce w mapie

Temperatura → wpływa na: Halucynacje
Temperatura → ustawiana w: API
Temperatura → testowana przez: Ewaluacja

Co to w zasadzie jest?

Niska temperatura = bardziej przewidywalnie i powtarzalnie.
Wysoka temperatura = większa różnorodność, ale rośnie ryzyko błędów.
Dla organizacji zwykle lepiej zaczynać nisko.

Typowe błędy i pułapki

Zbyt wysoka temperatura w treściach formalnych.
Brak stałych ustawień dla procesu (raz tak, raz inaczej).

Diagram

Diagram pokazuje wpływ ustawień generowania na przewidywalność lub kreatywność odpowiedzi.

Powiązane hasła

Halucynacje
Ewaluacja
Prompt
Agent AI
API

Tenant

Kategoria: Wdrożenia i operacje (LLMOps) Tagi: llmops wdrozenia operacje tenant

Definicja

Tenant to odseparowana przestrzeń organizacji w systemie współdzielonym, z własnymi danymi i ustawieniami. W modelu wielodzierżawnym wiele firm korzysta z jednej platformy, ale dane pozostają rozdzielone. To pojęcie architektury usług.

Po co w praktyce

Scenariusz 1: SaaS z AI dla wielu firm

Cel: SaaS z AI dla wielu firm.
Wejście: konfiguracja tenantów.
Kroki: wydzielenie → role → testy.
Rezultat: bezpieczny dostęp.
Zabezpieczenie: audyty izolacji.

Scenariusz 2: Różne działy w jednej organizacji

Cel: różne działy w jednej organizacji.
Wejście: polityki dostępu.
Kroki: tenant per dział → ograniczenia → monitoring.
Rezultat: kontrola danych.
Zabezpieczenie: minimalne uprawnienia.

Scenariusz 3: Oddzielne bazy RAG

Cel: oddzielne bazy RAG.
Wejście: dokumenty działowe.
Kroki: separacja → indeks → kontrola.
Rezultat: spójne odpowiedzi.
Zabezpieczenie: wersjonowanie.

Ryzyka i jak je ograniczać

Ryzyko 1: Wycieki danych

Ryzyko: Wycieki danych.
Jak ograniczać: testy izolacji i audyt.

Ryzyko 2: Błędy uprawnień

Ryzyko: Błędy uprawnień.
Jak ograniczać: zasada minimalnych uprawnień.

Ryzyko 3: Brak śladu audytu

Ryzyko: Brak śladu audytu.
Jak ograniczać: logowanie dostępu.

Checklista

Czy izolacja danych jest przetestowana?
Czy role są jasno zdefiniowane?
Czy masz monitoring dostępu?
Czy logujesz działania użytkowników?
Czy masz procedurę reagowania na incydenty?

Dalsza lektura

Miejsce w mapie

Tenant → wspiera: RAG
Tenant → wymaga: SSO / IAM
Tenant → zwiększa wagę: Audit trail

Co to w zasadzie jest?

To jak osobne „konto” w jednej wspólnej platformie.
Każdy tenant ma swoje dane, użytkowników i ustawienia.
Pozwala obniżyć koszty, ale wymaga dobrej izolacji.
Błędy w izolacji mogą prowadzić do wycieków.

Typowe błędy i pułapki

Brak testów izolacji danych.
Zbyt szerokie uprawnienia.
Mieszanie dokumentów między tenantami.

Diagram

Diagram pokazuje, że wielu klientów lub działów może korzystać z jednej platformy, ale ich dane muszą pozostać rozdzielone.

Powiązane hasła

Model lokalny
SSO / IAM
Audit trail
Stack
Data connectors

Threat modeling (modelowanie zagrożeń)

Kategoria: Bezpieczeństwo Tagi: bezpieczenstwo ryzyko zagrozenia praktyka llmops

Definicja

Threat modeling to metoda identyfikowania, co może pójść źle w systemie, jak może dojść do ataku i jakie kontrole ograniczają ryzyko.

Po co w praktyce

Scenariusz 1: Chatbot z danymi klientów

Cel: wykrycie ryzyk przed wdrożeniem.
Wejście: opis chatbota i zakres danych.
Kroki: assety -> zagrożenia -> kontrole.
Rezultat: lista zabezpieczeń do wdrożenia.
Zabezpieczenie: DLP, IAM i human-in-the-loop.

Scenariusz 2: System RAG

Cel: ochrona przed złymi źródłami.
Wejście: lista źródeł i proces aktualizacji.
Kroki: oceń źródła -> opisz ataki -> dodaj kontrole.
Rezultat: mniejsze ryzyko data poisoning.
Zabezpieczenie: provenance i cytowanie źródeł.

Scenariusz 3: Integracja z narzędziami

Cel: ograniczenie niechcianych akcji.
Wejście: lista narzędzi dostępnych dla modelu.
Kroki: uprawnienia -> scenariusze nadużyć -> limity.
Rezultat: bezpieczniejsze tool calling.
Zabezpieczenie: allowlista, logi i potwierdzenia.

Ryzyka i jak je ograniczać

Ryzyko 1: Pominięcie realnych scenariuszy ataku

Ryzyko: Pominięcie realnych scenariuszy ataku.
Jak ograniczać: używaj red-teamingu i aktualizuj model zagrożeń.

Ryzyko 2: Dokument bez wpływu na wdrożenie

Ryzyko: Dokument bez wpływu na wdrożenie.
Jak ograniczać: powiąż go z checklistami, testami i monitoringiem.

Ryzyko 3: Zbyt ogólny opis ryzyka

Ryzyko: Zbyt ogólny opis ryzyka.
Jak ograniczać: przypisuj właściciela i konkretną kontrolę.

Checklista

Czy wiesz, jakie dane i funkcje są najcenniejsze?
Czy masz listę możliwych nadużyć?
Czy każdemu ryzyku przypisano kontrolę?
Czy model zagrożeń wraca przy zmianach systemu?

Dalsza lektura

Miejsce w mapie

Threat modeling → wspiera: Security review
Threat modeling → korzysta z: Red teaming
Threat modeling → ogranicza ryzyka wokół: Prompt injection

Co to w zasadzie jest?

To plan: co jest cenne, kto może to zaatakować, jak to zrobi i co z tym robimy.

Zamiast zakładać, że będzie dobrze, opisujesz realne scenariusze. Ktoś może próbować wyciągnąć dane z modelu, podmienić dokumenty w bazie, wstrzyknąć instrukcje do promptu albo nadużyć uprawnień.

Threat modeling jest przydatny nawet w małych projektach. Często ujawnia proste braki: brak logów, brak ograniczeń, brak potwierdzeń dla akcji albo brak zasad danych.

Diagram

Diagram pokazuje prosty tok modelowania zagrożeń: od zasobu do kontroli i osoby odpowiedzialnej.

Powiązane hasła

Red teaming
Prompt injection
Data poisoning
Guardrails
Audit trail
Monitoring jakości

Throughput (przepustowość)

Kategoria: Wdrożenia i operacje (LLMOps) Tagi: llmops wdrozenia operacje throughput

Definicja

Throughput to „ile zapytań system potrafi obsłużyć” w danym czasie (np. na minutę), przy akceptowalnym czasie odpowiedzi.

Po co w praktyce

Scenariusz 1: Wydarzenie online

Cel: nagle 500 osób pyta — throughput decyduje, czy system „siądzie”.
Wejście: liczba żądań i zasoby systemu.
Kroki: zmierz przepustowość -> skaluj zasoby -> kontroluj kolejkę.
Rezultat: więcej obsłużonych zadań w tym samym czasie.
Zabezpieczenie: limity, kolejki i alerty.

Scenariusz 2: Helpdesk

Cel: w godzinach szczytu throughput musi być wyższy.
Wejście: liczba żądań i zasoby systemu.
Kroki: zmierz przepustowość -> skaluj zasoby -> kontroluj kolejkę.
Rezultat: więcej obsłużonych zadań w tym samym czasie.
Zabezpieczenie: limity, kolejki i alerty.

Scenariusz 3: RAG

Cel: lepsza konfiguracja (top-k, cache) zwiększa throughput.
Wejście: liczba żądań i zasoby systemu.
Kroki: zmierz przepustowość -> skaluj zasoby -> kontroluj kolejkę.
Rezultat: więcej obsłużonych zadań w tym samym czasie.
Zabezpieczenie: limity, kolejki i alerty.

Ryzyka i jak je ograniczać

Ryzyko 1: Spadek jakości przy przeciążeniu

Ryzyko: spadek jakości przy przeciążeniu.
Jak ograniczać: priorytety, kolejki, limity, degradacja kontrolowana (np. mniej kontekstu).

Ryzyko 2: Koszty rosną niekontrolowanie

Ryzyko: koszty rosną niekontrolowanie.
Jak ograniczać: budżety, rate limiting, monitoring.

Ryzyko 3: Błędy w pętlach agentów zjadają przepustowość

Ryzyko: błędy w pętlach agentów zjadają przepustowość.
Jak ograniczać: limity kroków i timeouts.

Miejsce w mapie

Latency ↔ throughput — zwykle poprawa jednego wpływa na drugie.
Rate limiting → kontrola obciążenia.
Caching → zwiększa throughput.
LLMOps → operacyjne zarządzanie skalą.
Mini-przepływ: Wielu użytkowników → kolejka → obsługa → metryki

Co to w zasadzie jest?

Latency mówi „jak szybko dostajesz odpowiedź”. Throughput mówi „ile osób naraz może korzystać”. W AI przepustowość zależy m.in. od:

mocy obliczeń,
długości promptów,
liczby kroków narzędzi,
cache,
limitów zapytań.

Diagram

Diagram pokazuje, że przepustowość dotyczy liczby zapytań, które system może obsłużyć w czasie.

Timeout (limit czasu)

Kategoria: Wdrożenia i operacje (LLMOps) Tagi: llmops wdrozenia operacje timeout

Definicja

Timeout to limit czasu, po którym system przerywa operację (np. narzędzie, wyszukiwanie, agent), jeśli trwa za długo.

Po co w praktyce

Scenariusz 1: Tool calling

Cel: narzędzie ma timeout 10 sekund.
Wejście: wywołanie API albo narzędzia.
Kroki: ustaw limit czasu -> przerwij zbyt długie żądanie -> obsłuż błąd.
Rezultat: brak zawieszania procesu.
Zabezpieczenie: retry z backoffem i komunikat dla użytkownika.

Scenariusz 2: Retrieval

Cel: wyszukiwanie kończy się po 2 sekundach i zwraca najlepsze wyniki.
Wejście: wywołanie API albo narzędzia.
Kroki: ustaw limit czasu -> przerwij zbyt długie żądanie -> obsłuż błąd.
Rezultat: brak zawieszania procesu.
Zabezpieczenie: retry z backoffem i komunikat dla użytkownika.

Scenariusz 3: Agent

Cel: limit na cały proces, np. 60 sekund.
Wejście: wywołanie API albo narzędzia.
Kroki: ustaw limit czasu -> przerwij zbyt długie żądanie -> obsłuż błąd.
Rezultat: brak zawieszania procesu.
Zabezpieczenie: retry z backoffem i komunikat dla użytkownika.

Ryzyka i jak je ograniczać

Ryzyko 1: Timeout zbyt krótki = gorsza jakość

Ryzyko: timeout zbyt krótki = gorsza jakość.
Jak ograniczać: testuj i dobieraj per operacja; cache i top-k.

Ryzyko 2: Timeout zbyt długi = koszty i przeciążenie

Ryzyko: timeout zbyt długi = koszty i przeciążenie.
Jak ograniczać: rozsądne limity, retry z backoff, obserwacja metryk.

Ryzyko 3: Brak jasnej informacji dla użytkownika

Ryzyko: brak jasnej informacji dla użytkownika.
Jak ograniczać: komunikaty „nie udało się w czasie — spróbuj inaczej”.

Dalsza lektura

NIST — niezawodność i ryzyko (nist.gov)

Miejsce w mapie

Rate limiting → oba chronią system.
Latency → timeout wpływa na czas odpowiedzi.
Agentic workflow → limity kroków i czasu.
LLMOps → stabilność operacyjna.
Mini-przepływ: Start → licznik czasu → OK / przerwij

Co to w zasadzie jest?

To „bezpiecznik na czas”. Bez timeoutów:

agent może czekać w nieskończoność,
koszty mogą rosnąć,
system może się blokować.

Timeouty pomagają utrzymać stabilność i przewidywalność.

Diagram

Diagram pokazuje, że timeout działa jak bezpiecznik, który kończy zbyt długą operację.

Token

Kategoria: Modele i dane Tagi: modele dane ai token

Definicja

Token to jednostka tekstu, na którą model dzieli zdanie podczas przetwarzania. Może być słowem, częścią słowa lub znakiem. Liczba tokenów wpływa na koszt, czas i limit kontekstu.

Po co w praktyce

Scenariusz 1: Kontrola kosztów API

Cel: kontrola kosztów API.
Wejście: plan długości odpowiedzi.
Kroki: limit tokenów → testy → monitoring.
Rezultat: przewidywalne koszty.
Zabezpieczenie: alerty kosztowe.

Scenariusz 2: Skracanie promptów

Cel: skracanie promptów.
Wejście: długi kontekst.
Kroki: streszczenie → selekcja → odpowiedź.
Rezultat: mniej tokenów.
Zabezpieczenie: weryfikacja kompletności.

Scenariusz 3: Optymalizacja RAG

Cel: optymalizacja RAG.
Wejście: fragmenty źródeł.
Kroki: dobór liczby fragmentów → testy.
Rezultat: lepsza jakość.
Zabezpieczenie: kontrola długości.

Ryzyka i jak je ograniczać

Ryzyko 1: Ucięte odpowiedzi

Ryzyko: Ucięte odpowiedzi.
Jak ograniczać: ustaw limit i streszczaj.

Ryzyko 2: Wysokie koszty

Ryzyko: Wysokie koszty.
Jak ograniczać: kontrola liczby tokenów.

Ryzyko 3: Utrata kontekstu

Ryzyko: Utrata kontekstu.
Jak ograniczać: priorytetyzacja treści.

Checklista

Czy znasz limit tokenów modelu?
Czy ustawiono limity odpowiedzi?
Czy stosujesz streszczenia i selekcję?
Czy monitorujesz koszty?
Czy logujesz długości zapytań?

Dalsza lektura

ISO/IEC 22989:2022 Artificial intelligence — Concepts and terminology

Miejsce w mapie

Token → ogranicza: Okno kontekstowe
Token → wpływa na: RAG
Token → używany przez: LLM

Co to w zasadzie jest?

Model nie „czyta” całych słów, tylko tokeny.
Dłuższy tekst to więcej tokenów i wyższy koszt.
Tokeny decydują, ile treści mieści się w oknie kontekstowym.
W różnych językach tokenizacja bywa inna.

Typowe błędy i pułapki

Wklejanie zbyt długich dokumentów.
Brak limitów odpowiedzi.
Nieświadome przekraczanie limitów kontekstu.

Diagram

Diagram pokazuje, że liczba tokenów wpływa na koszt, czas i pojemność kontekstu modelu.

Powiązane hasła

Okno kontekstowe
LLM
RAG
Prompt
Chunking

Tool calling (wywoływanie narzędzi)

Kategoria: Wdrożenia i operacje (LLMOps) Tagi: llmops wdrozenia operacje tool calling

Definicja

Tool calling to sytuacja, gdy model nie tylko pisze tekst, ale też uruchamia narzędzia, np. wyszukiwarkę, bazę danych, API, kalkulator, edytor plików albo system ticketów.

Po co w praktyce

Scenariusz 1: Pobranie danych przez API

Cel: odpowiedź na podstawie aktualnych danych.
Wejście: pytanie użytkownika.
Kroki: wybór narzędzia -> wywołanie API -> odpowiedź.
Rezultat: mniej zgadywania.
Zabezpieczenie: walidacja parametrów i logowanie.

Scenariusz 2: Wyszukiwanie w dokumentach

Cel: odpowiedź oparta na plikach organizacji.
Wejście: pytanie i dostępny zbiór dokumentów.
Kroki: retrieval -> wynik narzędzia -> odpowiedź z kontekstem.
Rezultat: lepsze grounding.
Zabezpieczenie: kontrola źródeł i uprawnień.

Scenariusz 3: Utworzenie zgłoszenia

Cel: automatyzacja prostego procesu.
Wejście: opis problemu.
Kroki: klasyfikacja -> utworzenie ticketu -> zapis w logu.
Rezultat: szybsza obsługa.
Zabezpieczenie: potwierdzenie człowieka przy akcjach krytycznych.

Ryzyka i jak je ograniczać

Ryzyko 1: Nieautoryzowane akcje

Ryzyko: Nieautoryzowane akcje.
Jak ograniczać: role, uprawnienia i tryb tylko do odczytu tam, gdzie to możliwe.

Ryzyko 2: Prompt injection wymusza złe użycie narzędzia

Ryzyko: Prompt injection wymusza złe użycie narzędzia.
Jak ograniczać: filtr poleceń, separacja instrukcji od danych i walidacja przed akcją.

Ryzyko 3: Pętle wywołań i koszty

Ryzyko: Pętle wywołań i koszty.
Jak ograniczać: limity, timeouty, rate limiting i budżety tokenów.

Checklista

Czy narzędzia mają minimalne uprawnienia?
Czy parametry wywołania są walidowane?
Czy akcje krytyczne wymagają potwierdzenia?
Czy każde wywołanie jest logowane?
Czy są limity kosztów i czasu?

Dalsza lektura

Miejsce w mapie

Tool calling → rozszerza: Function calling
Tool calling → wymaga kontroli przez: SSO / IAM
Tool calling → zwiększa wagę: Audit trail

Co to w zasadzie jest?

Model staje się dyspozytorem. Może zlecić zadanie innemu systemowi, odebrać wynik i ułożyć z tego odpowiedź.

To ważny krok od czatu do realnych zastosowań: automatyzacji, agentów i integracji z danymi. Dzięki temu AI nie musi zgadywać. Może sprawdzić źródło, policzyć, pobrać dokument albo uruchomić proces.

Jednocześnie to obszar, w którym bezpieczeństwo jest kluczowe. Jeśli model może wykonać akcję, trzeba jasno ograniczyć, co wolno, kiedy i komu.

Diagram

Diagram pokazuje, że model może zlecić użycie narzędzia, ale wykonanie musi być kontrolowane i logowane.

Powiązane hasła

Agent AI
Orkiestracja
API
Konektory danych
Prompt injection
Audit trail
Guardrails

---

Transparentność

Kategoria: Prawo i etyka Tagi: prawo etyka zgodność transparentnosc

Definicja

Transparentność to jasne informowanie, kiedy i jak wykorzystano AI oraz jakie są ograniczenia wyniku.

Po co w praktyce

Scenariusz 1: Komunikaty

Cel: komunikaty: „opracowano na podstawie dokumentów X, z wykorzystaniem narzędzi wspierających redakcję”.
Wejście: treść lub odpowiedź wspierana przez AI.
Kroki: oznacz użycie AI -> podaj podstawę -> zapisz ślad.
Rezultat: odbiorca rozumie, skąd pochodzi treść.
Zabezpieczenie: jasne zasady oznaczania i audyt.

Scenariusz 2: Odpowiedzi

Cel: odpowiedzi: informacja wewnętrzna w śladzie audytowym.
Wejście: treść lub odpowiedź wspierana przez AI.
Kroki: oznacz użycie AI -> podaj podstawę -> zapisz ślad.
Rezultat: odbiorca rozumie, skąd pochodzi treść.
Zabezpieczenie: jasne zasady oznaczania i audyt.

Scenariusz 3: Materiały szkoleniowe

Cel: materiały szkoleniowe: jasne zasady użycia.
Wejście: treść lub odpowiedź wspierana przez AI.
Kroki: oznacz użycie AI -> podaj podstawę -> zapisz ślad.
Rezultat: odbiorca rozumie, skąd pochodzi treść.
Zabezpieczenie: jasne zasady oznaczania i audyt.

Ryzyka i jak je ograniczać

Ryzyko 1: Utrata zaufania

Ryzyko: Utrata zaufania.
Jak ograniczać: prosta notka i źródła.

Ryzyko 2: Nieporozumienia

Ryzyko: Nieporozumienia.
Jak ograniczać: „AI przygotowało szkic, człowiek zatwierdził”.

Ryzyko 3: Dezinformacja

Ryzyko: Dezinformacja.
Jak ograniczać: fact-checking.

Checklista

Czy wiadomo, co zrobił człowiek, a co AI?
Czy są źródła?
Czy jest akceptacja?
Czy logi są kompletne?
Czy treść jest w plain language?

Dalsza lektura

Miejsce w mapie

Transparentność → wspiera: Fact-checking
Transparentność → wspiera: Audit trail
Transparentność → ważna przy: Deepfake

Co to w zasadzie jest?

Nie chodzi o „chwalenie się AI”, tylko o uczciwość wobec odbiorcy.
Transparentność zwiększa zaufanie i ułatwia poprawki.
W firmie: AI często jest narzędziem do szkicu, a nie autorem decyzji.

Typowe błędy i pułapki

Ukrywanie użycia AI w procesie.
Deklaracje bez pokrycia (brak źródeł).

Diagram

Diagram pokazuje, że odbiorca powinien wiedzieć, gdzie AI wsparła proces, a gdzie człowiek zatwierdził wynik.

Powiązane hasła

Fact-checking
Audit trail
Deepfake
Polityka użycia AI
Human-in-the-loop

Trening a inferencja

Kategoria: Modele i dane Tagi: ai modele trening inferencja wdrozenia

Definicja

Trening to proces uczenia modelu na danych. Inferencja to korzystanie z już nauczonego modelu do generowania wyników.

Po co w praktyce

Scenariusz 1: Wsparcie obsługi klienta

Cel: odpowiedzi zgodne z firmowym FAQ.
Wejście: pytanie klienta i baza wiedzy.
Kroki: retrieval -> inferencja -> odpowiedź.
Rezultat: odpowiedź bez trenowania modelu.
Zabezpieczenie: grounding i cytowanie źródeł.

Scenariusz 2: Specyficzny styl odpowiedzi

Cel: zachowanie stałego tonu marki.
Wejście: prompt z przykładami.
Kroki: few-shot -> inferencja -> przegląd.
Rezultat: spójniejszy styl.
Zabezpieczenie: biblioteka promptów i ewaluacja.

Scenariusz 3: Trwałe dostrojenie modelu

Cel: zmiana zachowania modelu w powtarzalnym procesie.
Wejście: zestaw danych treningowych.
Kroki: przygotowanie danych -> trening -> testy.
Rezultat: model lepiej dopasowany do zadania.
Zabezpieczenie: ocena jakości i kontrola danych.

Ryzyka i jak je ograniczać

Ryzyko 1: Mylenie promptowania z uczeniem

Ryzyko: Mylenie promptowania z uczeniem.
Jak ograniczać: ustal, co jest trwałe, a co działa tylko w danym kontekście.

Ryzyko 2: Niepotrzebny trening

Ryzyko: Niepotrzebny trening.
Jak ograniczać: sprawdź najpierw RAG, prompt i few-shot.

Ryzyko 3: Ryzyko prywatności

Ryzyko: Ryzyko prywatności.
Jak ograniczać: nie trenuj na danych, których nie wolno użyć w tym celu.

Checklista

Czy problem wymaga trwałej zmiany modelu?
Czy wystarczy RAG albo dobry prompt?
Czy dane treningowe są legalne i jakościowe?
Czy masz sposób oceny wyniku?

Dalsza lektura

Miejsce w mapie

Trening a inferencja → porządkuje relację między: Fine-tuning i Prompt
Trening a inferencja → pomaga wybrać: RAG
Trening a inferencja → wymaga zarządzania przez: LLMOps

Co to w zasadzie jest?

Trening to nauka, a inferencja to odpytywanie. Jak w szkole: najpierw ktoś się uczy, potem rozwiązuje zadania.

To rozróżnienie pomaga podejmować dobre decyzje. Jeśli chcesz, żeby model zachowywał się bardziej po Twojemu, czasem wystarczy dobry prompt i kilka przykładów. To nadal inferencja. Jeśli chcesz trwałej zmiany zachowania modelu, wchodzisz w trening, np. fine-tuning.

W praktyce wiele zastosowań firmowych da się zrobić bez treningu. Często łatwiej jest dopinać wiedzę przez dokumenty, RAG i szablony promptów niż inwestować w kosztowne uczenie.

Diagram

Diagram pokazuje różnicę między uczeniem modelu a jego późniejszym użyciem.

Powiązane hasła

Fine-tuning
Prompt
RAG
Model lokalny
LLMOps

Vendor lock-in

Kategoria: Prawo i etyka Tagi: modele dane ai vendor lock in prawo etyka

Definicja

Vendor lock-in to sytuacja, w której organizacja staje się silnie zależna od jednego dostawcy technologii i ma wysoki koszt zmiany.

Po co w praktyce

Scenariusz 1: Ocena ryzyka wyboru dostawcy

Cel: ocena ryzyka wyboru dostawcy.
Wejście: umowa i architektura.
Kroki: analiza zależności -> plan wyjścia -> decyzja.
Rezultat: świadomy wybór.
Zabezpieczenie: klauzule migracyjne.

Scenariusz 2: Projektowanie neutralnej architektury

Cel: projektowanie neutralnej architektury.
Wejście: wymagania techniczne.
Kroki: warstwa abstrakcji -> standardy danych -> test migracji.
Rezultat: większa przenaszalność.
Zabezpieczenie: regularny test eksportu.

Scenariusz 3: Kontrola kosztów długoterminowych

Cel: kontrola kosztów długoterminowych.
Wejście: cennik i wolumen.
Kroki: model TCO -> scenariusze -> plan budżetu.
Rezultat: mniejsze ryzyko finansowe.
Zabezpieczenie: limity i monitoring.

Ryzyka i jak je ograniczać

Ryzyko 1: Wzrost kosztów

Ryzyko: Wzrost kosztów.
Jak ograniczać: negocjacje i limity.

Ryzyko 2: Blokada migracji

Ryzyko: Blokada migracji.
Jak ograniczać: standardy danych i API.

Ryzyko 3: Ryzyko operacyjne

Ryzyko: Ryzyko operacyjne.
Jak ograniczać: dokumentacja i test migracji.

Checklista

Czy masz plan migracji?
Czy dane można wyeksportować?
Czy API jest abstrakcyjne?
Czy umowa ma klauzule wyjścia?
Czy porównałeś alternatywy?

Dalsza lektura

Miejsce w mapie

Vendor lock-in -> dotyczy: API
Vendor lock-in -> dotyczy: RAG
Vendor lock-in -> dotyczy: Fine-tuning (dostrajanie)

Co to w zasadzie jest?

Im więcej elementów jest specyficznych dla jednego dostawcy, tym trudniej zmienić platformę.
Dotyczy to modelu, API, danych i automatyzacji.
Ryzyko rośnie przy braku planu migracji.

Typowe błędy i pułapki

Brak planu wyjścia przy podpisaniu umowy.
Wiązanie danych z formatem dostawcy.
Brak porównania alternatyw.

Diagram

Diagram pokazuje, że zależność od jednego dostawcy rośnie wraz z liczbą powiązań w systemie, jeśli nie ma planu migracji.

Powiązane hasła

API
RAG
Fine-tuning (dostrajanie)
Stack
Polityka użycia AI w organizacji

Versioning modeli (wersjonowanie)

Kategoria: Wdrożenia i operacje (LLMOps) Tagi: llmops wdrozenia operacje model versioning

Definicja

Wersjonowanie modeli to praktyka jawnego oznaczania, jakiej wersji modelu używa system (i kiedy nastąpiła zmiana), aby móc porównywać wyniki w czasie.

Po co w praktyce

Scenariusz 1: Notka w changelogu

Cel: „2026-02-18: zmiana modelu vX na vY”.
Wejście: nowa wersja modelu, promptu albo ustawień.
Kroki: oznacz wersję -> przetestuj -> wdrażaj etapami.
Rezultat: łatwiejszy rollback i audyt.
Zabezpieczenie: historia zmian i testy regresji.

Scenariusz 2: Test A/B

Cel: porównanie dwóch wersji.
Wejście: nowa wersja modelu, promptu albo ustawień.
Kroki: oznacz wersję -> przetestuj -> wdrażaj etapami.
Rezultat: łatwiejszy rollback i audyt.
Zabezpieczenie: historia zmian i testy regresji.

Scenariusz 3: Rollback

Cel: cofnięcie do poprzedniej wersji po incydencie.
Wejście: nowa wersja modelu, promptu albo ustawień.
Kroki: oznacz wersję -> przetestuj -> wdrażaj etapami.
Rezultat: łatwiejszy rollback i audyt.
Zabezpieczenie: historia zmian i testy regresji.

Ryzyka i jak je ograniczać

Ryzyko 1: Brak porównywalności (nikt nie wie co działa)

Ryzyko: brak porównywalności (nikt nie wie co działa).
Jak ograniczać: standard: wersja modelu + wersja promptu + wersja źródeł.

Ryzyko 2: Zmiany wchodzą bez testów

Ryzyko: zmiany wchodzą bez testów.
Jak ograniczać: benchmarki i ewaluacja przed wdrożeniem.

Ryzyko 3: Chaos w oznaczeniach

Ryzyko: chaos w oznaczeniach.
Jak ograniczać: jedna konwencja nazewnictwa i automaty.

Dalsza lektura

NIST — dobre praktyki zarządzania ryzykiem (nist.gov)

Miejsce w mapie

LLMOps → operacyjne utrzymanie wersji.
Benchmark / Ewaluacja → porównywanie wersji.
A/B testy → testowanie zmian.
Drift → analiza jakości w czasie.
Mini-przepływ: Nowa wersja → testy → wdrożenie → monitoring → rollback?

Co to w zasadzie jest?

Jeśli dziś AI działa dobrze, a jutro gorzej, pierwsze pytanie brzmi: „co się zmieniło?” Wersjonowanie pozwala:

odtworzyć warunki działania,
porównać jakość,
cofnąć zmianę,
komunikować użytkownikom różnice.

Wersjonuje się nie tylko model, ale też: prompty, dane, ustawienia.

Diagram

Diagram pokazuje, że wersjonowanie modeli obejmuje testy, wdrożenie i możliwość cofnięcia zmiany.

Walidacja wyniku (Output validation)

Kategoria: Jakość i ewaluacja Tagi: walidacja jakość wynik structured output kontrola

Definicja

Walidacja wyniku to sprawdzanie, czy odpowiedź modelu ma poprawny format, kompletne pola, logiczną spójność albo zgodność z ustalonymi regułami przed dalszym użyciem.

Po co w praktyce

Scenariusz 1: Generowanie danych do API

Cel: nie wysyłać błędnej struktury do kolejnego systemu.
Wejście: odpowiedź modelu w ustalonym formacie.
Kroki: wygenerowanie wyniku -> walidacja schematu -> akceptacja albo poprawka.
Rezultat: mniej błędów integracyjnych.
Zabezpieczenie: schema validation i retry.

Scenariusz 2: Klasyfikacja zgłoszeń

Cel: upewnić się, że system zwraca jedną dopuszczalną kategorię.
Wejście: treść zgłoszenia i lista klas.
Kroki: klasyfikacja -> sprawdzenie kategorii -> zapis wyniku.
Rezultat: system nie wpisuje błędnych wartości do procesu.
Zabezpieczenie: whitelist dopuszczalnych klas.

Scenariusz 3: Generowanie streszczeń w stałym formacie

Cel: zachować spójność wyniku w pracy zespołu.
Wejście: dokument i wzór sekcji wyjściowych.
Kroki: generowanie -> sprawdzenie obecności sekcji -> akceptacja.
Rezultat: przewidywalny format odpowiedzi.
Zabezpieczenie: template i kontrola braków.

Ryzyka i jak je ograniczać

Ryzyko 1: Błędne dane w procesie

Ryzyko: błędne dane w procesie.
Jak ograniczać: zatrzymuj wynik, jeśli nie przejdzie walidacji.

Ryzyko 2: Ukryte błędy logiczne

Ryzyko: ukryte błędy logiczne.
Jak ograniczać: łącz walidację struktury z kontrolą reguł biznesowych.

Ryzyko 3: Awaryjność integracji

Ryzyko: awaryjność integracji.
Jak ograniczać: stosuj retry i fallback.

Ryzyko 4: Fałszywe poczucie jakości

Ryzyko: fałszywe poczucie jakości.
Jak ograniczać: pamiętaj, że poprawny format nie gwarantuje poprawnej treści.

Checklista

Czy wynik ma ustalony format?
Czy są reguły sprawdzające kompletność?
Czy wiadomo, co dzieje się po błędzie walidacji?
Czy walidujesz też sens wyniku, a nie tylko strukturę?
Czy błędy są logowane?

Miejsce w mapie

Walidacja wyniku (Output validation) → wspiera: Structured output (ustrukturyzowany wynik)

Walidacja wyniku (Output validation) → wspiera: Function calling (wywoływanie funkcji)

Walidacja wyniku (Output validation) → wymaga: Monitoring jakości

Co to w zasadzie jest?

To etap kontroli jakości po wygenerowaniu odpowiedzi. System nie zakłada, że każdy wynik modelu nadaje się od razu do użycia. Najpierw sprawdza, czy odpowiedź spełnia warunki techniczne i biznesowe.

Walidacja może dotyczyć:

formatu JSON,
obecności wymaganych pól,
zakresu wartości,
zgodności z regułami procesu,
podstawowej logiki wyniku.

Typowe błędy i pułapki

Walidacja tylko formatu bez oceny sensu odpowiedzi.
Brak obsługi błędów po nieudanej walidacji.
Zbyt luźne reguły jakości.
Przekazywanie dalej wyniku mimo błędu walidacji.

Diagram

Diagram pokazuje, że wynik modelu powinien przejść przez kontrolę formatu i reguł przed dalszym użyciem.

Powiązane hasła

Structured output (ustrukturyzowany wynik)

Function calling (wywoływanie funkcji)

Prompt format (format promptu)

Monitoring jakości

Idempotencja

---

Watermarking (znakowanie treści)

Kategoria: Prawo i etyka Tagi: prawo etyka zgodność watermarking

Definicja

Watermarking to technika oznaczania treści (tekst, obraz, audio, wideo) tak, aby dało się rozpoznać, że została wygenerowana lub zmodyfikowana — np. przez AI.

Po co w praktyce

Scenariusz 1: Grafika promocyjna wygenerowana AI ma dopisek „AI”

Cel: grafika promocyjna wygenerowana AI ma dopisek „AI”.
Wejście: treść wygenerowana lub publikowana.
Kroki: oznacz treść -> opublikuj -> umożliw weryfikację.
Rezultat: łatwiejsze rozpoznanie pochodzenia.
Zabezpieczenie: nie traktuj watermarku jako jedynego dowodu.

Scenariusz 2: Wideo z lektorem AI ma metadane o syntezie

Cel: wideo z lektorem AI ma metadane o syntezie.
Wejście: treść wygenerowana lub publikowana.
Kroki: oznacz treść -> opublikuj -> umożliw weryfikację.
Rezultat: łatwiejsze rozpoznanie pochodzenia.
Zabezpieczenie: nie traktuj watermarku jako jedynego dowodu.

Scenariusz 3: Organizacja ustala zasadę

Cel: „wszystkie treści AI oznaczamy”.
Wejście: treść wygenerowana lub publikowana.
Kroki: oznacz treść -> opublikuj -> umożliw weryfikację.
Rezultat: łatwiejsze rozpoznanie pochodzenia.
Zabezpieczenie: nie traktuj watermarku jako jedynego dowodu.

Ryzyka i jak je ograniczać

Ryzyko 1: Watermark da się usunąć

Ryzyko: watermark da się usunąć.
Jak ograniczać: łącz watermarking z polityką publikacji i weryfikacją źródeł.

Ryzyko 2: Fałszywe poczucie bezpieczeństwa („jak nie ma watermarku, to prawdziwe”)

Ryzyko: fałszywe poczucie bezpieczeństwa („jak nie ma watermarku, to prawdziwe”).
Jak ograniczać: edukacja + fact-checking + provenance.

Ryzyko 3: Nadmierne oznaczanie (psuje UX)

Ryzyko: nadmierne oznaczanie (psuje UX).
Jak ograniczać: spójne zasady: kiedy jawnie, kiedy w metadanych.

Dalsza lektura

EUR-Lex - regulacje UE dot. AI i przejrzystości

Miejsce w mapie

Deepfake → watermarking pomaga w oznaczaniu/rozpoznawaniu.
Transparentność → część przejrzystej komunikacji.
Fact-checking → watermarking nie zastępuje weryfikacji.
Data provenance → „skąd to jest” w praktyce.
Mini-przepływ: Treść → watermark → publikacja → weryfikacja

Co to w zasadzie jest?

To „niewidzialny podpis” albo jawne oznaczenie typu „AI”. Celem jest ułatwienie:

rozpoznawania treści syntetycznych,
walki z dezinformacją,
budowania zaufania („wiemy, skąd to jest”).

Watermarking bywa różny:

jawny (np. napis na grafice),
ukryty (w danych pliku),
wykrywalny przez narzędzia (detektory).

Diagram

Diagram pokazuje, że oznaczenie treści pomaga później rozpoznać jej pochodzenie i wspiera transparentność.

Wektoryzacja

Kategoria: Retrieval / RAG Tagi:

Definicja

Embedding to sposób zamiany tekstu, obrazu lub dźwięku na liczby, które opisują jego znaczenie. Dzięki temu komputer może porównywać podobieństwo treści po sensie, a nie tylko po słowach.

Po co w praktyce

Scenariusz 1: Szybkie znalezienie właściwej procedury

Cel: szybkie znalezienie właściwej procedury.
Wejście: pytanie pracownika.
Kroki: 1) wektoryzuj pytanie 2) wyszukaj podobne fragmenty 3) pokaż top wyniki.
Rezultat: link do właściwego dokumentu.
Zabezpieczenie: filtrowanie po aktualności.

Scenariusz 2: Odpowiedzi na pytania klientów na bazie FAQ

Cel: odpowiedzi na pytania klientów na bazie FAQ.
Wejście: treść maila.
Kroki: embedding → podobne pytania → gotowa odpowiedź.
Rezultat: szkic odpowiedzi.
Zabezpieczenie: człowiek akceptuje.

Scenariusz 3: Wykrywanie duplikatów treści na stronie

Cel: wykrywanie duplikatów treści na stronie.
Wejście: artykuły.
Kroki: embedding → porównanie podobieństwa.
Rezultat: lista powtórek.
Zabezpieczenie: próg podobieństwa + ręczna weryfikacja.

Ryzyka i jak je ograniczać

Ryzyko 1: Wycieki danych

Ryzyko: Wycieki danych: nie wektoryzuj danych wrażliwych bez zasad.
Jak ograniczać: anonimizacja i PII.

Ryzyko 2: Błędne dopasowania

Ryzyko: Błędne dopasowania: embedding nie „rozumie intencji” w 100%.
Jak ograniczać: weryfikacja + cytaty.

Ryzyko 3: Vendor lock-in

Ryzyko: Vendor lock-in: zależność od jednego dostawcy embeddingów.
Jak ograniczać: warstwa abstrakcji + testy.

Checklista

Czy dane nie zawierają danych osobowych?
Czy masz tagi: dział, temat, data?
Czy chunking jest spójny?
Czy wyniki pokazują źródło i fragment?
Czy jest proces aktualizacji indeksu?

Dalsza lektura

Miejsce w mapie

Embedding → używa: Baza wektorowa
Embedding → wspiera: RAG
Embedding → wymaga: Chunking

Co to w zasadzie jest?

To jak „współrzędne znaczenia” dla zdania lub dokumentu.
Podobne treści lądują blisko siebie, różne — daleko.
Wektoryzacja jest podstawą wyszukiwania semantycznego i RAG.
To nie jest streszczenie ani tłumaczenie — to „odcisk palca znaczenia”.

Typowe błędy i pułapki

Za duże fragmenty (chunk) → gorsze dopasowanie.
Mieszanie dokumentów z różnych tematów w jednej bazie bez tagów.
Brak aktualizacji embeddingów po zmianie treści.

Diagram

Diagram pokazuje, że embedding zamienia tekst na reprezentację liczbową, która pozwala szukać treści po znaczeniu.

Powiązane hasła

RAG
Token
Okno kontekstowe
API
Data poisoning

Wyjaśnialność (explainability)

Kategoria: Organizacja i zarządzanie Tagi: modele dane ai explainability organizacja zarzadzanie procesy

Definicja

Wyjaśnialność to możliwość uzasadnienia, dlaczego system AI dał taki wynik i na czym się oparł.

Po co w praktyce

Scenariusz 1: Asystent procedur

Cel: asystent procedur: odpowiedź zawsze z linkiem do dokumentu.
Wejście: decyzja modelu, dane wejściowe i reguły procesu.
Kroki: pokaż podstawę -> opisz kryteria -> wskaż ograniczenia.
Rezultat: łatwiejsze zrozumienie wyniku.
Zabezpieczenie: nie myl wyjaśnienia z dowodem poprawności.

Scenariusz 2: Klasyfikacja spraw

Cel: klasyfikacja spraw: pokazanie reguł i progów.
Wejście: decyzja modelu, dane wejściowe i reguły procesu.
Kroki: pokaż podstawę -> opisz kryteria -> wskaż ograniczenia.
Rezultat: łatwiejsze zrozumienie wyniku.
Zabezpieczenie: nie myl wyjaśnienia z dowodem poprawności.

Scenariusz 3: Podsumowania

Cel: podsumowania: wskazanie, z jakich notatek powstały.
Wejście: decyzja modelu, dane wejściowe i reguły procesu.
Kroki: pokaż podstawę -> opisz kryteria -> wskaż ograniczenia.
Rezultat: łatwiejsze zrozumienie wyniku.
Zabezpieczenie: nie myl wyjaśnienia z dowodem poprawności.

Ryzyka i jak je ograniczać

Ryzyko 1: Brak zaufania

Ryzyko: Brak zaufania.
Jak ograniczać: cytaty i transparentność.

Ryzyko 2: Błędy bez możliwości odtworzenia

Ryzyko: Błędy bez możliwości odtworzenia.
Jak ograniczać: audit trail.

Ryzyko 3: Nadmierne uproszczenia

Ryzyko: Nadmierne uproszczenia.
Jak ograniczać: opis ograniczeń.

Checklista

Czy wynik ma źródła?
Czy potrafię odtworzyć proces?
Czy są logi i wersje?
Czy opisuję ograniczenia?
Czy człowiek zatwierdza?

Dalsza lektura

Miejsce w mapie

Explainability → wspiera: Audit trail
Explainability → wspiera: Cytowanie źródeł
Explainability → wymaga: Grounding

Co to w zasadzie jest?

W firmie „bo tak wyszło” nie wystarcza.
Wyjaśnialność może oznaczać: źródła, kroki, kryteria, logi.
Najprościej: cytaty + ślad audytowy + jasne zasady.

Typowe błędy i pułapki

Brak źródeł.
Brak logów procesu.

Diagram

Diagram pokazuje, że wynik systemu powinien być możliwy do uzasadnienia przez źródła, logi lub kryteria.

Powiązane hasła

Audit trail
Cytowanie źródeł
Grounding
Ewaluacja
Polityka użycia AI

Zarządzanie kosztami AI

Kategoria: Organizacja i zarządzanie Tagi:

Definicja

Zarządzanie kosztami AI to zestaw praktyk, które pomagają kontrolować zużycie zasobów (tokeny, wywołania narzędzi, obliczenia) i utrzymać koszty na przewidywalnym poziomie.

Po co w praktyce

Scenariusz 1: Ustawienie limitu tokenów na rozmowę/zadanie

Cel: ustawienie limitu tokenów na rozmowę/zadanie.
Wejście: materiał wejściowy związany ze scenariuszem.
Kroki: zbierz wejście -> zastosuj pojęcie -> sprawdź wynik.
Rezultat: praktyczny wynik scenariusza.
Zabezpieczenie: review człowieka i kontrola ryzyk.

Scenariusz 2: Pamięć podręczna odpowiedzi FAQ i embeddingów

Cel: pamięć podręczna odpowiedzi FAQ i embeddingów.
Wejście: materiał wejściowy związany ze scenariuszem.
Kroki: zbierz wejście -> zastosuj pojęcie -> sprawdź wynik.
Rezultat: praktyczny wynik scenariusza.
Zabezpieczenie: review człowieka i kontrola ryzyk.

Scenariusz 3: Limity zapytań i budżet na użytkownika lub zespół

Cel: limity zapytań i budżet na użytkownika lub zespół.
Wejście: materiał wejściowy związany ze scenariuszem.
Kroki: zbierz wejście -> zastosuj pojęcie -> sprawdź wynik.
Rezultat: praktyczny wynik scenariusza.
Zabezpieczenie: review człowieka i kontrola ryzyk.

Scenariusz 4: Alert

Cel: „koszt dzienny > X”.
Wejście: materiał wejściowy związany ze scenariuszem.
Kroki: zbierz wejście -> zastosuj pojęcie -> sprawdź wynik.
Rezultat: praktyczny wynik scenariusza.
Zabezpieczenie: review człowieka i kontrola ryzyk.

Ryzyka i jak je ograniczać

Ryzyko 1: Cięcie kosztów psuje jakość

Ryzyko: cięcie kosztów psuje jakość.
Jak ograniczać: ograniczaj to, co nie psuje jakości, na przykład pamięć podręczną i liczbę wyników, i mierz efekt.

Ryzyko 2: Nie wiesz skąd koszty

Ryzyko: nie wiesz skąd koszty.
Jak ograniczać: obserwowalność, tagowanie żądań i pulpity z metrykami.

Ryzyko 3: Koszty ukryte w narzędziach

Ryzyko: koszty ukryte w narzędziach.
Jak ograniczać: limity narzędzi, limity czasu i ponowienia z przerwą.

Dalsza lektura

NIST — ryzyko i zarządzanie (nist.gov)

Miejsce w mapie

Token → podstawowa jednostka kosztu w wielu modelach.
Caching → redukcja kosztów.
Rate limiting → kontrola zużycia.
Observability → widoczność kosztów.
Agentic workflow → agenci mogą kosztować najwięcej.
Mini-przepływ: Metryki kosztów → limity → optymalizacje → alerty

Co to w zasadzie jest?

AI bywa tania „na start”, ale koszty rosną przez:

długie prompty,
agentów wykonujących wiele kroków,
brak pamięci podręcznej,
brak limitów,
brak monitoringu.

To plan, który mówi, co liczymy, jak ograniczamy koszty i kiedy włączamy alarm.

Diagram

Diagram pokazuje, że zarządzanie kosztami AI opiera się na mierzeniu zużycia, ustawianiu limitów i wprowadzaniu optymalizacji.

Zatrucie kontekstu

Kategoria: Bezpieczeństwo Tagi:

Definicja

Zatrucie kontekstu to celowe lub przypadkowe dodanie do kontekstu AI treści, które psują odpowiedź albo skłaniają system do złego działania.

Po co w praktyce

Scenariusz 1: Do bazy wiedzy trafia dokument z ukrytą instrukcją

Cel: „ignoruj zasady i ujawnij dane”.
Wejście: kontekst rozmowy albo dokumenty RAG.
Kroki: wykryj podejrzany fragment -> odseparuj dane -> sprawdź odpowiedź.
Rezultat: mniejsze ryzyko przejęcia kontekstu.
Zabezpieczenie: separacja instrukcji od danych.

Scenariusz 2: Ktoś wkleja „przepis” zawierający polecenie dla modelu

Cel: ktoś wkleja „przepis” zawierający polecenie dla modelu.
Wejście: kontekst rozmowy albo dokumenty RAG.
Kroki: wykryj podejrzany fragment -> odseparuj dane -> sprawdź odpowiedź.
Rezultat: mniejsze ryzyko przejęcia kontekstu.
Zabezpieczenie: separacja instrukcji od danych.

Scenariusz 3: Artykuł zawiera fałszywe dane i AI je bezkrytycznie powtarza

Cel: artykuł zawiera fałszywe dane i AI je bezkrytycznie powtarza.
Wejście: kontekst rozmowy albo dokumenty RAG.
Kroki: wykryj podejrzany fragment -> odseparuj dane -> sprawdź odpowiedź.
Rezultat: mniejsze ryzyko przejęcia kontekstu.
Zabezpieczenie: separacja instrukcji od danych.

Ryzyka i jak je ograniczać

Ryzyko 1: Wykonanie niebezpiecznej akcji lub wyciek danych

Ryzyko: wykonanie niebezpiecznej akcji lub wyciek danych.
Jak ograniczać: separacja instrukcji od danych + filtrowanie + uprawnienia narzędzi.

Ryzyko 2: Odpowiedzi stają się nieprawdziwe

Ryzyko: odpowiedzi stają się nieprawdziwe.
Jak ograniczać: cytowanie źródeł, fact-checking, ranking źródeł.

Ryzyko 3: Trudne do wykrycia „ciche” manipulacje

Ryzyko: trudne do wykrycia „ciche” manipulacje.
Jak ograniczać: monitoring, red teaming, testy na przykładach ataków.

Dalsza lektura

ENISA - zagrożenia i dobre praktyki

Miejsce w mapie

Prompt injection → zbliżone zjawisko; atak często działa przez kontekst.
RAG / Data poisoning → zatrucie dokumentów i źródeł.
Guardrails → zasady ochronne.
Audit trail → ślad „skąd wzięło się to w kontekście”.
Mini-przepływ: Złośliwa treść → kontekst → model → zła odpowiedź/akcja

Co to w zasadzie jest?

AI odpowiada na podstawie tego, co „widzi” w kontekście, czyli w poleceniu i dołączonych dokumentach. Jeśli w tym kontekście znajdzie się:

fałszywa informacja,
„instrukcja udająca dokument”,
złośliwy fragment tekstu,

to model może zrobić coś niepożądanego.

To może się zdarzyć w RAG, gdy problem jest w dokumentach, albo w rozmowie, gdy użytkownik coś wkleja.

Diagram

Diagram pokazuje, że jedna zła treść w kontekście może wypaczyć odpowiedź modelu, dlatego potrzebne są filtry i rozdzielenie danych od instrukcji.

Zero-shot (bez przykładów)

Kategoria: Prompting Tagi: prompting prompt praktyka jakosc

Definicja

Zero-shot to sposób użycia modelu, w którym prosisz o zadanie bez podawania przykładów poprawnych odpowiedzi.

Po co w praktyce

Scenariusz 1: Szybkie streszczenie

Cel: uzyskać krótki skrót bez budowania szablonu.
Wejście: tekst do streszczenia.
Kroki: polecenie -> odpowiedź -> szybki przegląd.
Rezultat: robocze streszczenie.
Zabezpieczenie: doprecyzowanie formatu, jeśli wynik jest za ogólny.

Scenariusz 2: Lista pomysłów

Cel: szybka inspiracja.
Wejście: temat lub problem.
Kroki: prompt -> lista -> wybór najlepszych propozycji.
Rezultat: punkt startu do pracy.
Zabezpieczenie: selekcja przez człowieka.

Scenariusz 3: Prosta analiza plusów i minusów

Cel: uporządkowanie decyzji.
Wejście: krótki opis sytuacji.
Kroki: analiza -> lista plusów -> lista minusów.
Rezultat: pierwsza mapa argumentów.
Zabezpieczenie: sprawdzenie założeń.

Ryzyka i jak je ograniczać

Ryzyko 1: Każdy wynik może wyglądać inaczej

Ryzyko: Każdy wynik może wyglądać inaczej.
Jak ograniczać: dodaj wymagany format.

Ryzyko 2: Nietrafiony ton

Ryzyko: Nietrafiony ton.
Jak ograniczać: dopisz odbiorcę, styl i ograniczenia.

Ryzyko 3: Brak porównywalności

Ryzyko: Brak porównywalności.
Jak ograniczać: testuj ten sam prompt na kilku przykładach.

Checklista

Czy zadanie jest proste?
Czy format odpowiedzi może być luźny?
Czy wynik ma być tylko szkicem?
Czy potrzebujesz później przejść na few-shot?

Dalsza lektura

OpenAI — Prompting

Miejsce w mapie

Zero-shot → jest prostszą wersją niż: Few-shot
Zero-shot → bazuje na: Prompt
Zero-shot → wymaga kontroli przez: Ewaluacja

Co to w zasadzie jest?

Mówisz: „zrób X” i liczysz, że model sam zrozumie zadanie. Działa dobrze w prostych sprawach, ale gorzej, gdy chcesz bardzo konkretny format.

W zero-shot model ma mniej podpowiedzi o tym, jak ma wyglądać odpowiedź. Jeśli zadanie jest wieloznaczne, wybierze jeden z możliwych sposobów i może to nie być to, czego oczekujesz.

Zero-shot jest dobry do szybkich inspiracji i prostych zadań. Przy procesach powtarzalnych lepiej przejść na few-shot albo bibliotekę promptów.

Diagram

Diagram pokazuje zero-shot jako najprostszy wariant promptowania: samo polecenie bez przykładów.

Powiązane hasła

Prompt
Prompt systemowy
Few-shot
Ewaluacja
Monitoring jakości

Zgoda i prawa do danych oraz treści

Kategoria: Prawo i etyka Tagi:

Ślad audytowy

Kategoria: Organizacja i zarządzanie Tagi:

Definicja

Ślad audytowy to zapis tego, co wydarzyło się w procesie. Pokazuje, kto działał, kiedy to zrobił, z jakiego narzędzia korzystał i co zostało opublikowane.

Po co w praktyce

Scenariusz 1: Logi generowania komunikatów z informacją o wersji i autorze

Cel: logi generowania komunikatów z informacją o wersji i autorze.
Wejście: zdarzenie, użytkownik, czas i wersja działania.
Kroki: zapisz zdarzenie -> powiąż z wynikiem -> umożliw kontrolę.
Rezultat: czytelny ślad działań.
Zabezpieczenie: brak danych wrażliwych w logach.

Scenariusz 2: Rejestr użycia AI w obsłudze spraw (bez danych wrażliwych)

Cel: rejestr użycia AI w obsłudze spraw (bez danych wrażliwych).
Wejście: zdarzenie, użytkownik, czas i wersja działania.
Kroki: zapisz zdarzenie -> powiąż z wynikiem -> umożliw kontrolę.
Rezultat: czytelny ślad działań.
Zabezpieczenie: brak danych wrażliwych w logach.

Scenariusz 3: Raporty jakości i incydentów

Cel: raporty jakości i incydentów.
Wejście: zdarzenie, użytkownik, czas i wersja działania.
Kroki: zapisz zdarzenie -> powiąż z wynikiem -> umożliw kontrolę.
Rezultat: czytelny ślad działań.
Zabezpieczenie: brak danych wrażliwych w logach.

Ryzyka i jak je ograniczać

Ryzyko 1: Naruszenie prywatności w logach

Ryzyko: Naruszenie prywatności w logach.
Jak ograniczać: maskowanie + DLP.

Ryzyko 2: Brak rozliczalności

Ryzyko: Brak rozliczalności.
Jak ograniczać: obowiązek logów dla procesów.

Ryzyko 3: Koszty utrzymania

Ryzyko: Koszty utrzymania.
Jak ograniczać: retencja i archiwizacja.

Checklista

Czy logujesz: kto, kiedy, wersja, źródła?
Czy logi nie zawierają PII?
Czy logi są zabezpieczone dostępem (IAM)?
Czy masz retencję?
Czy wiesz, jak odtworzyć proces?

Dalsza lektura

Miejsce w mapie

Audit trail → wymaga: SSO/IAM
Audit trail → wspiera: Polityka AI
Audit trail → pomaga w: Incydenty

Co to w zasadzie jest?

To „historia powstania” treści lub odpowiedzi.
Ułatwia wyjaśnianie błędów i poprawki.
Wzmacnia bezpieczeństwo i odpowiedzialność.

Typowe błędy i pułapki

Brak informacji o wersji danych (źródła).
Logowanie danych wrażliwych.

Diagram

Diagram pokazuje, że cały proces od wejścia do publikacji powinien zostawić ślad pozwalający odtworzyć jego przebieg.

Powiązane hasła

Polityka użycia AI
SSO / IAM
DLP
Fact-checking
Human-in-the-loop