Kurs online: AI/LLM/RAG: pełna ścieżka architekta (AI-0..AI-6)

Po tym kursie dla podanej odpowiedzi modelu wskazać, jakiego źródła trzeba do jej weryfikacji; Dla danego przypadku dobrać właściwą mitygację: grounding, cytowanie lub eval.

Dlaczego teraz: rozpoznaje prostą halucynację modelu

32 atomów wiedzy · poziomy 1, 2, 3, 4, 5, 6, 7

Po tym kursie

Dla podanej odpowiedzi modelu wskazać, jakiego źródła trzeba do jej weryfikacji
Dla danego przypadku dobrać właściwą mitygację: grounding, cytowanie lub eval
Oszacować, czy prompt plus kontekst zmieszczą się w oknie i co obciąć
Wskazać przypadek, w którym sam embedding zawiedzie i czemu
Przepisać słaby prompt tak, by każdy z 5 elementów był jawny
Wskazać dwa miejsca, w których RAG może dać błędną odpowiedź mimo poprawnej budowy
Dla danego zadania dobrać temperaturę i uzasadnić wybór
Wskazać, jakie zabezpieczenia obowiązują, gdy model wywołuje narzędzie
Wskazać typ pytania, którego sama baza wektorowa nie obsłuży dobrze
Wskazać 2 sytuacje, w których Basic RAG to zły wybór
Dobrać strategię cięcia do struktury dokumentu i uzasadnić rozmiar i overlap
Zaprojektować wymóg cytowania i regułę odrzucania odpowiedzi bez pokrycia
Wskazać 3 mechanizmy obrony przed injection w systemie RAG
Zdecydować na podstawie typu zapytań, czy hybryda się opłaca
Wskazać, kiedy problemem jest recall, a kiedy kolejność
Zbudować mały eval set i wskazać, co mierzy każda metryka
Dla danego objawu wskazać najbardziej prawdopodobną warstwę i test, który to potwierdzi
Wskazać, gdzie wstawić granice autonomii i czemu MCP ułatwia integrację
Wskazać przypadek, w którym graf jest właściwym narzędziem, a nie nadmiarem
Rozróżnić pytanie globalne (community summary) od lokalnego (subgraph) i dobrać mechanizm
Uzasadnić wybór wzorca mini-evalem zamiast preferencją
Wskazać, kiedy agentic RAG jest złym wyborem
Wskazać, które atrybuty span trzeba zbierać, by zdiagnozować spadek jakości
Dobrać optymalizację kosztu bez utraty jakości i uzasadnić ją pomiarem
Zaprojektować pętlę ewaluacji ciągłej warunkującą wdrożenie zmiany
Zaprojektować regułę routingu modelu wg jakości, kosztu, prywatności i latencji
Obronić wybór, jawnie wskazując trade-offy i warunki rewizji
Zaprojektować least privilege i redakcję PII w systemie z narzędziami
Powiązać Measure z evalami i monitoringiem systemu
Zdefiniować SLO mierzalne dla systemu AI i sposób ich monitorowania
Zaprojektować szkielet z komponentami wielokrotnego użytku i punktami decyzyjnymi
Zaprojektować platformę self-service i model własności oraz governance organizacji

Najczęstsze błędy, które ten kurs rozbraja

✗ LLM zna prawde i mozna mu ufac jak encyklopedii.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-0, dopóki nie pozna się kontrprzykładu.

✓ LLM przewiduje kolejny token na podstawie wzorcow jezykowych, nie sprawdza faktow. Przy faktach, prawie, zdrowiu i finansach wymagaj zrodla i weryfikacji.

✗ Halucynacja to rzadki bug, ktory znika w wiekszym modelu.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-0, dopóki nie pozna się kontrprzykładu.

✓ Halucynacja to wlasciwosc generacji, nie bug. Wiekszy model halucynuje pewniej brzmiac. Mitygacja to grounding, cytowania i evals, nie sam rozmiar modelu.

✗ Token to to samo co slowo.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-1, dopóki nie pozna się kontrprzykładu.

✓ Token to fragment tekstu (czesto sub-slowo). Limit kontekstu liczy tokeny, nie slowa. Dlugi prompt + dlugi kontekst RAG moga przekroczyc okno i obcia c istotne fragmenty.

✗ Embedding to wyszukiwanie po slowach kluczowych.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-1, dopóki nie pozna się kontrprzykładu.

✓ Embedding koduje znaczenie w wektorze; bliskosc to podobienstwo semantyczne, nie zgodnosc liter. Dlatego synonim trafi, ale dokladny kod czy numer moze nie (stad hybrid search).

✗ Dobry prompt zastepuje architekture systemu.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-1, dopóki nie pozna się kontrprzykładu.

✓ Prompt to jedna warstwa. Rozdziel: dane, retrieval, model, narzedzia, ewaluacje, monitoring, bezpieczenstwo. Prompt bez tych warstw nie skaluje sie i nie jest mierzalny.

✗ RAG gwarantuje poprawna odpowiedz.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-1, dopóki nie pozna się kontrprzykładu.

✓ RAG moze pobrac zle zrodlo, zly fragment albo model moze zignorowac kontekst. RAG zmniejsza ryzyko, nie usuwa go. Potrzebne sa cytowania i evals.

✗ Temperatura 0 daje odpowiedz prawdziwa i powtarzalna w 100 procentach.