Po tym kursie dla podanej odpowiedzi modelu wskazać, jakiego źródła trzeba do jej weryfikacji; Dla danego przypadku dobrać właściwą mitygację: grounding, cytowanie lub eval.
Dlaczego teraz: rozpoznaje prostą halucynację modelu
✗ LLM zna prawde i mozna mu ufac jak encyklopedii.
Dlaczego kuszące: Brzmi sensownie na poziomie AI-0, dopóki nie pozna się kontrprzykładu.
✓ LLM przewiduje kolejny token na podstawie wzorcow jezykowych, nie sprawdza faktow. Przy faktach, prawie, zdrowiu i finansach wymagaj zrodla i weryfikacji.
✗ Halucynacja to rzadki bug, ktory znika w wiekszym modelu.
Dlaczego kuszące: Brzmi sensownie na poziomie AI-0, dopóki nie pozna się kontrprzykładu.
✓ Halucynacja to wlasciwosc generacji, nie bug. Wiekszy model halucynuje pewniej brzmiac. Mitygacja to grounding, cytowania i evals, nie sam rozmiar modelu.
✗ Token to to samo co slowo.
Dlaczego kuszące: Brzmi sensownie na poziomie AI-1, dopóki nie pozna się kontrprzykładu.
✓ Token to fragment tekstu (czesto sub-slowo). Limit kontekstu liczy tokeny, nie slowa. Dlugi prompt + dlugi kontekst RAG moga przekroczyc okno i obcia c istotne fragmenty.
✗ Embedding to wyszukiwanie po slowach kluczowych.
Dlaczego kuszące: Brzmi sensownie na poziomie AI-1, dopóki nie pozna się kontrprzykładu.
✓ Embedding koduje znaczenie w wektorze; bliskosc to podobienstwo semantyczne, nie zgodnosc liter. Dlatego synonim trafi, ale dokladny kod czy numer moze nie (stad hybrid search).
✗ Dobry prompt zastepuje architekture systemu.
Dlaczego kuszące: Brzmi sensownie na poziomie AI-1, dopóki nie pozna się kontrprzykładu.
✓ Prompt to jedna warstwa. Rozdziel: dane, retrieval, model, narzedzia, ewaluacje, monitoring, bezpieczenstwo. Prompt bez tych warstw nie skaluje sie i nie jest mierzalny.
✗ RAG gwarantuje poprawna odpowiedz.
Dlaczego kuszące: Brzmi sensownie na poziomie AI-1, dopóki nie pozna się kontrprzykładu.
✓ RAG moze pobrac zle zrodlo, zly fragment albo model moze zignorowac kontekst. RAG zmniejsza ryzyko, nie usuwa go. Potrzebne sa cytowania i evals.
✗ Temperatura 0 daje odpowiedz prawdziwa i powtarzalna w 100 procentach.
Dlaczego kuszące: Brzmi sensownie na poziomie AI-2, dopóki nie pozna się kontrprzykładu.
✓ Temperatura 0 zmniejsza losowosc, ale nie gwarantuje prawdy ani pelnego determinizmu (wplyw maja tez wersja modelu, batching, narzedzia). Prawda wymaga groundingu i weryfikacji.
✗ Tool calling to tylko ladniejszy prompt.
Dlaczego kuszące: Brzmi sensownie na poziomie AI-2, dopóki nie pozna się kontrprzykładu.
✓ Tool calling oddaje modelowi mozliwosc wywolania realnej akcji/danych ze schematem. To granica bezpieczenstwa: walidacja schematu, least privilege i budzet wywolan sa obowiazkowe.
✗ Baza wektorowa rozwiazuje kazdy problem wiedzy.
Dlaczego kuszące: Brzmi sensownie na poziomie AI-2, dopóki nie pozna się kontrprzykładu.
✓ Porownaj: vector dla podobienstwa znaczen, BM25 dla nazw/kodow/liczb, SQL dla danych strukturalnych, graf dla relacji i multi-hop. Wybor zalezy od typu pytania.
✗ Im wiecej i im wieksze chunki w kontekscie, tym lepsza odpowiedz.
Dlaczego kuszące: Brzmi sensownie na poziomie AI-2, dopóki nie pozna się kontrprzykładu.
✓ Za duze chunki rozmywaja sygnal i zjadaja okno; za male traca kontekst. Dobierz rozmiar i overlap do struktury dokumentu i mierz na eval secie, nie na oko.
✗ Cytowania to ozdoba dla uzytkownika.
Dlaczego kuszące: Brzmi sensownie na poziomie AI-2, dopóki nie pozna się kontrprzykładu.
✓ Cytowanie to mechanizm audytu i groundingu: pozwala sprawdzic, czy odpowiedz wynika z pobranego fragmentu. Bez mapowania zdanie -> zrodlo nie odroznisz groundingu od konfabulacji.
✗ Prompt injection to wina nieuwaznego uzytkownika.
Dlaczego kuszące: Brzmi sensownie na poziomie AI-2, dopóki nie pozna się kontrprzykładu.
✓ Injection przychodzi tez z pobranych danych i narzedzi (indirect injection). Traktuj kazdy zewnetrzny tekst jako niezaufany; oddziel instrukcje od danych i ogranicz uprawnienia narzedzi.
✗ Hybrid search jest zawsze lepszy niz samo dense.
Dlaczego kuszące: Brzmi sensownie na poziomie AI-3, dopóki nie pozna się kontrprzykładu.
✓ Hybrid pomaga gdy licza sie nazwy, kody, liczby. Dla czysto konwersacyjnej pamieci dodaje koszt i zlozonosc bez zysku. Decyduj na podstawie evalu, nie mody.
✗ Reranker naprawi zly indeks i zly chunking.
Dlaczego kuszące: Brzmi sensownie na poziomie AI-3, dopóki nie pozna się kontrprzykładu.
✓ Reranker poprawia kolejnosc kandydatow, ale nie wytworzy fragmentu, ktorego retrieval nie zwrocil. Najpierw popraw ingest, chunking i recall, potem reranking.
✗ Ewaluacja to dodatek na koniec projektu.
Dlaczego kuszące: Brzmi sensownie na poziomie AI-3, dopóki nie pozna się kontrprzykładu.
✓ Bez eval setu nie odroznisz poprawy od wrazenia poprawy. Eval (faithfulness, context precision/recall, answer relevancy) to czesc systemu, a nie raport po fakcie.
✗ Zla odpowiedz oznacza slaby model, wiec trzeba zmienic model.
Dlaczego kuszące: Brzmi sensownie na poziomie AI-3, dopóki nie pozna się kontrprzykładu.
✓ Najpierw zlokalizuj warstwe: czy fragment byl w danych, czy retrieval go zwrocil, czy prompt go uzyl, czy dopiero model zawiodl. Wymiana modelu bez diagnozy maskuje przyczyne.
✗ Agent dziala lepiej, im wieksza ma autonomie.
Dlaczego kuszące: Brzmi sensownie na poziomie AI-3, dopóki nie pozna się kontrprzykładu.
✓ Autonomia bez granic to ryzyko i koszt. Ustal tool budget, least privilege, human approval dla akcji wysokiego ryzyka i deterministyczne bramki stanu.
✗ GraphRAG jest najlepszy, wiec uzyjmy go wszedzie.
Dlaczego kuszące: Brzmi sensownie na poziomie AI-4, dopóki nie pozna się kontrprzykładu.
✓ Graf wygrywa przy relacjach, sieciach encji i multi-hop. Dla malego FAQ to nadmiarowy koszt budowy i utrzymania grafu. Dobierz wzorzec do pytania, nie do mody.
✗ Obserwowalnosc to wlaczone logi aplikacji.
Dlaczego kuszące: Brzmi sensownie na poziomie AI-4, dopóki nie pozna się kontrprzykładu.
✓ Potrzebne sa trace z atrybutami GenAI (model, tokeny, koszt, retrieval, latencja) wg konwencji OpenTelemetry, spiete z evalami. Same logi nie pokaza, dlaczego jakosc spadla.
✗ Wiekszy model zawsze jest najlepszym wyborem.
Dlaczego kuszące: Brzmi sensownie na poziomie AI-5, dopóki nie pozna się kontrprzykładu.
✓ Dodaj kryteria: koszt, latencja, prywatnosc, zadanie, jakosc na evalu, skalowanie. Gateway pozwala routowac model do zadania i miec fallback, zamiast jednego najwiekszego.
✗ Bezpieczenstwo dorobimy na koncu jako osobny etap.
Dlaczego kuszące: Brzmi sensownie na poziomie AI-5, dopóki nie pozna się kontrprzykładu.
✓ Ryzyka OWASP LLM (injection, wyciek danych, nadmierne uprawnienia) projektuj od poczatku: oddzielenie instrukcji od danych, least privilege, audit, red teaming jako proces ciagly.
✗ Governance to tylko dokumenty dla zgodnosci.
Dlaczego kuszące: Brzmi sensownie na poziomie AI-5, dopóki nie pozna się kontrprzykładu.
✓ NIST AI RMF (Govern, Map, Measure, Manage) to operacyjna petla zarzadzania ryzykiem spieta z evalami i monitoringiem, a nie jednorazowy dokument do szuflady.
Kurs „AI/LLM/RAG: pełna ścieżka architekta (AI-0..AI-6)” online uczy metodą SGPP, w której wiedza jest rozłożona na 32 atomy wiedzy - najmniejsze, sprawdzalne jednostki umiejętności. Zamiast definicji do wykucia dostajesz kontrastowe przypadki, prognozę, próbę i natychmiastowy, czteroczęściowy feedback. Kurs wprost rozbraja najczęstsze błędy myślowe i ćwiczy transfer wiedzy na realnych sytuacjach, nie na sztucznych zadaniach.
Uczysz się pętlą: prognoza → próba → natychmiastowy, 4-częściowy feedback (wynik, przyczyna, reguła, następny krok) → powtórka rozłożona w czasie. System dobiera następny krok pod Ciebie i mierzy retencję oraz transfer. Poznaj metodę →
Kurs prowadzi do mierzalnych umiejętności: Wyjaśnić LLM generuje tekst, nie zna prawdy - Dla podanej odpowiedzi modelu wskazać, jakiego źródła trzeba do jej weryfikacji; Zdefiniować Halucynacje i weryfikacja źródeł - Dla danego przypadku dobrać właściwą mitygację: grounding, cytowanie lub eval; Wyjaśnić Tokeny i okno kontekstowe - Oszacować, czy prompt plus kontekst zmieszczą się w oknie i co obciąć. Każdą z nich ćwiczysz i potwierdzasz w praktyce, a nie tylko czytasz.
Dla każdego, kto chce realnie opanować temat, a nie tylko o nim przeczytać - kurs sam dostraja poziom do Ciebie (od podstaw aż po zaawansowane), więc działa zarówno dla początkujących, jak i dla osób odświeżających wiedzę.
Kurs składa się z 32 atomy wiedzy; uczysz się we własnym tempie, a system planuje powtórki tak, by wiedza została z Tobą na dłużej.
Między innymi ten najczęstszy: „LLM zna prawde i mozna mu ufac jak encyklopedii.”. Kurs pokazuje, dlaczego jest kuszący i czym go zastąpić - to sedno metody OMNI.
OMNI uczy adaptacyjną pętlą: prognoza → próba → natychmiastowy feedback → powtórka rozłożona w czasie. Tak, kurs zaczynasz za darmo, bez karty.