Kurs online: AI/LLM/RAG: pełna ścieżka architekta (AI-0..AI-6)

Po tym kursie dla podanej odpowiedzi modelu wskazać, jakiego źródła trzeba do jej weryfikacji; Dla danego przypadku dobrać właściwą mitygację: grounding, cytowanie lub eval.

Dlaczego teraz: rozpoznaje prostą halucynację modelu

32 atomów wiedzy · poziomy 1, 2, 3, 4, 5, 6, 7

Po tym kursie

Najczęstsze błędy, które ten kurs rozbraja

LLM zna prawde i mozna mu ufac jak encyklopedii.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-0, dopóki nie pozna się kontrprzykładu.

LLM przewiduje kolejny token na podstawie wzorcow jezykowych, nie sprawdza faktow. Przy faktach, prawie, zdrowiu i finansach wymagaj zrodla i weryfikacji.

Halucynacja to rzadki bug, ktory znika w wiekszym modelu.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-0, dopóki nie pozna się kontrprzykładu.

Halucynacja to wlasciwosc generacji, nie bug. Wiekszy model halucynuje pewniej brzmiac. Mitygacja to grounding, cytowania i evals, nie sam rozmiar modelu.

Token to to samo co slowo.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-1, dopóki nie pozna się kontrprzykładu.

Token to fragment tekstu (czesto sub-slowo). Limit kontekstu liczy tokeny, nie slowa. Dlugi prompt + dlugi kontekst RAG moga przekroczyc okno i obcia c istotne fragmenty.

Embedding to wyszukiwanie po slowach kluczowych.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-1, dopóki nie pozna się kontrprzykładu.

Embedding koduje znaczenie w wektorze; bliskosc to podobienstwo semantyczne, nie zgodnosc liter. Dlatego synonim trafi, ale dokladny kod czy numer moze nie (stad hybrid search).

Dobry prompt zastepuje architekture systemu.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-1, dopóki nie pozna się kontrprzykładu.

Prompt to jedna warstwa. Rozdziel: dane, retrieval, model, narzedzia, ewaluacje, monitoring, bezpieczenstwo. Prompt bez tych warstw nie skaluje sie i nie jest mierzalny.

RAG gwarantuje poprawna odpowiedz.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-1, dopóki nie pozna się kontrprzykładu.

RAG moze pobrac zle zrodlo, zly fragment albo model moze zignorowac kontekst. RAG zmniejsza ryzyko, nie usuwa go. Potrzebne sa cytowania i evals.

Temperatura 0 daje odpowiedz prawdziwa i powtarzalna w 100 procentach.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-2, dopóki nie pozna się kontrprzykładu.

Temperatura 0 zmniejsza losowosc, ale nie gwarantuje prawdy ani pelnego determinizmu (wplyw maja tez wersja modelu, batching, narzedzia). Prawda wymaga groundingu i weryfikacji.

Tool calling to tylko ladniejszy prompt.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-2, dopóki nie pozna się kontrprzykładu.

Tool calling oddaje modelowi mozliwosc wywolania realnej akcji/danych ze schematem. To granica bezpieczenstwa: walidacja schematu, least privilege i budzet wywolan sa obowiazkowe.

Baza wektorowa rozwiazuje kazdy problem wiedzy.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-2, dopóki nie pozna się kontrprzykładu.

Porownaj: vector dla podobienstwa znaczen, BM25 dla nazw/kodow/liczb, SQL dla danych strukturalnych, graf dla relacji i multi-hop. Wybor zalezy od typu pytania.

Im wiecej i im wieksze chunki w kontekscie, tym lepsza odpowiedz.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-2, dopóki nie pozna się kontrprzykładu.

Za duze chunki rozmywaja sygnal i zjadaja okno; za male traca kontekst. Dobierz rozmiar i overlap do struktury dokumentu i mierz na eval secie, nie na oko.

Cytowania to ozdoba dla uzytkownika.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-2, dopóki nie pozna się kontrprzykładu.

Cytowanie to mechanizm audytu i groundingu: pozwala sprawdzic, czy odpowiedz wynika z pobranego fragmentu. Bez mapowania zdanie -> zrodlo nie odroznisz groundingu od konfabulacji.

Prompt injection to wina nieuwaznego uzytkownika.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-2, dopóki nie pozna się kontrprzykładu.

Injection przychodzi tez z pobranych danych i narzedzi (indirect injection). Traktuj kazdy zewnetrzny tekst jako niezaufany; oddziel instrukcje od danych i ogranicz uprawnienia narzedzi.

Hybrid search jest zawsze lepszy niz samo dense.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-3, dopóki nie pozna się kontrprzykładu.

Hybrid pomaga gdy licza sie nazwy, kody, liczby. Dla czysto konwersacyjnej pamieci dodaje koszt i zlozonosc bez zysku. Decyduj na podstawie evalu, nie mody.

Reranker naprawi zly indeks i zly chunking.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-3, dopóki nie pozna się kontrprzykładu.

Reranker poprawia kolejnosc kandydatow, ale nie wytworzy fragmentu, ktorego retrieval nie zwrocil. Najpierw popraw ingest, chunking i recall, potem reranking.

Ewaluacja to dodatek na koniec projektu.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-3, dopóki nie pozna się kontrprzykładu.

Bez eval setu nie odroznisz poprawy od wrazenia poprawy. Eval (faithfulness, context precision/recall, answer relevancy) to czesc systemu, a nie raport po fakcie.

Zla odpowiedz oznacza slaby model, wiec trzeba zmienic model.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-3, dopóki nie pozna się kontrprzykładu.

Najpierw zlokalizuj warstwe: czy fragment byl w danych, czy retrieval go zwrocil, czy prompt go uzyl, czy dopiero model zawiodl. Wymiana modelu bez diagnozy maskuje przyczyne.

Agent dziala lepiej, im wieksza ma autonomie.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-3, dopóki nie pozna się kontrprzykładu.

Autonomia bez granic to ryzyko i koszt. Ustal tool budget, least privilege, human approval dla akcji wysokiego ryzyka i deterministyczne bramki stanu.

GraphRAG jest najlepszy, wiec uzyjmy go wszedzie.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-4, dopóki nie pozna się kontrprzykładu.

Graf wygrywa przy relacjach, sieciach encji i multi-hop. Dla malego FAQ to nadmiarowy koszt budowy i utrzymania grafu. Dobierz wzorzec do pytania, nie do mody.

Obserwowalnosc to wlaczone logi aplikacji.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-4, dopóki nie pozna się kontrprzykładu.

Potrzebne sa trace z atrybutami GenAI (model, tokeny, koszt, retrieval, latencja) wg konwencji OpenTelemetry, spiete z evalami. Same logi nie pokaza, dlaczego jakosc spadla.

Wiekszy model zawsze jest najlepszym wyborem.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-5, dopóki nie pozna się kontrprzykładu.

Dodaj kryteria: koszt, latencja, prywatnosc, zadanie, jakosc na evalu, skalowanie. Gateway pozwala routowac model do zadania i miec fallback, zamiast jednego najwiekszego.

Bezpieczenstwo dorobimy na koncu jako osobny etap.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-5, dopóki nie pozna się kontrprzykładu.

Ryzyka OWASP LLM (injection, wyciek danych, nadmierne uprawnienia) projektuj od poczatku: oddzielenie instrukcji od danych, least privilege, audit, red teaming jako proces ciagly.

Governance to tylko dokumenty dla zgodnosci.

Dlaczego kuszące: Brzmi sensownie na poziomie AI-5, dopóki nie pozna się kontrprzykładu.

NIST AI RMF (Govern, Map, Measure, Manage) to operacyjna petla zarzadzania ryzykiem spieta z evalami i monitoringiem, a nie jednorazowy dokument do szuflady.

Wielkie idee kursu

Jak uczy OMNI

Kurs „AI/LLM/RAG: pełna ścieżka architekta (AI-0..AI-6)” online uczy metodą SGPP, w której wiedza jest rozłożona na 32 atomy wiedzy - najmniejsze, sprawdzalne jednostki umiejętności. Zamiast definicji do wykucia dostajesz kontrastowe przypadki, prognozę, próbę i natychmiastowy, czteroczęściowy feedback. Kurs wprost rozbraja najczęstsze błędy myślowe i ćwiczy transfer wiedzy na realnych sytuacjach, nie na sztucznych zadaniach.

Uczysz się pętlą: prognoza → próba → natychmiastowy, 4-częściowy feedback (wynik, przyczyna, reguła, następny krok) → powtórka rozłożona w czasie. System dobiera następny krok pod Ciebie i mierzy retencję oraz transfer. Poznaj metodę →

Najczęstsze pytania

Czego nauczę się na kursie „AI/LLM/RAG: pełna ścieżka architekta (AI-0..AI-6)”?

Kurs prowadzi do mierzalnych umiejętności: Wyjaśnić LLM generuje tekst, nie zna prawdy - Dla podanej odpowiedzi modelu wskazać, jakiego źródła trzeba do jej weryfikacji; Zdefiniować Halucynacje i weryfikacja źródeł - Dla danego przypadku dobrać właściwą mitygację: grounding, cytowanie lub eval; Wyjaśnić Tokeny i okno kontekstowe - Oszacować, czy prompt plus kontekst zmieszczą się w oknie i co obciąć. Każdą z nich ćwiczysz i potwierdzasz w praktyce, a nie tylko czytasz.

Dla kogo jest ten kurs?

Dla każdego, kto chce realnie opanować temat, a nie tylko o nim przeczytać - kurs sam dostraja poziom do Ciebie (od podstaw aż po zaawansowane), więc działa zarówno dla początkujących, jak i dla osób odświeżających wiedzę.

Jak długo trwa kurs?

Kurs składa się z 32 atomy wiedzy; uczysz się we własnym tempie, a system planuje powtórki tak, by wiedza została z Tobą na dłużej.

Jakie błędy rozbraja ten kurs?

Między innymi ten najczęstszy: „LLM zna prawde i mozna mu ufac jak encyklopedii.”. Kurs pokazuje, dlaczego jest kuszący i czym go zastąpić - to sedno metody OMNI.

Jak uczy OMNI i czy mogę zacząć za darmo?

OMNI uczy adaptacyjną pętlą: prognoza → próba → natychmiastowy feedback → powtórka rozłożona w czasie. Tak, kurs zaczynasz za darmo, bez karty.

← Wszystkie kursy