To som už sám vysvetľoval tu niekoľko krát. Presný princíp ako to funguje. Ono vôbec nepozná význam slov, pretože to ani nepracuje so slovami, ale s tokeny, čo sú v podstate časti textu. V modely môže moja prvá veta vyzerať takto:
["To s", "om ", "už s", "ám vy", "svet", "ľov", "al tu", " nie", "koľk", "o kr", "át", "."]
A asi "ám vy" samostatne nemá žiadny význam že? AI však vidí takýto token a vie že sa v trénovacích dátach vyskytuje X krát za sekvenciou "To som už s", a podľa generačnej teploty (ak by bola nastavená na nulu, vždy to dá deterministicky najčastejšie sa vyskytujúci token za sekvenciu tokenov, ak by bola hodnota 2 tak úplne náhodne vybere akýkoľvek token v modely, väčšina generačných algoritmov používa hodnoty okolo 0.7), a jednoduho to podľa toho vybere token a pripojí ku zvyšku. Totálne primitívny nástroj, ktorý ako si povedal, nikomu nechce škodiť a že to povedalo "umri" tak je to len následkom toho že toto bolo súčasťou sekvencie tokenov časté v trénovacích dátach. Aj keď by ste papagája učili rozprávať a milion krát by počul slovo "umri", tak by to asi vedelo zopakovať bez toho aby rozumelo čo vlastne to slovo znamená.
Žiadna AI neexistuje, len hlúpe LLM a generačné algoritmy. Ktoré tu máme už od 70 rokov, ak poznáte prediktívne písanie... je to presne to isté čo máte v mobilnej klávesnici keď navrhuje slova akurát vo väčšom, a namiesto slov to dává celé vety.