ChatGPT nastavuje zrcadlo. Je jako nový juniorní kolega s minimem zkušeností, ale obrovským potenciálem. Chcete ho do týmu, ale zároveň se bojíte, aby vás nepřerostl. Otázka zní, jak něco takového efektivně využít?
ChatGPT je jistě nejznámější, ale jen jeden z rodiny tzv. velkých jazykových modelů (LLM, Large Language Models). Jsou optimalizovány pro generování textů k nerozeznání podobných těm vytvořeným lidmi bez ohledu na obsah a faktickou správnost, tu ještě nějakou dobu musí dodávat člověk.
První, naivní představa o použití se tak přímo rýsuje. Příspěvky na LinkedIn, pracovní e-maily, články na web nebo do časopisů potřebuje každá firma a faktů v nich může být pomálu. Brzy ale zjistíte, že skvělá forma je spíš fádní a stejná jako generované texty všech ostatních, tudy cesta nevede.
Pokud má být AI ve vašem businessu k něčemu, musí pomáhat v jádru toho, co děláte.
Přínosy využívané v Agnostix
Stojí tedy za to už dnes začít využívat jazykové modely a pokud ano, k čemu? Příklad z vlastní praxe – jako každá společnost zabývající se strojovým učením žijeme i my v neustálém hladu po dostatku kvalitních trénovacích dat.
Správným "promptem" – popichováním jazykového modelu ke generování textu – dokážeme získat ne sice 100%, ale poměrně kvalitní data za jednotky procent času a nákladů nutných ke sběru a zpracování dat skutečných. Včetně nutné přípravy a postprocessingu je zlevnění minimálně desetinásobné, a spolu s augmentací reálných dat jde o fungující metodu, která se už dnes rutinně využívá.
V oblasti samotného řízení dialogu nám umožňují jazykové modely zvýšit přesnost porozumění přirozené řeči a správnost reakcí o 10 až 15 %, což už chatbota dostává do pásma srovnatelného s živým člověkem. Klíčem je nenechat jazykový model řešit tuto úlohu samostatně jako celek, ale rozkouskovat ji na jednotlivé podproblémy a ty řešit v kombinaci se stávajícími metodami, které zajišťují spolehlivost a predikovatelnost (paralela s juniorním kolegou je již zcela očividná).
Nezanedbatelnou silou velkých jazykových modelů je vysoká přesnost při určování kontextu konverzace v delších výměnách mezi chatbotem a uživatelem. Tato vlastnost zlepšuje nejen výše uvedenou přesnost reakcí, ale zejména uživatelský zážitek a pocit z efektivní komunikace. To považujeme vůbec jako nejdůležitější vlastnost a pracnost jiných metod pro získání stejného výsledku je naprosto neporovnatelná – dokonce o několik řádů.
V kombinaci s "tradičnějšími" modely strojového učení – konvolučními sítěmi a transformery – také LLM generují vývojářům jednoduché, ale pracné části kódu, testují nebo například odhadují cenu softwarových projektů podle stručného zadání přesněji než většina analytiků nebo projektových manažerů. A nenechají se oklamat barevnou prezentací.