V návaznosti na #AI workshop na Vysoké škole ekonomické v Praze z dubna 2024 jsme v Omnicrane a Prague Data Ethics Lab připravili shrnující článek formou komentované infografiky, kde ukážeme hlavní poznatky o LLMs a Prompt Engineeringu jenž na workshopu zazněly.
Image Demo: Generated by Dall-E by the following prompts:
User prompt: "I want you to generate artwork which would represent the long road we have gone from Recurrent Neural Network technology to Transformer technology in GPT4."
GPT assisted prompt: "A metaphorical landscape representing the evolution of neural network technology from basic neural cells to GPT-4 Transformers, enhanced by visible synapses connected by luminous...etc."
Add manually in Canva: "Images of Brain & Transformer generated separately in Dall-E"
Umělá inteligence (AI), zvláště modely typu Large Language Models (LLM), představují přelom v technologickém vývoji, který změnil, jak interagujeme s informacemi a digitálním obsahem. Tyto LLM modely jsou obvykle před-trénované na obrovských datových souborech, kde nejznámější jsou aktuálně rozsáhlé projekty firem OpenAI, Google a Anthropic postavené jako GPT (Generative Pre-training Transformer). Intenzivní před-trénování a techniky vyladění (např. Fine-tunning via PEFT, LORA a RLHF) daným LLMs umožňují generovat řadu nových artefaktů. Generované texty, obrázky, videa a mnohé další mohou být překvapivě koherentní a relevantní v závislosti na kvalitě zadání od “Prompt engineers” pokud jde o kvalifikovaného uživatele.
V rámci zmíněného workshopu jsme v rámci širšího týmu řešitelů jako více různých prompt engineers z různých firem, jež uvádíme v souhrnné agendě závěrem, představili pět následujících a oddělených témat spojených s Prompt engineeringem:
Základem LLMs je dnes nejčastěji architektura zvaná Transformer, která byla představena v roce 2017 firmou Google v jejich zásadním článku z roku 2017 s názvem "Attention Is All You Need". V tomto článku firma ukázala model Transformer, který upouští od rekurentních vrstev běžně používaných v předchozích modelech pro úlohy, jako je strojový překlad. Transformer se od té doby stal základní architekturou pro mnoho dalších vývojových kroků v oblasti zpracování přirozeného jazyka (NLP - Natural Language Processing), včetně modelů jako GPT či BERT (Bidirectional Encoder Representations from Transformers). Tato architektura dnes umožňuje modelům zpracovávat a generovat text s vysokou úrovní kontextového porozumění, díky mechanismům jako jsou self-attention a positional encoding.
Image 1: Cesta od RNN k Tranformer architektuře
Existují mnoho dobře známých prompting technik jako je nastavení Digital Persona, kontextu, delimiterů dle Markdown syntaxe a další uvedené dále v rámci vizualizace. Dnes dokonce existují speciální webová tržiště, kde se dají ty nejlepší prompty koupit. Prompting lze však v obecnější rovině přirovnat k umění komunikace mezi lidmi. Tedy musíte vědět, co chcete říct, dobře to formulovat s ohledem na partnera, tak abyste dostali výsledek, který odpovídá Vašemu specifickému úkolu.
Níže uvádíme shrnutí technik formou vizuálu a také seznam dobrých zdrojů, kde lze adoptovat nejlepší praktiky z oblasti prompt engineeringu:
Image 2: Prompting techniky nejsou všelék, je potřeba umět s LLMs “mluvit”
Všichni máme dostupné stejné nástroje pro GenAI a někdy máme na pár kliků umělecký výtvor a někdy jen zahlcujeme infosféru “trhaným videem”, co neumí artikulovat česky nebo jinými ne-anglickými jazyky.
V rámci zmíněného workshopu jsme představili následující nástroje vhodné pro generování obrázků a videa včetně jejich limitů a specifičnosti.
Image 3: Obrázky může generovat každý, ale ne vždy se na to dá koukat
LLMs může datovým vědcům i studentům informatiky ušetřit hodně práce při řešení dílčích kroků spojených s rutinní prací a před-zpracovaním nebo interpretací dat. Například není problém do ChatGPT vložit soubor v CSV formátu a požádat o úpravu formátování nebo inkrementálními instrukcemi provést celou ETL (Extract-Transform-Load) proceduru.
Zajímavou možností je začít datové operace pomocí LLM instrukcí zadávaných v běžném jazyce, ale pokud dospějeme do okamžiku, kdy bude efektivnější pokračovat již jako programátor v konkrétním jazyce není problém nechat si ukázat Python kód, který můžeme dále upravovat sami v Jupyter Notebooks či nějakém IDE.
Kromě možnosti využít LLM pro zpracování numerických úloh, které má své limity, naopak LLM často exceluje a překonává běžného datového výzkumníka při zpracování textových řetězců a jazyka obecně. Nejde jen o běžné úlohy identifikace sentimentu pisatelů textu, ale i o více komplexní zpracování jako je například oblast fake news. Na workshopu byl uveden příklad analýzy aktuálního případu slovenských prezidentských voleb ve 2024. ChatGPT jsme použili k odhalení vzorců manipulativního jednání i porovnání faktů z nezávislých zdrojů a zavádějících novinových příspěvků jednoho konkrétního prezidentského kandidáta. Výsledky LLM byly výrazně lepší než u jiných specifických data science tools aplikovaných na stejný úkol.
Image 4: LLM často usnadní práci s daty a exceluje při zpracování textu
LLMs způsobily revoluci v možnostech chatbotů, řízení pracovních postupů i automatizace a umožnily komplexnější řešení v různých odvětvích. Chatboti využívající LLM mohou zpracovávat složité dotazy zákazníků s vysokou přesností a rychlostí odezvy podobnou lidské, což výrazně zlepšuje uživatelskou zkušenost a provozní efektivitu.
V oblasti automatizace pracovních postupů tyto modely pomáhají zefektivnit podnikové procesy tím, že inteligentně automatizují rutinní úkoly a poskytují podporu při rozhodování, čímž uvolňují lidské zdroje pro jiné činnosti. Integrace LLM s pokročilými automatizačními nástroji navíc často vede k inovativním aplikacím v konkrétních oborech jako jsou např. finance při hodnocení rizik v reálném čase, zpracování faktur nebo právní služby pro analýzu dokumentů. Tato řešení nejen zvyšují produktivitu, ale také posouvají hranice toho, čeho mohou automatizované systémy dosáhnout, a mění tak obchodní operace a interakce se zákazníky.
Většina firem dnes staví ChatBoty nad OpenAI produktem ChatGPT, který je spíše vhodný pro obecnou konverzaci nikoliv oborově specifická řešení s unikátní přidanou hodnotou a odpověďmi. Navrhnout oborové LLM řešení by totiž znamenalo dodatečné trénování LLM, specifická data, a hodně často i chain-of-models a automatizace pro vyřešení komplexní úlohy na což firmám chybí znalosti i data.
Image 5: Stavět komplexní řešení a Chatboty lze dělat buď dobře nebo rychle
Tento článek sepsali a obrázky vygenerovali pomocí LLMs společně autoři: Richard A. Novák a Jiří Korčák z Omnicrane jako shrnutí konference pořádané dne 10. dubna 2024 Prague Data Ethics Lab a Omnicrane. Na akci se dále podíleli příspěvky kolegové z PwC, V# Venture studia a Slezské Univerzity Opava. Názvy a pořadí příspěvků konference s přiřazení jednotlivých autorům k tématům uvádíme na obrázku níže, jenž tvořil původní pozvánku na konferenci.