Umělá inteligence (AI) patří aktuálně k nejčastěji skloňovaným termínům. Za téměř synonymum pro AI je často nesprávně považován i ChatGPT.
Umělá inteligence (AI) patří aktuálně k nejčastěji skloňovaným termínům. Za téměř synonymum pro AI je často nesprávně považován i ChatGPT.
Ve skutečnosti jde pouze o určitý segment AI, velký jazykový model vyvinutý společností OpenAI. Jazykové modely jsou algoritmy strojového učení, které se učí předpovídat slova a věty v jazyce, a mohou být použity k různým úkolům, jako je strojový překlad, rozpoznávání řeči, psaní textů a mnoho dalších.
ChatGPT byl natrénován na obrovském množství textových dat, aby byl schopen generovat přirozeně znějící odpovědi na různé dotazy a komentáře od uživatelů. Využívá se především pro odpovědi na nejrůznější dotazy, generování textů a další úkoly, které vyžadují schopnost porozumět jazyku a vytvářet přirozeně znějící odpovědi. Svou nezastupitelnou roli hraje také ve vývoji ICT produktů.
Celospolečenské okouzlení umělou inteligencí a úžas nad schopnostmi ChatGPT se ale pomalu začínají mísit s obavami z blízké budoucnosti. Kam až můžeme v trénování AI zajít? Může se vývoj AI vymknout kontrole, nebo třeba: kdy se tak stane? Opravdu dokáží AI, ChatGPT a další nástroje nahradit celé skupiny profesí od učitelů a právníků přes kreativce a redaktory až po programátory nebo vývojáře? Osobnosti světové vědy, výzkumu i byznysu, jako spoluzakladatel Applu Steve Wozniak, spoluzakladatel Skypu Jaan Tallinn či Elon Musk v otevřeném dopise
„Pozastavte obří experimenty s umělou inteligencí“ varovali nedávno před překotným tempem rozvoje i možnými hrozbami a požadovali ukončit vývoj AI. Itálie dokonce v jeden moment zakázala používání ChatGPT na celém svém území a další státy ji chtěly následovat.
Otázek o směřování a rychlém vývoji AI je opravdu hodně a pochybnosti v oblasti etiky jsou jistě v mnoha ohledech oprávněné. My ale můžeme směle říct, že v TeskaLabs využíváme její potenciál pro dobro všech, kteří se pohybují v online prostředí. S ChatGPT a jeho nejpokročilejší verzí, Chat GPT-4, pracujeme denně. AI nám umožňuje vytvářet pokročilé nástroje a produkty, které pomáhají zajistit a udržovat kyberprostor bezpečnější.
Tentokrát od nás dostal ChatGPT-4 jasné zadání: popsat, jak lze vytvořit umělou inteligenci, která pomůže uživatelům vytvořit parser zpráv protokolu pomocí deklarativního jazyka. Podívejte se, jak zdatně si s úkolem poradil. My jsme tedy byli příjemně překvapeni!
1. Zvolte deklarativní jazyk: Je třeba zvolit vhodný deklarativní jazyk pro definici pravidel parsování. Mezi oblíbené volby patří Prolog, SQL nebo vlastní doménově specifický jazyk (DSL) přizpůsobený pro parsování protokolů.
2. Definujte datový model: Určete strukturu zpráv protokolu, které chcete analyzovat, včetně polí, datových typů a případných vztahů mezi poli.
3. Vytvořte knihovnu pravidel pro parsování: Vytvořte sadu pravidel ve zvoleném deklarativním jazyce, která představují běžné vzory zpráv protokolu. Pravidla by měla být schopna extrahovat a transformovat data ze zpráv protokolu podle datového modelu.
4. Navrhněte systém AI: Navrhněte systém AI tak, aby bylo možné definovat uživatelské vstupy pro definování pravidel analýzy, aplikovat pravidla na zprávy protokolu a výstupy výsledků ve strukturovaném formátu. To bude pravděpodobně zahrnovat zpracování přirozeného jazyka (NLP) pro pochopení uživatelského vstupu, rule engine pro aplikaci pravidel parsování a generátor výstupů pro formátování výsledků.
5. Trénink umělé inteligence: Trénujte AI pomocí souboru dat zpráv protokolu a odpovídajících pravidel pro jejich analýzu. To pomůže AI naučit se porozumět uživatelským vstupům a použít příslušná pravidla k efektivnímu rozboru zpráv protokolu.
6. Vytvořte uživatelské rozhraní: Navrhněte uživatelsky přívětivé rozhraní, které umožní uživatelům komunikovat s AI, zadávat pravidla pro parsování a zobrazovat výsledky parsování protokolů.
7. Otestujte a zdokonalte AI: Otestujte výkonnost AI na různých zprávách protokolů a uživatelských vstupech. Zjistěte případné problémy nebo omezení a podle potřeby AI zdokonalte.
Ad bod 1:
Máme splněno, protože už několik let vyvíjíme vlastní doménově specifický jazyk (DSL) také pro parsování logů. SP-Lang (Stream Processing Language) je navržen tak, aby byl intuitivní a snadno použitelný i pro ty, kteří se s programováním zrovna nepřátelí. Jeho používání by mělo být stejně jednoduché jako používání maker v tabulkovém procesoru nebo jazyka SQL. To umožní provádět výkonné úlohy zpracování dat s minimálním úsilím.
Více informací najdete zde:
Ad body 2 a 3:
Ani tady nejsme pozadu. Vytváříme vlastní knihovnu LogMan.io Common Library, která obsahuje pravidla pro parsování, napsaná v našem jazyce SP-Lang (viz bod 1).
Ad body 4 a dále:
Tady trochu nahlížíme do budoucnosti, i když spoustu vizionářských kroků úspěšně naplňujeme už několik let.
V druhé části dotazu se měl Chat-GPT4 vyjádřit k možnostem implementace. I zde můžeme zkonstatovat, že jsme byli s jeho návrhy víceméně spokojeni.
1. Shromážděte vzorové zprávy protokolu a vytvořte dataset.
2. Zvolte programovací jazyk (např. Python) a implementujte vybraný deklarativní jazykový parser nebo použijte existující knihovnu, je-li k dispozici.
3. Implementujte rule engine, který přijme pravidla deklarativního parsování, a aplikuje je na zprávy protokolu. To může zahrnovat porovnávání vzorů, regulární výrazy nebo jiné techniky.
4. Implementujte komponenty NLP pro interpretaci uživatelského vstupu a jeho převod na pravidla parsování.
5. Natrénujte AI pomocí datové sady zpráv protokolu a odpovídajících pravidel parsování.
6. Implementujte generátor výstupů, který zformátuje výsledky parsování logů podle datového modelu.
7. Vypracujte uživatelské rozhraní pro interakci se systémem AI.
8. Otestujte AI na různých zprávách protokolů a uživatelských vstupech, podle potřeby jej zdokonalte a nasaďte.
Chat-GPT4 nás ještě upozorní, že vývoj vlastní AI není úplně jednoduchá záležitost: „Nezapomeňte, že vytvoření umělé inteligence pro tento účel je složitý úkol, který bude vyžadovat důkladné znalosti deklarativních jazyků, analýzy protokolů a vývoje umělé inteligence.“
Ad bod 1:
Vytváříme Log Arenu, tedy dataset logů určených pro parsování, abychom ověřili správnost parsování a trénovali AI.
Ad bod 2:
Používáme Python.
Ad bod 3:
Náš rule engine se jmenuje LogMan.io Parsec. Jedná se o slovní hříčku na „parser”*, tedy technologii pro parsování logu. Parser využívá pravidla z knihovny, která jsou napsána v SP-Langu. I díky účinnému způsobu parsování je náš produkt výjimečný.
Ostatní body z této části zatím patří do módu vizionářství, ale jak se říká, všeho do času.
Co říct na závěr? Samozřejmě do jisté míry chápeme všeobecnou fascinaci možnostmi umělé inteligence, ale pro TeskaLabs nejde o žádnou novinku. Mimořádný potenciál
AI už dlouho využíváme k vývoji našich unikátních produktů, které přispívají ke zlepšení kybernetické bezpečnosti. A co vy – vnímáte současný vývoj AI jako mimořádnou příležitost, jak se posunout dál v oblasti poznání, vědy a výzkumu, nebo u vás převažují obavy o budoucnost lidstva?
Autor komentáře: Aleš Teska, CEO TeskaLabs
KOMENTÁŘE