Bezpečné nasadenie AI vo firme: Prečo nevkladať zmluvy do verejného ChatGPT

Od nolimeo · 31. marca 2026
banner image

Predstavte si situáciu: nákupný manažér alebo interný právnik dostane na stôl päťdesiatstranovú dodávateľskú zmluvu so zložitými prílohami a cenovými maticami. Tlačí ho čas, preto si chce prácu zjednodušiť. Skopíruje celý text zmluvy, ktorý obsahuje dôverné finančné podmienky, mená kľúčových klientov a obchodné klauzuly, a vloží ho do bezplatného webového rozhrania ChatGPT s požiadavkou: „Zosumarizuj mi riziká a skryté pokuty v tomto dokumente.“ Výsledok príde o pár sekúnd. Práca je hotová, no firma práve stratila kontrolu nad tým, kam sa citlivý obsah dostal.

V takom momente môžu odísť dôverné obchodné informácie, osobné údaje alebo zmluvne chránené dáta mimo zabezpečenú firemnú infraštruktúru. Podľa typu nástroja, nastavenia účtu a zmluvných podmienok môže ísť o problém z pohľadu NDA, GDPR, interných bezpečnostných pravidiel alebo firemnej compliance.

V technologickom štúdiu nolimeo pomáhame firmám zavádzať umelú inteligenciu tak, aby mali dáta a prístupy pod kontrolou. V tomto technickom sprievodcovi si rozoberieme, prečo verejné AI nástroje predstavujú riziko, aký je rozdiel medzi spotrebiteľským webchatom a vývojárskym API a kedy dáva zmysel enterprise API so Zero-Data-Retention (ZDR) alebo self-hosted open-source model.


1. Prečo verejný ChatGPT predstavuje bezpečnostné riziko pre firmu

Bezplatné rozhrania a bežné spotrebiteľské verzie verejných AI nástrojov, ako ChatGPT, Claude alebo Gemini, nie sú automaticky navrhnuté ako firemná infraštruktúra na spracovanie citlivých dokumentov. Problémom nie je samotná AI, ale nejasné pravidlá, kto má k dátam prístup, kde sa ukladajú a na aký účel sa môžu použiť.

 [ Zamestnanec ] ──(Skopírovaná zmluva / GDPR dáta)──► [ Verejný ChatGPT Web UI ]
                                                              │
                                                   (Spracovanie mimo firemnej infraštruktúry)
                                                              │
                                                              ▼
                                                 [ Cudzia infraštruktúra ]
                                            (Riziko straty kontroly nad dátami)

Riziko A: Nejasné použitie dát a tréning modelov

Pri spotrebiteľských AI nástrojoch treba vždy rozlišovať konkrétnu službu, typ účtu a zmluvné podmienky. Niektoré dáta sa môžu ukladať na účely bezpečnosti, kontroly zneužitia alebo zlepšovania služby. Ak vaša zmluva obsahuje unikátnu cenotvorbu, obchodné tajomstvo alebo osobné údaje, nemala by sa do takého prostredia dostať bez jasného právneho a technického rámca.

Riziko B: Strata kontroly nad citlivým kontextom

Aj keď je priame zobrazenie vašej zmluvy inému používateľovi nepravdepodobné, problém je inde. Firma nevie jednoducho preukázať, kto dokument spracoval, kde bol uložený, ako dlho zostal v logoch a či sa k nemu dá spätne pristúpiť. Pri audite bezpečnosti alebo právnom spore je práve táto kontrola často dôležitejšia než samotný text odpovede.

Riziko C: GDPR, DPA a prenos dát mimo firmy

Zmluvy často obsahujú mená zamestnancov, podpisy, e-maily, finančné údaje alebo iné osobné dáta. Ak ich odošlete do nástroja bez jasnej sprostredkovateľskej zmluvy (Data Processing Agreement, DPA), bez kontroly regiónu spracovania a bez pravidiel pre uchovávanie dát, vzniká zbytočné právne aj reputačné riziko.


2. Bezpečné riešenie I: Enterprise Developer API s Zero-Data-Retention (ZDR)

Prvým krokom k bezpečnejšiemu využitiu AI je jasne oddeliť spotrebiteľské aplikácie od firemných integrácií. Ak vaša firma potrebuje používať modely ako GPT-4o alebo Claude, riešením často nie je webový chat, ale integrácia cez programátorské rozhranie (API).

Aký je rozdiel medzi webchatom a Developer API?

Pri API rozhraniach veľkých poskytovateľov sa zvyčajne dajú nastaviť jasnejšie pravidlá spracovania dát, prístupov, logovania a zmluvných podmienok. V praxi to znamená, že dáta môžu slúžiť len na vykonanie požiadavky (inferenciu) a uchovávať sa len obmedzený čas z dôvodu bezpečnostného monitoringu alebo kontroly zneužitia.

Zero-Data-Retention (ZDR)

Pre odvetvia s vyššími bezpečnostnými nárokmi, ako finančné systémy, spracovanie platieb alebo zdravotníctvo, môže dávať zmysel požiadať poskytovateľa o režim Zero-Data-Retention.

  • Odoslané dáta sa spracujú len na účel odpovede a nemajú sa ukladať do bežných aplikačných logov.
  • ZDR treba vždy riešiť zmluvne a technicky podľa konkrétneho poskytovateľa, regiónu a typu integrácie.

3. Bezpečné riešenie II: Self-hosted open-source LLM

Pre banky, štátnu správu, zdravotníctvo alebo strategické logistické podniky môže byť odosielanie citlivých dát cez externé API neprijateľné z dôvodu regulácie, kybernetickej bezpečnosti alebo interných pravidiel. V takom prípade dáva zmysel zvážiť self-hosted open-source modely.

Vďaka pokroku v oblasti kompresie a kvantizácie modelov je dnes možné modely ako Meta Llama, Mistral alebo Qwen prevádzkovať na vlastnej alebo zmluvne zabezpečenej infraštruktúre.

 [ Používateľ ] ──► [ Zabezpečená vnútorná sieť (Intranet) ] ──► [ Lokálny GPU Server (Llama-3) ]
                             (vyššia kontrola nad tým, kam dáta odchádzajú)

Architektúra lokálneho nasadenia:

  1. Hardvérová vrstva: Nasadenie na dedikovaných on-premise serveroch vybavených grafickými akcelerátormi alebo v izolovanom privátnom cloude, napríklad AWS, Azure alebo Google Cloud VPC.
  2. Modelová vrstva: Inštalácia open-source modelu, ktorý bol stiahnutý a validovaný. Model beží lokálne ako kontajnerizovaná služba (napr. cez Ollama alebo vLLM).
  3. Používateľské rozhranie: Zamestnanci pristupujú k internému chatu (napr. Open WebUI), ktorý vizuálne pripomína ChatGPT, no je kompletne spustený na firemnom serveri.

Hlavné výhody lokálneho prístupu:

  • Vyššia kontrola nad dátami: Citlivé dokumenty sa spracúvajú v prostredí, ktoré máte pod technickou alebo zmluvnou kontrolou.
  • Predvídateľnejšie náklady: Pri vhodnom objeme používania neplatíte za každú požiadavku externému API. Náklad sa presúva do infraštruktúry, správy a údržby.
  • Prispôsobenie firemnému kontextu: Model alebo RAG vrstvu môžete prispôsobiť interným smerniciam, historickým zmluvám a terminológii firmy.

4. Technická implementácia: Bezpečný Node.js API Wrapper pre OpenAI

Nižšie uvádzame zjednodušenú ukážku backendovej služby v jazyku TypeScript. Kód demonštruje, ako odosielať text zmluvy na analýzu cez OpenAI API tak, aby API kľúč zostal na serveri a citlivé údaje sa pred odoslaním maskovali.

V reálnej implementácii by bolo potrebné doplniť auditné logy, prístupové práva, spracovanie súborov, validáciu výstupu a právne posúdenie celého toku dát.

// src/services/ai-contract-analyzer.ts
import { OpenAI } from "openai";

interface AnalysisResult {
  hasRisks: boolean;
  liabilities: string[];
  summary: string;
}

export class SafeAIContractAnalyzer {
  private openai: OpenAI;

  constructor() {
    const apiKey = process.env.OPENAI_API_KEY;
    if (!apiKey) {
      throw new Error("Kritická chyba: Chýba OPENAI_API_KEY v konfigurácii servera.");
    }

    // Inicializácia API klienta s bezpečne načítaným kľúčom z prostredia
    this.openai = new OpenAI({ apiKey });
  }

  /**
   * Pomocná metóda na maskovanie citlivých údajov (napr. rodné čísla, e-maily) pred odoslaním
   */
  private sanitizeText(text: string): string {
    let sanitized = text;
    // Maskovanie e-mailov
    sanitized = sanitized.replace(/[\w.-]+@[\w.-]+\.\w+/g, "[MASKED_EMAIL]");
    // Maskovanie rodných čísel (Slovenský formát)
    sanitized = sanitized.replace(/\d{6}\/\d{3,4}/g, "[MASKED_ID]");
    return sanitized;
  }

  /**
   * Bezpečná analýza zmluvných rizík
   */
  public async analyzeContract(contractContent: string): Promise<AnalysisResult> {
    try {
      // 1. Dátová sanitácia na strane backendu
      const safeText = this.sanitizeText(contractContent);

      // 2. Volanie oficiálneho API (dáta sa nepoužijú na tréning)
      const response = await this.openai.chat.completions.create({
        model: "gpt-4o",
        temperature: 0.1, // Nízka teplota obmedzuje kreatívne dopĺňanie mimo zadania
        messages: [
          {
            role: "system",
            content: `Ste prísny právny asistent. Analyzujte poskytnutý text zmluvy. 
            Identifikujte skryté zmluvné pokuty, asymetrické sankcie a nevýhodné lehoty. 
            Odpovedajte vo formáte JSON s nasledujúcou štruktúrou:
            {
              "hasRisks": boolean,
              "liabilities": ["zoznam rizikových klauzúl"],
              "summary": "stručné zhrnutie zistení"
            }`
          },
          {
            role: "user",
            content: safeText
          }
        ],
        response_format: { type: "json_object" } // Vynútenie validného JSON výstupu
      });

      const rawContent = response.choices[0]?.message?.content;
      if (!rawContent) {
        throw new Error("Server nevrátil žiadny obsah.");
      }

      // 3. Bezpečné parsovanie a typovanie výsledku
      const result: AnalysisResult = JSON.parse(rawContent);
      return result;

    } catch (error) {
      // Zlyhanie logujeme lokálne do bezpečných systémových logov, nikdy ho neposielame klientovi v plnom znení
      console.error("Chyba pri analýze zmluvy cez AI:", error);
      throw new Error("Analýza dokumentu zlyhala z dôvodu internej chyby zabezpečenia.");
    }
  }
}

Prečo je táto implementácia bezpečnejšia?

  • Ochrana API kľúča: Kľúč je uložený na strane servera v premenných prostredia (process.env). Klient (prehliadač) k nemu nemá prístup, čo znemožňuje jeho krádež.
  • Dátová sanitácia: Regulárne výrazy maskujú citlivé osobné údaje na backende ešte pred odoslaním požiadavky na API. Pri produkčnom systéme treba sanitáciu rozšíriť podľa typu dokumentov a právnych požiadaviek.
  • Štruktúrovaný výstup: Použitie parametra response_format s hodnotou json_object znižuje riziko, že model vráti neštruktúrovaný sprievodný text namiesto dát vhodných na ďalšie spracovanie.

5. Riziká, úskalia a skrytá realita firemnej umelej inteligencie

Nasadenie umelej inteligencie nie je len o napísaní kódu, ale aj o procesoch, prístupoch a ľudskej kontrole. Pri firemných AI integráciách sa najčastejšie opakujú tieto riziká:

5.1. Pasca "Shadow AI"

Ak IT oddelenie kompletne zablokuje prístup k ChatGPT bez toho, aby zamestnancom poskytlo bezpečnú alternatívu, často dosiahne pravý opak. Ľudia začnú používať súkromné telefóny a osobné účty, aby si uľahčili prácu. Firma potom stráca prehľad o tom, aké dáta odchádzajú mimo jej prostredia.

  • Riešenie: Poskytnite zamestnancom bezpečné interné webové rozhranie (napr. firemný portál prepojený na vaše zabezpečené API alebo lokálny model), kde môžu bezpečne pracovať pod firemným dohľadom.

5.2. Úniky API kľúčov na klientskom frontende

Častou a fatálnou chybou menej skúsených vývojárov je priame volanie OpenAI API z klientskeho kódu (napr. priamo z React komponentu v Next.js).

  • Prečo je to zlyhanie: Kód bežiaci v prehliadači používateľa je verejne prístupný. Útočník si môže vytiahnuť API kľúč cez vývojárske nástroje a na vaše náklady generovať požiadavky alebo zneužiť váš prístup k modelu.
  • Správny postup: Volanie API musí vždy prebiehať na chránenom serverovom backende. Frontend posiela požiadavky na váš vlastný zabezpečený endpoint, ktorý následne po overení autorizácie komunikuje s API.

5.3. Halucinácie a absencia ľudskej kontroly (Human-in-the-Loop)

Veľké jazykové modely negarantujú úplnú pravdivosť. Sú to štatistické generátory textu. Pri právnych analýzach alebo spracovaní faktúr sa môže stať, že model prehliadne dôležitú klauzulu alebo si vymyslí neexistujúcu sankciu (halucinácia).

  • Pravidlo úspechu: AI nesmie vykonávať autonómne právne ani finančné rozhodnutia. Musí vždy slúžiť len ako výkonný asistent, pričom finálne schválenie a revíziu dokumentu musí vykonať kvalifikovaný človek.

Záver: AI vo firme potrebuje bezpečné technické základy

Umelá inteligencia vie výrazne zrýchliť firemný back-office, analýzu dokumentov aj internú prácu s dátami. Táto efektivita však nesmie byť vykúpená stratou kontroly nad zmluvami, osobnými údajmi a interným know-how.

Bezpečnejšia cesta vedie cez serverové API integrácie, jasné prístupové práva, auditovateľný tok dát, Zero-Data-Retention tam, kde dáva zmysel, alebo self-hosted modely pri prísnejších bezpečnostných požiadavkách.

Sme technologické štúdio nolimeo. Navrhujeme bezpečné AI integrácie, interné znalostné systémy a backend infraštruktúru pre firmy, ktoré chcú používať umelú inteligenciu bez chaosu v dátach, prístupoch a zodpovednosti.

Chcete vo firme bezpečne nasadiť AI nad zmluvami, dokumentmi alebo internými dátami? Napíšte nám a prejdeme si riziká, API možnosti aj vhodný spôsob nasadenia.

Máte záujem posunúť váš projekt vpred?