23. április 2026

Data Mesh vs. Data Space: Melyik megközelítés illik az adatmegosztási use case-edhez? (1. rész)

Szerző: Attila Papp

(Részlet a saját kutatási cikkemből: “Data Mesh and Data Space: A Comparative Analysis with a Focus on Governance.” – Papp Attila és társai.)

Ahogy a szervezetek egyre inkább adatvezérelt üzleti modellek felé mozdulnak, felmerül egy kulcskérdés: hogyan osszuk meg az adatokat – a vállalaton belül vagy egy teljes ökoszisztémán átívelően?

Az adatarchitektúrák folyamatos fejlődésen mennek keresztül, és a legújabb trend a vállalaton belüli és vállalatok közötti adatmegosztás (data sharing) lehetővé tétele. Ez a modern vállalatok éltető eleme: értékes insight-okat tár fel, gyorsabb innovációt és reziliensebb, data-driven döntéshozatalt tesz lehetővé, miközben támogatja az olyan transzparencia-előírásokat is, mint az ESG, valamint a közelgő data sovereignty-szabályozásokat. Röviden: a megosztott adatok az elszigetelt tényeket kollektív intelligenciává alakítják.

Míg a vállalaton belüli adatmegosztást elsősorban az analitika, a hatékonyság és a data-driven döntéshozatal hajtja, addig a vállalatok közötti adatmegosztás motivációja főként szabályozási eredetű. Mindazonáltal a két, kialakulóban lévő megközelítés – a data mesh és a data space – első ránézésre meglehetősen hasonló, így érdemes közelebbről megvizsgálni. Ez a poszt egy részletet közöl a hamarosan megjelenő publikációnkból:

Data Mesh (Dehghani 2020 szerint): egy domain-orientált, self-serve architektúra, amely az adatot termékként (data as a product) kezeli, és federated, automatizált policy-kon keresztül érvényesíti a governance-t.

Data Space (Data Spaces Support Centre szerint): egy szervezetközi keretrendszer, amely szuverén, megbízható adatcserét tesz lehetővé egy közös rulebook és nyílt interoperability-szabványok mentén.

Mindkét esetben a cél a decentralizált adatmegosztás lehetővé tétele. Ezt azonban különböző úton érik el. A data mesh a nagy amerikai vállalatoknál jött létre azzal a céllal, hogy feloldja a data lake-ek által okozott szűk keresztmetszeteket; a data space ezzel szemben az Európai Unióban alakult ki a szervezetközi adatmegosztás támogatására. A data mesh-t tehát a hatékonyság és a domainek megnövelt autonómiája hajtja, az átfogó cél pedig az időben rendelkezésre álló analitika biztosítása a data-driven döntéshozatal támogatása érdekében. A data space-t ezzel szemben a sovereignty, a transzparencia és a méltányosság motiválja, fő value proposition-je pedig a megbízható adatcsere lehetővé tétele a közös innováció és a compliance érdekében.

A közös vonások főként az interoperability-ben és a data product szemléletben rejlenek, mivel mindkét megközelítés termékként tekint az adatra. A data mesh ezt elsősorban governance alatt álló analitikai eszközként látja, a monetizáció pedig nem fontos, ami éles ellentétben áll a data space-szel. A policy-k mint a hozzáférést leíró egységek (vagy a data space-ek esetében a data sharing agreement-ek) több területen is konvergenciapontként szolgálhatnak.

Az alábbi táblázat részletesebb összehasonlítást nyújt:

DimenzióData MeshData Space
EredetNagy amerikai vállalatoknál jött létre, hogy feloldja a központosított data lake-ek szűk keresztmetszeteit.Az Európai Unióban alakult ki, hogy lehetővé tegye a szervezetközi adatmegosztást data sovereignty mellett.
Tipikus hatókörIntra-company: egy szervezeten belül több üzleti domain.Inter-company: ökoszisztéma- vagy iparág-szintű.
Elsődleges hajtóerőHatékonyság és domain-autonómia.Sovereignty, transzparencia és méltányosság.
KulcsproblémaA centralizált silók lassítják az analitikát: a csapatoknak ownership kell a saját data product-jaik felett.A központosított platformok nem tudják kielégíteni a cégek közötti bizalmi, jogi és versenyhelyzeti elvárásokat.
Value PropositionGyorsabb szállítás, agilis analitika és data democratization.Megbízható adatcsere, közös innováció, compliance a szabályozásokkal (pl. EU Data Act, CSRD).
Indulási must-have-ekDomain-driven kultúra, platform-csapat, self-serve tooling.Közös rulebook, érett belső governance minden résztvevőnél, interoperability-szabványok.
Decentralizáció fókuszaA team-eket hatalmazza fel egy vállalaton belül.A szervezeteket (sőt az egyéneket is) hatalmazza fel egy ökoszisztémán belül.
Interoperability szintjeSémák, contract-ok és metaadatok enterprise szinten egyeztetve.Jogi, szervezeti, szemantikai és technikai rétegek sector szinten egyeztetve.
Data-Product gondolkodásmódData product = governance alatt álló analitikai dataset; az üzleti érték másodlagos.Data product = gazdasági egység monetizációra; a technikai/metaadat-specifikációk ezt követik.
Tech stack trendekGyakran cloud-native „dobozos” szolgáltatások (pl. Databricks, AWS DataZone); az OSS egyre erősebb (Iceberg, Polaris).Erős OSS-kultúra (Gaia-X, Eclipse Dataspace Components) plusz vendor-neutral connector-ök.

(A. Papp et al. nyomán, hamarosan megjelenő publikáció)

3 kulcsfontosságú tanulság

  1. Ugyanaz a cél, eltérő kiindulópont. Mindkét paradigma a megismételhető, megbízható és biztonságos adatmegosztást célozza. A Data Mesh a vállalaton belül kezdődik; a Data Space a vállalatok között.
  2. A governance kulcsfontosságú. A Data Mesh a federated computational governance-re támaszkodik: a lokális team-ek birtokolják a policy-kat, de megfelelnek a platformba beépített, vállalatszintű guardrail-eknek. A Data Space-ek egy rulebook-ban formalizálják a bizalmat, amelyet egy ökoszisztéma-szintű Governance Authority érvényesít.
  3. A konvergencia közeleg. A nyílt table format-ok, a közös vokabulárumok és a policy engine-ek (pl. IDS Contracts, OPA) csökkentik a szakadékot. Számíthatunk olyan hibrid architektúrákra, ahol egy belső mesh közvetlenül egy külső data space-be csatlakozik.

Mi következik?

A sorozat második részében a két megközelítés eltérő governance-modelljeit hasonlítjuk össze. A részletes tudományos publikáció hamarosan megjelenik. Kövess minket, hogy értesülj az újdonságokról.

Te melyik paradigmát vizsgálod, és miért?

Bejegyzés megosztása:

Témák és címkék:

Bejegyzés szerzője:

Attila Papp

Attila Papp egy adatplatformokra és cloud-native infrastruktúrákra specializálódott Cloud/Data Architect, és csapatvezető. 8 év gyakorlati tapasztalattal rendelkezik AWS, Azure, Kubernetes, Databricks és serverless architektúrák terén. Legutóbb egy adat-mesh platformot épített a Porsche AG-nál. Az ELTE PhD hallgatója.
Összes bejegyzés tőle: Attila Papp

Kapcsolódó bejegyzések

Miként építettünk fel egy kiemelkedő szolgáltatást

Miként építettünk fel egy kiemelkedő szolgáltatást

Az informatikai szolgáltatások piacán egyre nagyobb a verseny. Sokan kínálnak hasonló megoldásokat, ezért a kulcs a kiemelkedő szolgáltatáshoz, egy nem csak az önmagunkra, hanem a piac többi résztvevőjére is reflektáló szemlélet, mely felfedi az általános...

Kubernetes Secret kezelés: Gyakorlati megvalósítás

Kubernetes Secret kezelés: Gyakorlati megvalósítás

A natív Kubernetes Secrets valójában csak base64-encodolva van, nem titkosítva, ami komoly biztonsági sebezhetőségeket okozhat GitOps workflow-k bevezetésekor. Érdemes tehát referenciaalapú megközelítést alkalmazni, amelyben a Git csak a secretre mutató hivatkozást...