(Részlet a saját kutatási cikkemből: “Data Mesh and Data Space: A Comparative Analysis with a Focus on Governance.” – Papp Attila és társai.)
Ahogy a szervezetek egyre inkább adatvezérelt üzleti modellek felé mozdulnak, felmerül egy kulcskérdés: hogyan osszuk meg az adatokat – a vállalaton belül vagy egy teljes ökoszisztémán átívelően?
Az adatarchitektúrák folyamatos fejlődésen mennek keresztül, és a legújabb trend a vállalaton belüli és vállalatok közötti adatmegosztás (data sharing) lehetővé tétele. Ez a modern vállalatok éltető eleme: értékes insight-okat tár fel, gyorsabb innovációt és reziliensebb, data-driven döntéshozatalt tesz lehetővé, miközben támogatja az olyan transzparencia-előírásokat is, mint az ESG, valamint a közelgő data sovereignty-szabályozásokat. Röviden: a megosztott adatok az elszigetelt tényeket kollektív intelligenciává alakítják.
Míg a vállalaton belüli adatmegosztást elsősorban az analitika, a hatékonyság és a data-driven döntéshozatal hajtja, addig a vállalatok közötti adatmegosztás motivációja főként szabályozási eredetű. Mindazonáltal a két, kialakulóban lévő megközelítés – a data mesh és a data space – első ránézésre meglehetősen hasonló, így érdemes közelebbről megvizsgálni. Ez a poszt egy részletet közöl a hamarosan megjelenő publikációnkból:
Data Mesh (Dehghani 2020 szerint): egy domain-orientált, self-serve architektúra, amely az adatot termékként (data as a product) kezeli, és federated, automatizált policy-kon keresztül érvényesíti a governance-t.
Data Space (Data Spaces Support Centre szerint): egy szervezetközi keretrendszer, amely szuverén, megbízható adatcserét tesz lehetővé egy közös rulebook és nyílt interoperability-szabványok mentén.
Mindkét esetben a cél a decentralizált adatmegosztás lehetővé tétele. Ezt azonban különböző úton érik el. A data mesh a nagy amerikai vállalatoknál jött létre azzal a céllal, hogy feloldja a data lake-ek által okozott szűk keresztmetszeteket; a data space ezzel szemben az Európai Unióban alakult ki a szervezetközi adatmegosztás támogatására. A data mesh-t tehát a hatékonyság és a domainek megnövelt autonómiája hajtja, az átfogó cél pedig az időben rendelkezésre álló analitika biztosítása a data-driven döntéshozatal támogatása érdekében. A data space-t ezzel szemben a sovereignty, a transzparencia és a méltányosság motiválja, fő value proposition-je pedig a megbízható adatcsere lehetővé tétele a közös innováció és a compliance érdekében.
A közös vonások főként az interoperability-ben és a data product szemléletben rejlenek, mivel mindkét megközelítés termékként tekint az adatra. A data mesh ezt elsősorban governance alatt álló analitikai eszközként látja, a monetizáció pedig nem fontos, ami éles ellentétben áll a data space-szel. A policy-k mint a hozzáférést leíró egységek (vagy a data space-ek esetében a data sharing agreement-ek) több területen is konvergenciapontként szolgálhatnak.
Az alábbi táblázat részletesebb összehasonlítást nyújt:
| Dimenzió | Data Mesh | Data Space |
| Eredet | Nagy amerikai vállalatoknál jött létre, hogy feloldja a központosított data lake-ek szűk keresztmetszeteit. | Az Európai Unióban alakult ki, hogy lehetővé tegye a szervezetközi adatmegosztást data sovereignty mellett. |
| Tipikus hatókör | Intra-company: egy szervezeten belül több üzleti domain. | Inter-company: ökoszisztéma- vagy iparág-szintű. |
| Elsődleges hajtóerő | Hatékonyság és domain-autonómia. | Sovereignty, transzparencia és méltányosság. |
| Kulcsprobléma | A centralizált silók lassítják az analitikát: a csapatoknak ownership kell a saját data product-jaik felett. | A központosított platformok nem tudják kielégíteni a cégek közötti bizalmi, jogi és versenyhelyzeti elvárásokat. |
| Value Proposition | Gyorsabb szállítás, agilis analitika és data democratization. | Megbízható adatcsere, közös innováció, compliance a szabályozásokkal (pl. EU Data Act, CSRD). |
| Indulási must-have-ek | Domain-driven kultúra, platform-csapat, self-serve tooling. | Közös rulebook, érett belső governance minden résztvevőnél, interoperability-szabványok. |
| Decentralizáció fókusza | A team-eket hatalmazza fel egy vállalaton belül. | A szervezeteket (sőt az egyéneket is) hatalmazza fel egy ökoszisztémán belül. |
| Interoperability szintje | Sémák, contract-ok és metaadatok enterprise szinten egyeztetve. | Jogi, szervezeti, szemantikai és technikai rétegek sector szinten egyeztetve. |
| Data-Product gondolkodásmód | Data product = governance alatt álló analitikai dataset; az üzleti érték másodlagos. | Data product = gazdasági egység monetizációra; a technikai/metaadat-specifikációk ezt követik. |
| Tech stack trendek | Gyakran cloud-native „dobozos” szolgáltatások (pl. Databricks, AWS DataZone); az OSS egyre erősebb (Iceberg, Polaris). | Erős OSS-kultúra (Gaia-X, Eclipse Dataspace Components) plusz vendor-neutral connector-ök. |
(A. Papp et al. nyomán, hamarosan megjelenő publikáció)
3 kulcsfontosságú tanulság
- Ugyanaz a cél, eltérő kiindulópont. Mindkét paradigma a megismételhető, megbízható és biztonságos adatmegosztást célozza. A Data Mesh a vállalaton belül kezdődik; a Data Space a vállalatok között.
- A governance kulcsfontosságú. A Data Mesh a federated computational governance-re támaszkodik: a lokális team-ek birtokolják a policy-kat, de megfelelnek a platformba beépített, vállalatszintű guardrail-eknek. A Data Space-ek egy rulebook-ban formalizálják a bizalmat, amelyet egy ökoszisztéma-szintű Governance Authority érvényesít.
- A konvergencia közeleg. A nyílt table format-ok, a közös vokabulárumok és a policy engine-ek (pl. IDS Contracts, OPA) csökkentik a szakadékot. Számíthatunk olyan hibrid architektúrákra, ahol egy belső mesh közvetlenül egy külső data space-be csatlakozik.
Mi következik?
A sorozat második részében a két megközelítés eltérő governance-modelljeit hasonlítjuk össze. A részletes tudományos publikáció hamarosan megjelenik. Kövess minket, hogy értesülj az újdonságokról.
Te melyik paradigmát vizsgálod, és miért?



