Data-analyse is een vakgebied dat zich snel ontwikkelt dankzij voortdurende vooruitgang in technologie, engineering en regelgevende kaders. In deze context heeft SDG Group een nieuw rapport gepresenteerd over de belangrijkste trends in de sector, gericht op innovatie en ontwikkeling op het gebied van gegevens en geavanceerde analyse.
SDG Group presenteert de Trends in Data en Analytics voor 2023:
1. Business-Composed Data & Analytics
In de afgelopen jaren is er een overgang geweest van traditionele Data en Analytics gericht op IT naar gericht op domein of business. Data Mesh en Data Products zijn slechts enkele van de disciplines die deze massale verschuiving naar dit nieuwe paradigma van Data en Analytics stimuleren. Deze innovatieve trends zullen blijven bijdragen aan datagestuurde besluitvorming en belemmeringen verminderen bij het behalen van meetbare resultaten of zelfs “data-dividenden”.
2. Foundational Models for AI
Foundational Models verminderen de datalabelvereisten tijdens de training van AI-algoritmen, resulterend in een nieuwe vorm van transfer-leren. BERT en de GPT-3-familie zijn daar voorbeelden van. Ze hebben hun enorme potentieel al bewezen om Total Time to Insights (TTTI) te versnellen en de kosten en inspanningen die gepaard gaan met het opbouwen van een AI-product of -initiatief te verminderen.
3. Prompt Engineering
Prompt Engineering is een zeer recente discipline die tot doel heeft de optimale instructies te ontwerpen om een consistent doel te bereiken bij interactie met een generatieve AI. De discipline van Prompt Engineering zal een nog grotere rol spelen bij het ontwerpen van AI-services en het creëren van een communicatieruimte tussen mens en data-apps. Deze leer- en onderwijsmethode zal een standaard worden voor interactie met verschillende categorieën van AI-systemen. Prompt Engineering creëert al nieuwe professionele profielen: IT-experts die zich concentreren op het ontwerp van effectieve gesprekken tussen gebruikers en technologische toepassingen.
4. Pattern Design in Data Science
“We staan momenteel voor de noodzaak van een paradigmaverschuiving in de ontwikkeling van Machine Learning- en AI-systemen. Vanuit een benadering die gericht is op Software Engineering, pleiten we voor een Data Science gebaseerd op Pattern Design dat specifieke en gebruikelijke problemen in geavanceerde analyse oplost, dat kan dienen als een versneller voor het behalen van waarde en dat schaalbaarheid mogelijk maakt. De voordelen zijn onder meer het verbeteren van de Time-to-Market van ML- en AI-systemen, het verminderen van de totale eigendomskosten (TCO), waardoor efficiëntere, onderhoudbare en schaalbare oplossingen ontstaan.”
5. Data Constructs
Een Data Construct is de conceptualisatie van de verschillende manieren om gegevens te organiseren en te structureren, geïmplementeerd op basis van standaardisatie en automatisering. Data Constructs kunnen zelfstructurerende gegevensstructuren genereren op basis van nieuwe vereisten, waardoor de return on data-strategie wordt verbeterd. Verhoging van efficiëntie, verbetering van nauwkeurigheid, vermindering van arbeid en data engineering resources zijn slechts enkele van de voordelen.
6. Data Inerrancy
Bedrijven moeten streven naar de onfeilbaarheid van hun gegevensplatforms. Daarvoor moeten de twee disciplines Data Observability en Modern Data Quality, die patronen en afwijkingen kunnen detecteren en zorgen voor nauwkeurigheid, integriteit en consistentie van de gegevens, geïntegreerd zijn om de gewenste Data Inerrancy te bereiken. Door de genoemde technieken te combineren, vergroten we het vermogen om veranderingen te bewaken en om situaties aan te pakken waarin problemen met de gegevens en de onderliggende oorzaken worden gedetecteerd, begrepen en opgelost, met als uiteindelijk doel een “foutloze” gegevensomgeving.
7. Data OS Live
Er zijn drie grote evoluties relevant voor moderne gegevensplatforms. De eerste evolutie is de creatie van gegevensbesturingssystemen die in staat zijn om elk type dataverwerkings- en analyseproces en elke vorm van gegevensopslag te ondersteunen. De tweede evolutie heeft te maken met het concept van data-vrijheid, dat betrekking heeft op het open en klaar zijn voor multicloud-omgevingen en het vrije verkeer van Data Constructs tussen cloud ecosystemen mogelijk maakt. De derde evolutie heeft betrekking op de continue dataverwerking in “always-on” en “true real-time” modus. Om deze drie scenario’s te realiseren, is het essentieel om een strategie te volgen die een zorgvuldige keuze van de componenten omvat zonder afbreuk te doen aan de Total Time to Insights.
8. Admissible AI
De vooruitgang in AI stimuleert de actualisering en totstandkoming van regelgeving (zoals de Europese AI-wet). Volgens de richtlijnen moeten AI-systemen legaal zijn (alle toepasselijke wet- en regelgeving naleven), ethisch (zorgen voor naleving van ethische principes en waarden) en robuust vanuit zowel technisch als sociaal oogpunt. Omdat AI-systemen integraal onderdeel uitmaken van veel data- en analyse-architecturen, stellen we voor om bestaande data governance-kaders uit te breiden. Deze uitbreiding zal betrekking hebben op AI-systemen en de noodzaak van toelaatbare AI, met speciale aandacht voor transparantie, observatie en uitlegbaarheid.
9. Analytics Re-Evolution
“We identificeren drie opmerkelijke bewegingen in de wereld van geavanceerde analyse. Ten eerste, Augmented Analytics, een belangrijke markttrend die beschrijvende analyse combineert met de voorspellende en voorschrijvende capaciteiten ervan. Ten tweede Headless BI, de analytische architectuur die de datalagen van de gegevenspresentatielaag loskoppelt, waardoor elke BI-technologie en analyse bedrijfsmetrics kan consumeren via bijvoorbeeld open API-interfaces. Ten slotte neemt het gebruik van bedrijfsgegevens toe en wordt breed gedragen analytics mogelijk gemaakt door een reeks technologieën en disciplines die zich snel verspreiden op de markt, zoals micro-apps.”