Top 10 leveranciers van data lake-oplossingen in 2022

Top 10 leveranciers van data lake-oplossingen in 2022

We zijn verheugd om Transform 2022 persoonlijk terug te brengen op 19 juli en vrijwel 20 – 28 juli. Sluit je aan bij AI- en dataleiders voor inzichtelijke gesprekken en spannende netwerkmogelijkheden. Registreer vandaag!


Naarmate de wereld steeds meer datagedreven wordt, moeten bedrijven geschikte oplossingen vinden om hen te helpen de gewenste resultaten te bereiken. Datameer storage heeft de aandacht getrokken van veel organisaties die grote hoeveelheden ongestructureerde, onbewerkte informatie moeten opslaan totdat deze kan worden gebruikt in analysetoepassingen.

De markt voor data lake-oplossingen zal naar verwachting de komende jaren snel groeien en wordt aangedreven door leveranciers die kosteneffectieve, schaalbare oplossingen voor hun klanten bieden.

Lees meer over data lake-oplossingen, welke belangrijke functies ze zouden moeten hebben en enkele van de topleveranciers die dit jaar in overweging moeten worden genomen.

Wat is een data lake-oplossing?

Een datameer wordt gedefinieerd als een enkele, gecentraliseerde opslagplaats die enorme hoeveelheden ongestructureerde en semi-gestructureerde informatie in zijn oorspronkelijke, onbewerkte vorm kan opslaan.

Het is gebruikelijk voor een organisatie om op te slaan ongestructureerde gegevens in een data lake als het niet heeft besloten hoe die informatie zal worden gebruikt. Enkele voorbeelden van ongestructureerde gegevens zijn afbeeldingen, documenten, video’s en audio. Deze gegevenstypen zijn handig in de huidige geavanceerde machine learning (ML) en geavanceerde analysetoepassingen.

Datameren verschillen van datawarehouses, die gestructureerde, gefilterde informatie voor specifieke doeleinden opslaan in bestanden of mappen. Datameren werden gecreëerd als reactie op enkele van de beperkingen van datawarehouses. Datawarehouses zijn bijvoorbeeld duur en eigendomsrechtelijk beschermd, kunnen bepaalde zakelijke use-cases die een organisatie moet aanpakken niet aan en kunnen leiden tot ongewenste homogeniteit van informatie.

On-premise data lake-oplossingen werden vaak gebruikt vóór de wijdverbreide adoptie van de cloud. Nu is het duidelijk dat enkele van de beste hosts voor datameren zijn: cloudgebaseerde platforms aan de rand vanwege hun inherente schaalbaarheid en aanzienlijk modulaire services.

Een 2019-rapport van het Government Accountability Office (GAO) hoogtepunten: verschillende zakelijke voordelen van het gebruik van de cloudwaaronder een betere klantenservice en de aanschaf van kosteneffectieve opties voor IT-beheerdiensten.

Cloud data lakes en on-premise data lakes hebben voor- en nadelen. Bedrijven moeten rekening houden met kosten, schaal en beschikbare technische middelen om te beslissen welk type het beste is.

Lees meer over datameren: Wat is een datameer? Definitie, voordelen, architectuur en best practices

5 onmisbare functies van een data lake-oplossing

Het is van cruciaal belang om te begrijpen welke functies een data lake biedt. De meeste oplossingen worden geleverd met dezelfde kerncomponenten, maar elke leverancier kan specifieke aanbiedingen of unieke verkoopargumenten (USP’s) hebben die de beslissing van een bedrijf kunnen beïnvloeden.

Hieronder staan ​​vijf belangrijke kenmerken die elk datameer zou moeten hebben:

1. Verschillende interfaces, API’s en eindpunten

Datameren die diverse interfaces, API’s en eindpunten bieden, kunnen het uploaden, openen en verplaatsen van informatie veel gemakkelijker maken. Deze mogelijkheden zijn belangrijk voor een data lake omdat het ongestructureerde data mogelijk maakt voor een breed scala aan gebruikssituaties, afhankelijk van het gewenste resultaat van een bedrijf.

2. Ondersteuning voor of verbinding met verwerkings- en analyselagen

ML-ingenieurs, datawetenschappers, besluitvormers en analisten profiteren het meest van een gecentraliseerde data lake-oplossing die: slaat informatie op voor gemakkelijke toegang en beschikbaarheid. Dit kenmerk kan dataprofessionals en IT-managers helpen om naadloos en efficiënter met data te werken, waardoor de productiviteit wordt verbeterd en bedrijven hun doelen kunnen bereiken.

3. Robuuste zoek- en catalogiseerfuncties

Stel je een data lake voor met grote hoeveelheden informatie maar geen gevoel voor organisatie. Een levensvatbare data lake-oplossing moet generieke organisatorische methoden en zoekmogelijkheden bevatten, die de meeste waarde bieden voor de gebruikers. Andere functies zijn bijvoorbeeld opslag van sleutelwaarden, tagging, metadata of tools om subsets van informatie te classificeren en te verzamelen.

4. Beveiliging en toegangscontrole

Beveiliging en toegangscontrole zijn twee onmisbare functies van elke digitale tool. Het huidige cyberbeveiligingslandschap breidt zich uit, waardoor het voor dreigingsactoren gemakkelijker wordt om de gegevens van een bedrijf te misbruiken en onherstelbare schade aan te richten. Alleen bepaalde gebruikers mogen toegang hebben tot een datameer en de oplossing moet een sterke beveiliging hebben om gevoelige informatie te beschermen.

5. Flexibiliteit en schaalbaarheid

Steeds meer organisaties worden groter en werken veel sneller. Data lake-oplossingen moeten flexibel en schaalbaar zijn om te voldoen aan de steeds veranderende behoeften van moderne bedrijven die met informatie werken.

Lees ook: Analyses ontgrendelen met data lake en grafiekanalyse

Top 10 leveranciers van data lake-oplossingen in 2022

Sommige data lake-oplossingen zijn het meest geschikt voor bedrijven in bepaalde sectoren. Anderen daarentegen kunnen goed werken voor een bedrijf van een bepaalde grootte of met een bepaald aantal werknemers of klanten. Dit kan het kiezen van een potentiële leverancier van data lake-oplossingen een uitdaging maken.

Bedrijven die overwegen dit jaar te investeren in een data lake-oplossing, zouden eens een kijkje moeten nemen bij enkele van de onderstaande leveranciers.

1. Amazon-webservices (AWS)

De AWS Cloud biedt veel essentiële tools en services waarmee bedrijven een datameer kunnen bouwen dat aan hun behoeften voldoet. De AWS data lake-oplossing wordt veel gebruikt, kosteneffectief en gebruiksvriendelijk. Het maakt gebruik van de veiligheid, duurzaamheid, flexibiliteit en schaalbaarheid die Amazon S3-objectopslag zijn gebruikers biedt.

Het datameer beschikt ook over Amazon DynamoDB om metadata te verwerken en te beheren. AWS data lake biedt een intuïtieve, webgebaseerde console gebruikersinterface (UI) om het data lake eenvoudig te beheren. Het vormt ook data lake-beleid, verwijdert of voegt datapakketten toe, maakt manifesten van datasets voor analysedoeleinden en biedt zoekdatapakketten.

2. Cloudera

Cloudera is een andere topleverancier van data lakes die veilige, beveiligde opslag voor alle gegevenstypen zal creëren en onderhouden. Enkele van de Data Lake Service-mogelijkheden van Cloudera SDX zijn:

  • Gegevensschema/metadata-informatie
  • Metadatabeheer en governance
  • Toegangscontrole die klaar is voor naleving
  • Autorisatie en authenticatie van gegevenstoegang voor verbeterde beveiliging

Andere voordelen van Cloudera’s data lake zijn productondersteuning, downloads, community en documentatie. GSK en Toyota gebruik gemaakt van Cloudera’s data lake om kritische business intelligence (BI)-inzichten te verzamelen en data-analyseprocessen te beheren.

3. Databricks

Databricks is een andere levensvatbare leverancier en biedt ook een handvol data lake-alternatieven. Het Databricks Lakehouse-platform combineert de beste elementen van datameren en magazijnen om betrouwbaarheid, governance, beveiliging en prestaties te bieden.

Het platform van Databricks helpt bij het doorbreken van silo’s die gegevens normaal gesproken scheiden en compliceren, wat datawetenschappers, ML-engineers en andere IT-professionals frustreert. Naast het platform biedt Databricks ook zijn Delta Lake-oplossing, een open-formaat opslaglaag die de beheerprocessen van data lakes kan verbeteren.

4. Domo

Domo is een cloudgebaseerd softwarebedrijf dat grote gegevens oplossingen voor alle bedrijven. Gebruikers hebben de vrijheid om een ​​cloudarchitectuur te kiezen die bij hun bedrijf past. Domo is een open platform dat bestaande datameren kan uitbreiden, of het nu in de cloud of on-premise is. Gebruikers kunnen gecombineerde cloudopties gebruiken, waaronder:

  • Domo’s cloud kiezen
  • Verbinding maken met alle cloudgegevens
  • Een cloudgegevensplatform selecteren

Domo biedt geavanceerde beveiligingsfuncties, zoals BYOK-versleuteling (bring your own key), controlegegevenstoegang en beheermogelijkheden. Bekende bedrijven zoals Nestle, DHL, Cisco en Comcast maak gebruik van de Domo Cloud om hun behoeften beter te beheren.

5. Google Cloud

Google is een andere grote technologiespeler die klanten data lake-oplossingen biedt. Bedrijven kunnen het datameer van Google Cloud gebruiken om alle gegevens veilig en kosteneffectief te analyseren. Het kan grote hoeveelheden informatie en de verschillende verwerkingstaken van IT-professionals aan. Bedrijven die hun on-premise data lakes niet in de cloud willen herbouwen, kunnen hun informatie eenvoudig optillen en verplaatsen naar Google Cloud.

Enkele belangrijke kenmerken van de datameren van Google zijn: Apache Spark en Hadoop migratie, die volledig beheerde services, geïntegreerde datawetenschap en -analyse en tools voor kostenbeheer zijn. Grote bedrijven zoals Twitter, Vodafone, Pandora en Metro hebben geprofiteerd van de datameren van Google Cloud.

6. HP Enterprise

Hewlett Packard Enterprise (HPE) is een andere leverancier van data lake-oplossingen die bedrijven kan helpen de kracht van hun big data te benutten. De oplossing van HPE heet GreenLake — het biedt organisaties een echt schaalbare, cloudgebaseerde oplossing die hun Hadoop-ervaringen vereenvoudigt.

HPE GreenLake is een end-to-end oplossing dat omvat software, hardware en HPE Pointnext Services. Deze services kunnen bedrijven helpen IT-uitdagingen te overwinnen en meer tijd te besteden aan zinvolle taken.

7. IBM

Zakelijk technologieleider IBM biedt ook data lake-oplossingen voor bedrijven. IBM staat bekend om zijn oplossingen voor cloudcomputing en data-analyse. Het is een goede keuze als een bedrijf op zoek is naar een geschikte data lake-oplossing. De cloudgebaseerde aanpak van IBM werkt op drie belangrijke principes: embedded governance, geautomatiseerde integratie en virtualisatie.

Dit zijn enkele data lake-oplossingen van IBM:

  • IBM Db2
  • IBM Db2 BigSQL
  • IBM Netezza
  • IBM Watson-query
  • IBM Watson Knowledge-catalogus
  • IBM Cloud Pak voor gegevens

Met zoveel beschikbare datameren, is er zeker een die past bij de unieke behoeften van een bedrijf. Bedrijven in financiële dienstverlening, gezondheidszorg en communicatie gebruiken IBM-datameren vaak voor verschillende doeleinden.

8. Microsoft Azure

Microsoft biedt zijn Azure Data Lake-oplossing aan, die eenvoudige opslagmethoden, verwerking en analyse biedt met behulp van verschillende talen en platforms. Azure Data Lake werkt ook met de bestaande IT-investeringen en infrastructuur van een bedrijf om het IT-beheer naadloos te maken.

De Azure Data Lake-oplossing is betaalbaar, uitgebreid, veilig en wordt ondersteund door Microsoft. Bedrijven profiteren van 24/7 ondersteuning en expertise om hen te helpen bij het overwinnen van eventuele big data-uitdagingen waarmee ze te maken kunnen krijgen. Microsoft is een leider op het gebied van bedrijfsanalyse en technische oplossingen, waardoor het een populaire keuze is voor veel organisaties.

9. Orakel

Bedrijven kunnen Oracle’s Big Data Service gebruiken om data lakes te bouwen om de instroom van informatie te beheren die nodig is voor hun zakelijke beslissingen. De Big Data Service is geautomatiseerd en biedt gebruikers een betaalbare en uitgebreid Hadoop data lake-platform gebaseerd op Cloudera Enterprise.

Deze oplossing kan worden gebruikt als data lake of als ML-platform. Een ander belangrijk kenmerk van Oracle is dat het een van de beste open-source datameren is die er zijn. Het wordt ook geleverd met op Oracle gebaseerde tools om nog meer waarde toe te voegen. Oracle’s Big Data Service is schaalbaar, flexibel, veilig en voldoet tegen lage kosten aan de vereisten voor gegevensopslag.

10. Sneeuwvlok

De data lake-oplossing van Snowflake is veilig, betrouwbaar en toegankelijk en helpt bedrijven silo’s te doorbreken om hun strategieën te verbeteren. De belangrijkste kenmerken van Snowflake’s data lake zijn een centraal platform voor alle informatie, snel opvragen en veilige samenwerking.

Siemens en Devon Energy zijn twee bedrijven die getuigenissen leveren over Snowflake’s data lake-oplossingen en bieden positieve feedback. Een ander voordeel van Snowflake is het uitgebreide partnerecosysteem, waaronder AWS, Microsoft Azure, Accenture, Deloitte en Google Cloud.

Het belang van het kiezen van de juiste leverancier van data lake-oplossingen

Bedrijven die extra tijd besteden aan het onderzoeken welke leveranciers de beste enterprise data lake-oplossingen voor hen zullen bieden, kunnen hun informatie beter beheren. In plaats van een leverancier te kiezen, kunt u het beste alle beschikbare opties overwegen en bepalen welke oplossingen voldoen aan de specifieke behoeften van een organisatie.

Elk bedrijf gebruikt informatie, de een meer dan de ander. De wereld wordt echter sterk datagedreven – daarom zal het gebruik van de juiste data-oplossingen de komende jaren alleen maar belangrijker worden. Deze lijst helpt bedrijven te beslissen welke leverancier van data lake-oplossingen geschikt is voor hun activiteiten.

Lees volgende: Haal de meeste waarde uit uw gegevens met data lakehouse-architectuur

De missie van VentureBeat is een digitaal stadsplein voor technische besluitvormers om kennis op te doen over transformatieve bedrijfstechnologie en transacties. Leer meer over lidmaatschap.