Waarom data een duurzaamheidsprobleem heeft

Waarom data een duurzaamheidsprobleem heeft

Dit artikel maakt deel uit van een speciale uitgave van VB. Lees hier de volledige serie: Intelligente duurzaamheid.

Elk jaar in de VS wordt geschat dat ongeveer 5.130 miljoen ton energiegerelateerde koolstofdioxide wordt aan de atmosfeer toegevoegd. Alleen al in technologiebedrijven heeft de explosie van gegevens de zaken niet geholpen, aangezien de innovatie in de sector snel blijft groeien.

Sommige experts zoals Sanjay Podder, managing director en global lead of technology sustainability innovation bij Accenture, zeggen dat als er niets aan wordt gedaan, de exponentiële groei van gegevens zou kunnen leiden tot een grotere vraag naar energie en koolstofemissies, waardoor de vooruitgang op het gebied van klimaatverandering wordt tegengegaan.

De afgelopen twee jaar hebben het probleem alleen maar vergroot. Als gevolg van COVID-19, cloud-adoptie, AI-implementatie en bijgevolg gegevens – allemaal exponentieel toegenomen naarmate de vraag naar versnelde digitale transformatie opwarmde.

Versnelde adoptie van deze technologieën hebben bedrijven misschien geholpen om zich aan te passen, het bedrijf overeind te houden, werknemers in staat te stellen hun baan te behouden tijdens een vluchtige tijd en de weg vrijgemaakt voor toekomstige innovatie, maar wat deed het met het milieu?

Gegevensverzameling en -opslag, cloudcomputing en AI dragen allemaal aanzienlijk bij aan de CO2-uitstoot, maar hoeveel en wat kunnen ondernemingen doen om de gevolgen te verminderen en tegelijkertijd innovatie voort te stuwen? En als data deze innovaties voeden, wat wordt er dan goed gedaan en wat kunnen bedrijven beter doen als het gaat om dataduurzaamheid?

“Hopelijk gaan mensen van focus op data in rust naar data in beweging”, zegt Phil Tee, CEO van Moogsoft, een AI-gedreven observeerbaarheidsbedrijf. “Er is een soort cultuur ontstaan ​​rond het idee om niets weg te gooien en alle gegevens die je ooit hebt ontvangen te behouden. Het probleem is wanneer dat wordt omgezet in die benadering van gegevens die u niet hoeft te bewaren. Wat er dan gebeurt, is dat gegevens niet alleen worden weggegooid, of minimaal worden bewaard, maar maximaal worden bewaard. Met andere woorden, er is een soort reflexmatige reactie dat, omdat we niets anders weggooien, we dat ook niet moeten weggooien, zelfs als het gegevens zijn die puur realtime-betekenis hebben – zoals letterlijk zes milliseconden – en na het ontvangen van die gegevens heb je er geen gebruik meer van. Ik denk dat dat uiteindelijk het geval is als je van het laagst hangende fruit aan deze boom houdt.”

Het probleem van gegevensduurzaamheid definiëren

Technologische innovaties zullen niet vertragen, en in feite zijn ze booming. Een verslag van Advisering activeren bevestigt dat data en automatisering in de onderneming de explosie aandrijven. En hoewel sommige van deze innovaties waarschijnlijk gericht zullen zijn op het creëren van een betere, efficiëntere realiteit, is hun milieu-impact misschien niet zo mooi.

EEN Stanford Magazine artikel citeert dat “het opslaan en opslaan van 100 gigabyte aan gegevens in de cloud per jaar zou resulteren in een CO2-voetafdruk van ongeveer 0,2 ton CO2, gebaseerd op de gebruikelijke Amerikaanse elektrische mix.” De cloud en zijn datacenters kunnen echter met hun eigen reeks milieuproblemen komen.

MET meldde dat “de cloud nu een grotere ecologische voetafdruk heeft dan de luchtvaartindustrie. Een enkel datacenter kan het equivalent van 50.000 huishoudens verbruiken. Met 200 terawattuur (TWh) per jaar verslinden datacenters gezamenlijk meer energie dan sommige natiestaten.”

Het stuk legt verder uit dat hoewel stroom uit datacenters goed is voor 0,3% van de totale CO2-uitstoot, als de berekening wordt uitgebreid met apparaten die deze innovaties mogelijk maken, zoals laptops, smartphones en tablets, het totaal op 2% van de CO2-uitstoot komt. uitstoot wereldwijd.

En AI, dat enorme hoeveelheden gegevens gebruikt en vaak op de cloud leunt, heeft ook een aantal problemen — een deel daarvan is dat de datasets die worden gebruikt om AI te trainen, worden steeds groter en kosten veel energie om te draaien. Onderzoekers van McKinsey bevestigde dit door in een artikel te stellen dat “onderzoekers ontdekten dat de milieukosten van training toenamen in directe verhouding tot de grootte van het model.” evenzo, MET ontdekte dat “het trainen van een enkel AI-model tijdens hun leven evenveel koolstof kan uitstoten als vijf auto’s.”

Innoveren en tegelijkertijd mitigeren

Maar het is niet allemaal kommer en kwel. George Kamiya, analist bij de Internationaal Energie Agentschap (IEA), stelt dat hoewel het belangrijk is om aandacht te besteden aan de duurzaamheidskwesties, er rekening mee moet worden gehouden dat “technologiebedrijven verschillende soorten effecten hebben op emissies: 1) directe emissies van activiteiten (dwz hun voetafdruk); 2) positieve indirecte effecten bij het gebruik van hun technologieën om emissies te verminderen; 3) negatieve indirecte effecten waarbij hun technologieën daadwerkelijk resulteren in een netto toename van emissies.”

Hij stelt dat, hoewel er tot nu toe veel aandacht is besteed aan de directe CO2-voetafdruk van bedrijven, deze emissies relatief klein zijn in vergelijking met de effecten op de emissies door het gebruik van digitale technologieën, diensten en platforms.

“We hebben zeker bedrijven nodig om hun emissievoetafdruk te verkleinen, maar bedrijven en beleidsmakers mogen niet uit het oog verliezen dat het gebruik van deze technologieën een veel grotere impact kan hebben in termen van zowel vermindering van emissies als toenemende emissies in andere sectoren en diensten,” Kamiya gezegd. “Videoconferenties kunnen bijvoorbeeld helpen om de uitstoot van de luchtvaart te verminderen door sommige zakenreizen te ‘vervangen’, maar sommige toepassingen van machine learning kunnen meer consumptie bevorderen of het concurrentievermogen van fossiele brandstoffen vergroten, wat resulteert in hogere emissies in het algemeen. Alleen focussen op de ‘voetafdruk’ loopt het risico kansen – (en risico’s) – van grotere emissie-effecten in andere sectoren en diensten te missen.”

Stanford Ph.D. en Juris Doctor-kandidaat Peter Henderson, een onderzoeker op het gebied van natuurlijke taalverwerking, versterkend leren, machine learning, kunstmatige intelligentie, computervisie en AI-ethiek, is het ermee eens dat er redelijke maatregelen zijn die leidinggevenden kunnen nemen om innovatie te laten stromen en tegelijkertijd de milieuschade te verminderen.

“Elke generatietaak vereist veel gegevens, vooral als je geen beperkingen hebt aan het onderwerp of de materie waarmee het model te maken heeft. Het is dus waar dat sommige gebieden gewoon veel gegevens nodig hebben. Maar als je een model bouwt, heb je een doel in gedachten, toch? En in die gevallen, waar je een doeltaak voor ogen hebt, heb je niet alle data van de wereld nodig. Wat je nodig hebt, wordt weergegeven in ML-benchmarks”, zegt Henderson. “Veel benchmarks zijn al dichtbij bovenmenselijke nauwkeurigheid op het gebied van sentimenten, zoals classificatie of analyse … en dus is het in die gevallen heel duidelijk dat je niet alle gegevens ter wereld nodig hebt, omdat we die met veel minder. Ik denk dat mensen echt moeten nadenken over de doeltaken die ze gebruiken, en nadenken over hoe je de hoeveelheid data die je gebruikt kunt beperken om toch je voordeel te halen en tegelijkertijd de kosten te verlagen. Dat gezegd hebbende, het is niet duidelijk hoe dat in wisselwerking staat met schaal.”

Stanford heeft zelf stappen gezet met een gereedschap speciaal ontworpen om de verborgen koolstofkosten van AI en ML te meten.

Bovendien, in een paper met de titel Energie- en beleidsoverwegingen voor diep leren in NLP, onderzoekers Emma Strubell, Ananya Ganesh en Andrew McCallum ontdekten dat vier deep learning NLP-modellen – Transformer, ELMo, BERT en GPT-2 – verantwoordelijk zijn geweest voor de meest significante prestatieverbeteringen als het gaat om energie-efficiëntie.

Een andere manier om de impact van data-explosie te beperken, is na te gaan hoe de impact wordt gemeten. Hulpmiddelen zoals Microsoft Cloud voor duurzaamheid, SustainLife en Net Zero Cloud van Salesforce bieden manieren om de CO2-voetafdruk van een bedrijf te meten en duurzaamheid impacts en zelfs om gegevens op te slaan die bedrijven nodig hebben om potentiële misstappen en kansen om te verbeteren visueel te zien en te begrijpen.

“We zijn voortdurend op zoek naar manieren om onze CO2-emissierapportage te verbeteren en ons koolstofboekhoudingsproces te verbeteren om snellere, betere en nauwkeurigere gegevens te leveren”, zegt Ari Alexander, algemeen directeur van Salesforce’s Net Zero Cloud. “Het overgrote deel van de uitstoot van een organisatie is afkomstig van de waardeketen, ook wel scope 3-emissies genoemd. Dat omvat de CO2-uitstoot van partners zoals data- en cloudserviceproviders. Met Net Zero Cloud kunnen klanten de emissies van scope 1, 2 en 3 volgen en stroomlijnen hoe ze de CO2-voetafdrukgegevens van hun toeleveringsketen volgen om effectief samen te werken met leveranciers om hun inspanningen op het gebied van duurzaamheid af te stemmen – allemaal op één plek.”

Natuurlijk maakt ook het verschil hoe en waar gegevens uiteindelijk worden opgeslagen, zelfs in de cloud.

“Vaak worden de grootste machine learning-taken in de cloud uitgevoerd en vaak kan dat naar verschillende delen van de wereld worden verplaatst”, zegt Henderson. “Veel van de koolstofemissies van de energiekosten kunnen worden verminderd door je banen gewoon te verplaatsen naar een koolstofvriendelijke regio zoals Montréal, dat bijvoorbeeld veel datacenters heeft die op bijna alle hydro-elektriciteit draaien. Dus als je al je machine learning-taken daar uitvoert, zou je de uitstoot verlagen.”

Hoewel, Henderson merkt op dat als: iedereen het verplaatsen van machine learning-banen naar Montreal, zou het het energienetwerk in die regio kunnen overweldigen. Maar het nemen van kleine stappen om na te denken over manieren om prestaties te verplaatsen, kan een verschil maken als het gaat om de impact op het klimaat.

Aanbieders van datacenters zoals Equinix innoveren in de richting van groene gegevens opslag. Het bedrijf in het bijzonder – dat datacenterdiensten levert aan onder meer zakelijke klanten zoals Zoom, Netflix, Salesforce, AT&T en Verizon – richt zich zelfs op het duurzaam bouwen en ontwerpen van hun datacenters en doet dit al meer dan een decennium.

“Het lijkt waarschijnlijk dat de energie-efficiëntie in datacenters zal blijven verbeteren, maar de belangrijkste vraag is of het gelijke tred kan houden met de toename van de vraag naar datadiensten – met andere woorden, of het algehele energieverbruik van datacenters relatief stabiel zal blijven (zoals we de afgelopen 10 jaar hebben gezien) of dat het sneller zal stijgen omdat de energie-efficiëntie de groei van de vraag niet kan bijhouden”, merkt Kamiya op. “Sommige van de eenvoudigere (dwz laaghangend fruit) efficiëntiemogelijkheden zijn al aangeboord (met name de verschuiving van minder efficiënte bedrijfsdatacenters naar efficiëntere cloud- en hyperscale datacenters), dus het is mogelijk dat we een matige toename van totale energieverbruik van datacenters in de komende jaren. Maar hoeveel en hoe snel is onzeker, en hoe snel deze kunnen worden aangedreven met koolstofarme elektriciteit (om de uitstoot gelijk te houden of te verminderen).”

Om het perspectief te behouden, merkte Kamiya ook op dat de ontwikkeling van datacenters niet overal ter wereld uniform is.

“Hoewel het energieverbruik wereldwijd grotendeels vlak is geweest, zijn er enorme stijgingen geweest in datacenterhubs zoals Ierland, zoals opgemerkt door hun centraal bureau voor de statistiek. Evenzo zullen er in de VS staten zijn waar het energieverbruik van datacenters sterk zal stijgen en andere waar het vlak zal blijven en andere waar het zou kunnen dalen”, zei hij.

Industrievoorspellingen voor gegevens- en energie-efficiëntie

Terwijl de SEC vooruitgang boekt met de regelgeving ESG-rapportagevereisten voor bedrijven is dit een nieuw gebied voor veel bedrijven om op dit moment te navigeren, vooral in de VS, waar dit soort rapportage nog niet eerder verplicht was.

“Ik denk dat het belangrijk is dat de SEC en andere regelgevende instanties hier actie op ondernemen, maar ik denk dat bedrijven al zonder dit handelen”, merkte Henderson op. “Tegelijkertijd is het belangrijk om dat basisniveau van transparantie over de hele linie te hebben. Ik denk dat er andere regelgevende maatregelen kunnen worden genomen om dit proces te helpen bevorderen in termen van ervoor te zorgen dat de ecologische voetafdruk en de milieuvriendelijkheid worden beperkt.”

Wat de toekomst betreft, zolang de regelgeving in behandeling is, stelt Kamiya voor dat bedrijven hun inspanningen ook kunnen richten op het verminderen van de milieueffecten in hun toeleveringsketens, evenals “hun platforms en hulpmiddelen gebruiken om consumenten te informeren over hoe ze emissies kunnen verminderen (bijv. de milieueffecten van verschillende producten of verzendopties; suggesties voor koolstofarme reisopties in kaart-apps; en het aanpakken van verkeerde informatie/desinformatie over het klimaat op sociale media). Deze kerndiensten die deze bedrijven leveren, zijn waar belangrijke, extra emissie-effecten kunnen worden gerealiseerd.”

De missie van VentureBeat is een digitaal stadsplein voor technische besluitvormers om kennis op te doen over transformatieve bedrijfstechnologie en transacties. Leer meer over lidmaatschap.