Google taler om vigtigheden af open source og open data i et nyligt blogindlæg
Google som firma har altid været til støtte for open source-software og data, i det mindste i deres stand. Det er næsten en tendens med store virksomheder nu, da både Google og Microsoft har ydet fremtrædende bidrag til open source-scenen. “Google er også en stor bidragyder til open source-software. Nøgleeksempler på dette inkluderer Android, vores smartphone-operativsystem, Chromium, kodebasen til vores Chrome-browser (som nu også driver mange konkurrenter) og TensorFlow, vores maskinlæringssystem. Googles frigivelse af Kubernetes ændrede cloudhosting for evigt og har muliggjort innovation og konkurrence på tværs af skybranchen. Google er også den største bidragyder af open source-kode til GitHub, et delt lager til softwareudvikling. I 2017 foretog Googlers mere end 250.000 ændringer i titusinder af projekter alene på GitHub.”
I de fleste tilfælde handler det ikke rigtig om generøsitet, men mere om at drage fordel af gratis udvikling og derefter drage fordel af bred vedtagelse. Uanset hvad har disse bidrag hjulpet tusindvis af forskere og har ført softwareudviklingen på en ensartet måde, som skal fejres. Google i en nylig blogpost fremhævede deres bidrag til open data og open source software.
Med fremkomsten af realtidssporing og udvikling af førerløse biler foretages der meget forskning inden for computersyn, og Google er en af de virksomheder, der er i front inden for Visual Tech.
Google sidder også på en masse data, som kan hjælpe NLP-forskning og hjælpe computere med bedre at forstå menneskelig tale. I blogindlægget fremhævede Google delingen af en nøgledatabase med angivelse af “Med hensyn til sprogbehandling har vi delt Natural-databasen, som indeholder 307.373 menneskeskabte spørgsmål og svar. Vi har også stillet Trillion Word Corpus til rådighed, som er baseret på ord, der bruges på offentlige websider, og Ngram Viewer, der kan bruges til at udforske de mere end 25 millioner bøger i Google Bøger. Disse samlinger kan bruges til statistisk maskinoversættelse, talegenkendelse, stavekorrektion, enhedspåvisning, informationsudvinding og anden sprogforskning. ”
Søgemaskinen er en af Googles kerneforretninger og får over 63.000 forespørgsler hvert sekund. Disse data er meget vigtige for virksomheden, og Google analyserer disse data til målrettet reklame. Alligevel offentliggøres nogle indsigter i de samlede data i Googles trendsportal.
“Google tilbyder også Google Trends, en gratis tjeneste, der gør det muligt for alle at se og downloade samlet søgeaktivitet siden 2004 til Google Søgning, Billedsøgning, Nyhedssøgning, Shopping og YouTube. Du kan få søgeoplysninger for lande, regioner, metroområder og byer på en månedlig, ugentlig, daglig og endda timesbasis. Trends-dataene bruges i vid udstrækning af forskere inden for så forskellige områder som medicin og økonomi. Ifølge Google Scholar er der mere end 21.000 forskningsartikler, der nævner tendenser som datakilde. ”
Hvorfor arbejde på open source-projekter?
Jeg talte kort om dette i begyndelsen af artiklen. Et nyt stykke software kan implementere en god idé og innovere rummet, men det forhindrer ikke andre i at implementere lignende ideer og derefter arbejde på at gøre det bedre. Mange virksomheder har lært det på den hårde måde, for eksempel Windows Phone. Som vi ved var det en rungende fiasko og af mange grunde, men at have et lukket miljø og kontrollere licens var en stor del af det. Hardoop og HDFS var open source-versioner af MapReduce bygget af Google, og virksomheden lærte tidligt vigtigheden af open source. Sammenfattende er beslutningen om at lave en IP-open source en strategisk beslutning.
Google fordyber sig i et par andre grunde i sit blogindlæg med angivelse af “Først og fremmest er vores primære mission "at organisere verdens information og gøre den universel tilgængelig og nyttig." Bestemt en åbenbar måde at gøre informationen universelt tilgængelig og nyttig på er at give dem væk!”
De taler også om, hvorfor de ikke kan frigive nogle ting, der siger "Vi kan selvfølgelig ikke frigive alle de data, vi bruger i vores forretning. Vi er nødt til at beskytte brugernes privatliv, opretholde fortrolighed for forretningskunder og beskytte Googles egen intellektuelle ejendom. Men med forbehold for sådanne overvejelser forsøger vi generelt at gøre vores data så “universelt tilgængelige og nyttige” som muligt.“