Google parla de la importància del codi obert i de les dades obertes en una publicació recent al bloc

Tecnologia / Google parla de la importància del codi obert i de les dades obertes en una publicació recent al bloc 3 minuts de lectura

Google



Google com a empresa sempre ha donat suport al programari i les dades de codi obert, almenys al seu punt de vista. Ara és gairebé una tendència amb les grans empreses, ja que tant Google com Microsoft han fet contribucions destacades a l’escena de codi obert. ' Google també és un dels principals contribuents al programari de codi obert. Alguns exemples claus d'això inclouen Android , el nostre sistema operatiu per a telèfons intel·ligents, Crom , la base de codi per al nostre navegador Chrome (ara també impulsant a molts competidors ), i TensorFlow , el nostre sistema d’aprenentatge automàtic. Alliberament de Google Governadors ha canviat l’allotjament al núvol per sempre i ha permès la innovació i la competència a tota la indústria del núvol. Google és també el principal contribuent de codi de codi obert a GitHub , un dipòsit compartit per al desenvolupament de programari. El 2017, Googlers va fer més de 250.000 canvis a desenes de milers de projectes només a GitHub. '

En la majoria dels casos, no es tracta realment de generositat, sinó més aviat de beneficiar-se del desenvolupament lliure i, després, de treure profit d’una adopció generalitzada. Independentment, aquestes contribucions han ajudat a milers d’investigadors i han liderat el desenvolupament de programari d’una manera uniforme, cosa que s’hauria de celebrar. Google en una publicació recent del blog va destacar la seva contribució a les dades obertes i al programari de codi obert.



Amb l’arribada del seguiment en temps real i el desenvolupament de cotxes sense conductor, s’està investigant molt en visió per computador i Google és una de les empreses a l’avantguarda de Visual Tech.



El nostre compromís amb el codi obert i les dades obertes ens ha portat a compartir conjunts de dades, serveis i programari amb tothom. Per exemple, Google va publicar el fitxer Obre el conjunt de dades d'imatges de 36,5 milions d'imatges que contenen prop de 20.000 categories d'objectes etiquetats per humans. Amb aquestes dades, els investigadors de visió per ordinador poden formar sistemes de reconeixement d’imatges. De la mateixa manera, els milions de vídeos comentats al YouTube-8M La col·lecció es pot utilitzar per entrenar el reconeixement de vídeos.



- Cosa variant

Economista en cap de Google

Google també té moltes dades que poden ajudar a la investigació de la PNL i ajudar els equips a entendre millor la parla humana. A la publicació del bloc, Google va destacar l’ús compartit d’una base de dades clau que afirma “ Pel que fa al processament d’idiomes, hem compartit el Preguntes naturals base de dades, que conté 307.373 preguntes i respostes generades per humans. També hem fet disponible el Corpus de bilions de paraules , que es basa en paraules utilitzades a les pàgines web públiques i en el fitxer Visor de Ngram , que es pot utilitzar per explorar els més de 25 milions de llibres de Google Llibres . Aquestes col·leccions es poden utilitzar per traducció automàtica estadística , reconeixement de veu, correcció ortogràfica , detecció d’entitats, extracció d’informació i investigació d’altres idiomes. '



El motor de cerca és un dels negocis bàsics de Google, que rep més de 63.000 consultes cada segon. Aquestes dades són molt importants per a l’empresa i Google les analitza per obtenir publicitat específica. Tot i això, algunes dades sobre les dades generals es fan públiques al portal de tendències de Google.

' Google també ofereix Google Trends , un servei gratuït que permet que tothom pugui veure i descarregar activitats de cerca agregades des de 2004 a la Cerca de Google, la Cerca d’imatges, la Cerca de notícies, Shopping i YouTube. Podeu obtenir informació de cerca de països, regions, àrees metropolitanes i ciutats mensualment, setmanalment, diàriament i fins i tot cada hora. Les dades de Tendències són àmpliament utilitzades per investigadors en camps tan variats com la medicina i l’economia. Segons Google Scholar, n’hi ha més de 21.000 treballs de recerca que citen Tendències com a font de dades '.

Per què treballar en projectes de codi obert?

N’he parlat breument al principi de l’article. Un nou programari pot implementar una idea fantàstica i innovar l’espai, però això no impedeix que altres implementin idees similars i després treballin per millorar-lo. Moltes empreses ho han après de la manera més difícil, per exemple, amb Windows Phone. Com sabem, va ser un fracàs rotund i per moltes raons, però tenir un entorn tancat i controlar les llicències va ser una part important. Hardoop i HDFS eren versions de codi obert de MapReduce construïdes per Google i l’empresa va conèixer la importància del codi obert des del principi. En resum, la decisió de fer un codi obert IP és estratègica.

Google, a la publicació del seu blog, aprofundeix en alguns altres motius i afirma: En primer lloc, la nostra missió principal és 'organitzar la informació del món i fer-la universalment accessible i útil'. Certament, una manera òbvia de fer que la informació sigui universalment accessible i útil és donar-la ! '

També parlen de per què no poden publicar algunes coses afirmant ' Per descomptat, no podem divulgar totes les dades que fem servir al nostre negoci. Hem de protegir la privadesa dels usuaris, mantenir la confidencialitat dels clients empresarials i protegir la propietat intel·lectual de Google. Però, subjectes a aquestes consideracions, generalment intentem que les nostres dades siguin el més 'accessibles i útils universalment'. '

Etiquetes Google