El Microsoft Word, l'Outlook i el PowerPoint per obtenir una eina de subtítols automàtics amb imatge basada en AI formada en conjunts de dades grans després dels serveis Azure

Tècnica / El Microsoft Word, l'Outlook i el PowerPoint per obtenir una eina de subtítols automàtics amb imatge basada en AI formada en conjunts de dades grans després dels serveis Azure 2 minuts de lectura

Microsoft Azure. CirtixGuru



Microsoft ho ha fet confirmat que ha desenvolupat un potent i intel·ligent sistema de subtítols d’imatges. El sistema alimentat per IA pot generar de forma ràpida i autònoma cations d'imatges rellevants. És possible que el sistema no sigui tan fluït ni creatiu com els humans que creen subtítols per a imatges, però, segons els informes, s’ha format en grans conjunts de dades per millorar la rellevància i la precisió. Microsoft assegura que el sistema és el doble de potent que el que s’utilitza en els serveis de l’empresa.

Microsoft té un nou sistema de subtítols automàtics per a imatges. El sistema s’iniciarà primer a Azure Cognitive Services. Tot i això, Microsoft ha indicat que el mateix passarà a Microsoft Word, Outlook i PowerPoint.



Com funciona el nou sistema de subtítols d'imatges AI-Drive?

Qualsevol sistema impulsat per la IA ha de ser format primer en conjunts de dades rellevants. Aquests algoritmes aprenen dels punts de dades i després obtenen la capacitat d’imitar els patrons de comportament esperats. Segons els informes, el nou sistema de subtítols d’imatges automàtics de Microsoft està format amb un enorme conjunt de dades d’imatges que s’aparellaven amb etiquetes de paraules. Aquestes etiquetes de paraules es van assignar a un objecte diferent d'una imatge.



Després de la formació inicial, els investigadors van afinar el model pre-entrenat per subtitular al conjunt de dades d’imatges ja subtitulades. El procés d’entrenament i afinació final va permetre al model d’IA aprendre a compondre una frase entenedora. El nou model d’IA utilitza posteriorment el vocabulari visual per autogenerar llegendes per a imatges que contenen objectes nous o diferents amb precisió. Sembla que es posa èmfasi en l'objecte específic o únic de la imatge.



Com passa amb tots els models d’IA, fins i tot el sistema de subtítols d’imatges de Microsoft no és 100% precís ni perfecte. Tot i això, Microsoft assegura que el nou model AI és el doble de millor que el model de subtítols d’imatges que s’utilitza actualment en els productes i serveis de la companyia. Proves internes indica el nou model pot crear subtítols més descriptius i precisos que els subtítols escrits manualment per humans, afirma Xuedong Huang, membre tècnic de Microsoft i cap de tecnologia d'Azure AI Cognitive Services a Redmond, Washington,

'Estem portant aquest avenç de la IA a Azure com a plataforma per atendre un conjunt més ampli de clients. No és només un avenç en la investigació; el temps que va trigar a convertir aquest avanç en producció a Azure també és un gran avanç '.



El que va indicar Huang va ser que Microsoft ha pogut accelerar significativament el desenvolupament, el refinament i el desplegament de models AI que poden competir amb el contingut generat per humans. Tot i això, és important tenir en compte que aquests models solen seguir un conjunt específic de pautes i es basen en gran mesura en els conjunts de dades.

Microsoft ha estat treballant dur durant els darrers anys per infondre el poder de la IA a diversos dels seus productes i serveis. La IA té el poder d’augmentar la productivitat i alliberar els humans de fer tasques més creatives. Curiosament, Microsoft pretén ajudar a tots els usuaris a accedir al contingut vital de qualsevol imatge per a persones amb discapacitat visual mitjançant el nou sistema de subtítols automàtics.

Etiquetes Blau Microsoft