Microsoft Word, Outlook og PowerPoint for at få AI-drevet automatisk billedtekstværktøj trænet på store datasæt efter Azure Services
Microsoft har bekræftet, at det har udviklet et kraftfuldt og smart billedtekstsystem. Det AI-drevne system kan hurtigt og autonomt generere relevante kationer af billeder. Systemet er muligvis ikke så flydende eller kreativt som mennesker, der skaber billedtekster til billeder, men det er efter sigende blevet uddannet i enorme datasæt for at forbedre relevans og nøjagtighed. Microsoft forsikrer, at systemet er dobbelt så stærkt som det udbredte, der bruges i virksomhedens tjenester.
Microsoft har et nyt automatisk billedtekstsystem til billeder. Systemet starter først i Azure Cognitive Services. Imidlertid har Microsoft angivet, at det samme vil sive ned til Microsoft Word, Outlook og PowerPoint.
Hvordan fungerer det nye AI-Drive billedtekstsystem?
Ethvert AI-drevet system skal først trænes i relevante datasæt. Disse algoritmer lærer af datapunkterne og får derefter evnen til at efterligne de forventede adfærdsmønstre. Microsofts nye automatiske billedtekstsystem er efter sigende uddannet med et stort datasæt af billeder, der blev parret med ordmærker. Disse ordmærker blev kortlagt til et særskilt objekt i et billede.
Efter den indledende træning finjusterede forskerne den foruddannede model til billedtekst på det allerede beskrevne billedsæt. Uddannelses- og finindstillingsprocessen gjorde det muligt for AI-modellen at lære at komponere en forståelig sætning. Den nye AI-model udnytter efterfølgende det visuelle ordforråd til selvgenererende billedtekster til billeder, der indeholder nye eller forskellige objekter nøjagtigt. Det ser ud til, at der lægges vægt på objektet, der er specifikt eller unikt i billedet.
Som med alle AI-modeller er selv Microsofts billedtekstsystem ikke 100 procent nøjagtigt eller perfekt. Imidlertid forsikrer Microsoft, at den nye AI-model er dobbelt så bedre som den billedtekstmodel, der i øjeblikket bruges i virksomhedens produkter og tjenester. Intern test indikerer, at den nye model kan skabe billedtekster, der er mere beskrivende og nøjagtige end billedtekster skrevet manuelt af mennesker, hævder Xuedong Huang, en teknisk teknolog fra Microsoft og teknologichef for Azure AI Cognitive Services i Redmond, Washington,
”Vi tager dette AI-gennembrud til Azure som en platform til at betjene et bredere sæt kunder. Det er ikke bare et gennembrud i forskningen; den tid det tog at omdanne dette gennembrud til produktion på Azure er også et gennembrud. ”
Hvad Huang antydede var, at Microsoft har været i stand til at fremskynde udviklingen, forbedringen og implementeringen af AI-modeller betydeligt, som kan konkurrere mod menneskegenereret indhold. Det er dog vigtigt at bemærke, at disse modeller normalt følger et specifikt sæt retningslinjer og er stærkt afhængige af datasættene.
Microsoft har arbejdet hårdt i de sidste par år for at sprede kraften fra AI på tværs af flere af sine produkter og tjenester. AI har styrken til at øge produktiviteten, mens den frigør mennesker til at udføre mere kreative opgaver. Interessant nok har Microsoft til formål at hjælpe alle brugere med at få adgang til det vitale indhold i ethvert billede til mennesker med synshandicap gennem det nye automatiske billedtekstsystem.