Microsoft è pronta a portare il suo rinnovato Bing al prossimo livello, rendendolo di fatto una piattaforma multi-modale grazie alle potenzialità di GPT-4. A partire dalla prossima settimana, infatti, il chatbot che muove il motore di ricerca di Microsoft abbraccerà la quarta generazione del modello di linguaggio a cui OpenAI ha lavorato in questi mesi. Un aggiornamento che per Microsoft sarà un vero e proprio “punto di svolta”, come afferma il CTO Andreas Braun dall’evento tedesco AI in Focus – Digital Kickoff: ed ecco perché lo sarà.

Bing e GPT-4: per Microsoft sarà questa la vera rivoluzione dell'IA generativa

Rispetto a GPT 3 e 3.5 (su cui si basa attualmente), con GPT-4 Bing sarà in grado di svolgere ricerche più efficienti e rapide e all’interno di conversazioni dal tono più umano. Ma la grande novità si chiamerà multi-modalità, cioè senza più limitarsi soltanto al testo ma anche a immagini, video e audio. Bisognerà capire come verrà attuata questa tecnologia, ma le sue potenzialità potranno rendere Bing un factotum con cui creare immagini, video e musica da input testuali.

Nei piani di Microsoft non c’è soltanto la volontà di appoggiarsi a OpenAI ma anche di creare soluzioni indipendenti. Nasce così Kosmos-1, la IA generativa proprietaria di Microsoft anch’essa multi-modale e quindi in grado di elaborare sia testo che immagini. Per capirne le capacità, qua di seguito trovate varie dimostrazioni piuttosto esplicative: per esempio, mostrandogli la foto di una persona e chiedendogli come siano i suoi capelli può rispondere con il tipo di acconciatura usata; o ancora, mostrandogli la foto di un orologio può dirci che orario indica; il tutto avviene in formato conversazionale, perciò quell’immagine può essere utilizzata come base su cui avere la discussione con il chatbot.

Oltre a saper interpretare le immagini, le abilità di questa IA le permettono di saper risolvere puzzle e superare test IQ; per raggiungere tali risultati, Microsoft ha addestrato Kosmos-1 con petabytes di materiale proveniente dai noti database The Pile e The Crawl. Tuttavia, c’è ancora del lavoro da fare: sottoponendola al test di QI visivo Raven's Progressive Reasoning, Kosmos-1 ha risposto correttamente solo al 22-26% delle domande. E se il rilascio di Bing con GPT-4 è ormai prossimo, non è dato sapere quando lo stesso avverrà con Kosmos-1 e come verrà impiegata: non sembra però che sostituirà GPT in Bing, ma che verrà invece fornita a sviluppatori di terze parti.

