Microsoft wprowadza rewolucyjną AI do Worda i PowerPointa. Generuje ona precyzyjne opisy obrazów, wspierając 1,3 mld osób z wadami wzroku. To przełom dla dostępności.
W skrócie:
- Microsoft 365 otrzymuje nową generatywną AI, która tworzy bogate, kontekstowe opisy obrazów (alt text), zastępując stare, bezużyteczne komunikaty.
- Na komputerach Copilot+ sztuczna inteligencja działa lokalnie, bez wysyłania danych do chmury, co gwarantuje pełną prywatność. Użytkownik zachowuje pełną kontrolę nad opisem.
- Inicjatywa ma na celu poprawę dostępności cyfrowej dla 1,3 miliarda osób z wadami wzroku, dla których tekst alternatywny jest kluczowym narzędziem do rozumienia treści.
Dostępność cyfrowa rzadko trafia na okładki technologicznych magazynów. Nie generuje viralowych zasięgów, nie jest tematem gorących debat na TikToku. A jednak to właśnie ona decyduje, czy technologia służy wszystkim, czy tylko wybranym. Microsoft właśnie zrobił w tej dziedzinie krok, który trudno zignorować. Firma wprowadza do Worda i PowerPointa zupełnie nowy system generowania tekstów alternatywnych (alt text), który opiera się na generatywnej sztucznej inteligencji. I tym razem to nie jest tylko marketingowa wydmuszka.
Tekst alternatywny to krótki opis obrazu, który czytniki ekranu odczytują na głos osobom niewidomym i słabowidzącym. Bez niego wykresy, zdjęcia, infografiki i diagramy stają się cyfrową pustką. Mówimy tu o fundamentalnej barierze dla ogromnej grupy liczącej 1,3 miliarda ludzi na całym świecie. To nie jest nisza. To populacja większa niż cała Europa. Ale alt text przydaje się każdemu – gdy obrazek się nie załaduje z powodu słabego internetu, gdy przeglądamy dokument na małym ekranie albo gdy chcemy szybko zrozumieć kontekst grafiki. To element, który po cichu podnosi jakość dokumentów dla wszystkich.
Dlaczego dotychczasowe opisy obrazów były porażką?
Problem w tym, że automatyczne opisy generowane do tej pory przez pakiety biurowe były, delikatnie mówiąc, komiczne. A raczej tragikomiczne. Starszy model, Azure Vision, produkował opisy w stylu “obraz wykresu” albo “zdjęcie przedmiotu”. Zero kontekstu, zero wartości informacyjnej. Wyobraźmy sobie, że czytnik ekranu odczytuje komuś taki komunikat. To tak, jakby na pytanie “co jest na obrazku?” odpowiedzieć “obrazek”. Microsoft doskonale wiedział, że to nie działa, dlatego postanowił zbudować system od nowa, wykorzystując potencjał, jaki dają nowoczesne modele generatywne.
Stara technologia nie potrafiła interpretować relacji między obiektami ani rozumieć, dlaczego dany obraz znalazł się w dokumencie. Nowe rozwiązanie ma to zmienić, dostarczając opisy, które są nie tylko technicznie poprawne, ale przede wszystkim użyteczne. To fundamentalna zmiana w podejściu – od mechanicznego rozpoznawania obiektów do faktycznego rozumienia treści wizualnych.
Jak działa nowa AI i co to oznacza dla prywatności?
Nowy system Microsoftu działa w dwóch trybach, a wybór zależy od posiadanego sprzętu. Prawdziwa magia dzieje się na komputerach klasy Copilot+, czyli najnowszych laptopach wyposażonych w dedykowane procesory NPU (Neural Processing Unit). Gdy użytkownik wstawia obraz do Worda lub PowerPointa, generatywna AI tworzy opis całkowicie lokalnie, bez wysyłania jakichkolwiek danych do chmury. Wszystko odbywa się na urządzeniu, w ułamku sekundy, z pełnym poszanowaniem prywatności.
To już nie są suche, jednowyrazowe etykiety. To bogate, kontekstowe opisy, które faktycznie wyjaśniają, co znajduje się na obrazie i dlaczego może to być istotne w danym dokumencie. Co więcej, użytkownik zachowuje pełną kontrolę. Może wygenerowany opis zaakceptować, poprawić, skrócić, rozwinąć albo napisać od nowa. AI jest tu inteligentnym asystentem, a nie autorytarnym cenzorem. Microsoft podszedł do tematu odpowiedzialnie: modele przeszły rygorystyczne audyty, system unika interpretacji i domysłów, a każdy opis musi zostać finalnie zatwierdzony przez człowieka.
Czy dostępność wreszcie stanie się standardem?
Ten ruch Microsoftu to coś więcej niż tylko kolejna funkcja. To sygnał, że giganci technologiczni zaczynają rozumieć, że dostępność nie jest dodatkiem, ale fundamentem. Firma wsłuchała się w głosy użytkowników i rozwiązała realny, palący problem. Alt text może i nie jest “sexy”, ale dla milionów ludzi jest absolutnie kluczowy dla funkcjonowania w cyfrowym świecie.
Nowy system generowania opisów obrazów pokazuje, że sztuczna inteligencja może być potężnym narzędziem inkluzywności, a nie tylko maszynką do tworzenia kolejnych obrazków kotów w kosmosie. To krok w stronę internetu, który naprawdę jest dla wszystkich. Jeśli korzystasz z Microsoft 365, sprawdź tę funkcję. A jeśli myślisz, że ciebie to nie dotyczy, zastanów się, kto jutro będzie pracował z twoimi dokumentami. Dostępność to nie luksus. To nasza wspólna odpowiedzialność.