Google zaproponował nowe narzędzie wykorzystujące generatywną sztuczną inteligencję. Pozwoli ono na łatwiejsze tworzenie obrazów. Nazywa się Whisk.
Whisk można przetłumaczyć jako „trzepaczkę”. Bo trochę na tym opiera się działanie nowego narzędzia opracowanego w ramach Google Labs. Narzędzia, które pozwoli łatwiej tworzyć obrazy i nimi zarządzać.
Na razie korzystać z niego mogą użytkownicy w Stanach Zjednoczonych. Jest to rodzaj eksperymentu, który jeśli się sprawdzi, stanie się propozycją Google na cały świat. Dzieki temu firma zdobędzie kolejny atut w obszarze rozwiązań AI.
Whisk – jak to działa?
Obecnie w Gemini z Imagen 3 generowanie obrazów odbywa się za pomocą długich i szczegółowych promptów tekstowych. Whisk umożliwia wprowadzanie proptów złożonych z obrazów. W tym celu należy je przeciągnąć czy dodać z galerii i tworzyć nowe kompozycje.
Do tworzenia własnych kompozycji Whisk wykorzystuje trzy elementy:
– obiekt;
– scenę;
– styl.
Obiekt jest głównym bohaterem obrazu. Pozostałe elementy osadzają go w kontekście.
Można wybrać jakąś osobę lub obiekt, dodać scenę, czyli własny obrazek przedstawiający krajobraz na tło czy też wylosować grafikę z galerii. Na koniec definiujemy styl całej kompozycji np. anime. Dla określenia stylu można użyć obrazu lub krótkiego promptu tekstowego.
Do finalnej grafiki można dodawać kolejne elementy i szczegóły, jak to, jak ma się zachowywać obiekt czy jak ma być ubrany.
Na tej podstawie Whisk wygeneruje kilka gotowych obrazów. Za wszystko odpowiada Gemini z generatorem obrazów Imagen 3.
We wczesnych testach, w których udział wzięli artyści i twórcy, opisywano Whisk jako nowy typ narzędzia kreatywnego. Nie nazwano go edytorem obrazów. Teraz testować narzędzie mogą użytkownicy z USA.
Reszta świata musi poczekać.
Źródło: telepolis.pl