Odpowiedzią Google’a na chatGPT firmy Open AI jest Gemini Pro. Właśnie pojawiło się w nowej wersji o oznaczeniu 1.5. Twórcy chwalą się jego możliwościami i przewidują, że pokona konkurencję.
To, jakie możliwości na generatywna sztuczna inteligencja, zależy w dużym stopniu od wielkości tzw. okna kontekstowego. Natomiast wydajność modeli językowych określana jest poprzez liczbę tokenów. Są to porcje danych, które algorytm jest w stanie przetworzyć. Google chwali się, że pobiło właśnie rekord w tej kategorii.
Większe możliwości Gemini Pro 1.5
Podstawowa wersja modelu Gemini Pro 1.5 od Google’a obsługuje 128 tys. tokenów. To wartość porównywalna do GPT-4 Turbo. Testowo jednak uruchumiono wariant, który obsługuje milion tokenów. Co to oznacza?
Milion tokenów pozwala przeanalizować:
– godzinny film,
– 11 godzin nagrania audio,
– ponad 700 tys. słów,
– ponad 30 000 linii kodu.
Gemini Pro 1.5 jest w stanie przeanalizować całą książkę, film lub kilkanaście odcinków podcastu. I na tej podstawie odpowiedzieć na pytania. Udowodniono to w czasie testu.
Załadowała do Gemini plik PDF z 402-stronicową transkrypcją z misji Apollo 11 na Księżyc. AI w kilka sekund przeanalizowała dokument i wydobyła z niego cytaty. Podobny sukces przyniosły testy z 44-minutowym filmem niemym z 1924 r.- „Sherlock Jr.”. Także w tym przypadku sztuczna inteligencja była w stanie odpowiedzieć na pytania dotyczące fabuły.
Gemini Pro 1.5 może usprawnić również pracę programistów. Jest w stanie działać na kodzie złożonym nawet z kilkudziesięciu tysięcy linii.
Gemini Pro 1.5 nie dla każdego
Gemini 1.5 Pro prezentuje niezwykłe umiejętności. Jednak wersja z oknem kontekstowym z milionem tokenów jest na razie funkcją eksperymentalną. Sama firma Google twierdzi, że jest udostępniona „ograniczonej grupie deweloperów i klientów korporacyjnych”.
To trochę studzi entuzjazm. Z GPT-4 Turbo, do którego Google porównuje swój produkt, mogą korzystać już wszyscy chętni. Z Gemini Pro 1.5 na razie tylko wąska grupa wybrańców.
Źródło: benchmark.pl