TECHNOLOGIA · CYBERBEZPIECZEŃSTWO · BIZNES

Niska jakość danych w analityce big data

Wiele firm i instytucji wykorzystuje narzędzia do przetwarzania dużych zbiorów informacji, by zwiększyć swoją efektywność operacyjną. Firmy liczą również na to, że inwestowanie w ten obszar przełoży się na większe przychody oraz przyczyni się do redukcji kosztów. Problemem jest jednak słaba jakość danych. Czym to skutkuje? 

Autorzy raportu 2026 State of Data Integrity and AI Readiness podkreślają, że specjaliści ds. danych poradzili sobie z wieloma kwestiami, które swego czasu stanowiły dla nich spory problem. Mowa między innymi o ograniczeniach zasobów obliczeniowych. Badani rzadziej wskazują również na trudności związane z dokumentowaniem zbiorów informacji (25 proc. odpowiedzi) czy ich utrzymaniem (12 proc.). Sporym wyzwaniem pozostaje jednak słaba ich jakość danych. To właśnie ona jest źródłem błędów podczas podejmowania decyzji biznesowych.

– Mówiąc o jakości danych, specjaliści mają na myśli przede wszystkim ich kompletność, poprawność i dostępność – mówi Maciej Wawrzyniak z Linux Polska. – W praktyce oznacza to, że w zbiorze danych, które mają posłużyć do analizy, muszą znajdować się wszystkie niezbędne informacje zapisane w odpowiednim formacie, a każdy uprawniony użytkownik czy system powinien mieć do nich bezproblemowy dostęp. Niespełnienie tych kryteriów prowadzi do błędów w narzędziach analitycznych i raportach, na podstawie których podejmowane są decyzje biznesowe. Przekłada się także na problemy w realizacji codziennych zadań operacyjnych, co jest wyraźnie widoczne przykładowo w handlu detalicznym. Jeśli firmy z tej branży prowadzą działalność w różnych, niezintegrowanych ze sobą kanałach sprzedażowych, informacje z każdego z nich są gromadzone w osobnych bazach czy całych systemach. Brak spójnego modelu danych zafałszowuje np. rzeczywisty obraz stanów magazynowych, co utrudnia realizację zamówień, ale też wpływa na dostępność produktów oraz rzetelność raportów.

Mimo świadomości problemu nie wszystkie firmy podejmują działania, które by go rozwiązały. Badania pokazują, że głównym wyzwaniem jest mierzenie jakości, na co wskazuje 29 proc. osób. Brak jasno określonych zasad oceny dostępności, poprawności czy kompletności danych uniemożliwia ich poprawę. To jednak nie wszystko. Specjaliści zauważają problemy ze stosowaniem zasad i procedur utrzymania jakości (28 proc. odpowiedzi) oraz zbyt dużą liczbą źródeł informacji (27 proc.).

Integracja pozwala łączyć informacje pochodzące z wielu rozproszonych baz, czego efektem jest ujednolicenie ich widoku. W ten sposób powstaje centralne repozytorium danych które pełni funkcję wiarygodnego źródła informacji. O tym, jak ważna jest to kwestia, przekonują doświadczenia wielu firm. Przykładowo: jeśli organizacja obsługująca wierzytelności korzysta z różnych źródeł informacji, w tym systemów bankowych, rozwiązań służących do zarządzania windykacją czy aplikacji telekomunikacyjnych, uzyskanie pełnej i rzetelnej informacji o kliencie jest możliwe dopiero po wdrożeniu nowoczesnej architektury danych, która te źródła zintegruje. Takie rozwiązanie umożliwia dostosowanie oferty do oczekiwań konkretnych segmentów klientów, a dodatkowo jest podstawą zaawansowanej analityki predykcyjnej, czyli prognozowania zachowań i trendów na podstawie danych historycznych. Nowoczesne praktyki integracyjne pozwalają również na automatyzację wielu procesów IT, co ogranicza błędy związane z działaniami manualnymi tłumaczy Tomasz Dziedzic, Linux Polska.

Platforma IT z ujednoliconymi, zintegrowanymi danymi otwiera przed organizacjami zupełnie nowe możliwości w zakresie tworzenia innowacji dostosowanych do potrzeb użytkowników końcowych. To także duży krok w stronę większej efektywności monitorowania i szacowania ryzyka, działań marketingowych czy projektowania ścieżki konsumenta. Dostęp do pełnych, rzeczywistych danych o kliencie pomaga pracownikom zarządzającym wierzytelnościami w realizacji codziennych zadań operacyjnych, na przykład doradztwa osobom posiadającym zobowiązania finansowe – dodaje Maciej Gryszko, Dyrektor Departamentu IT firmy Intrum.

Firmy i instytucje deklarują, że widzą ryzyka związane z podejmowaniem decyzji na podstawie niekompletnych lub nieaktualnych informacji. 38 proc. z nich planuje zwiększyć nakłady finansowe na działania związane z polepszeniem jakości danych jeszcze w tym roku. Większym priorytetem inwestycyjnym związanym z analityką są jedynie narzędzia AI, na które stawia 45 proc. badanych.

Jakie działania są w stanie wesprzeć organizacje w osiągnięciu tego celu? Badania przeprowadzone wśród firm, które zdecydowały się na integrację aplikacji, nie pozostawiają wątpliwości. Główną korzyścią, którą osiągnęli dzięki temu projektowi, jest właśnie zwiększenie jakości danych – odpowiedź tę wskazało 45 proc. respondentów. Wielu specjalistów przyznało również, że integracja pomogła im w uzyskaniu lepszego dostępu do informacji znajdujących się w różnych systemach (44 proc.), ograniczeniu kosztów (43 proc.), a także przyspieszeniu procesu dostarczania zasobów niezbędnych do podejmowania decyzji biznesowych (42 proc.). Inwestowanie w analitykę danych może zatem przynieść oczekiwane efekty, jeśli stoją za nim działania mające na celu zwiększenie jakości wykorzystywanych informacji.

Czytaj także:

Marek Nowak
Marek Nowak
Redaktor naczelny ISPortal, wcześniej związany między innymi z miesięcznikiem Mobile Internet. Artykuły dotyczące nowych technologii publikował także w portalu Trojmiasto.pl. Po godzinach tworzy opowiadania science-fiction, które ukazały się m.in. w Nowej Fantastyce, Epei, Młodym Techniku.

przeczytaj najnowszy numer isporfessional

Najnowsze