Baza kodów pocztowych WASKO S.A.
Zaloguj się do baz wiedzy
 
 

Deduplikacja


Deduplikacja danych polega na identyfikacji powtarzających się rekordów, pomimo występowania drobnych różnic pomiędzy nimi. Duplikacja danych powstaje podczas ręcznego wprowadzenia błędnych literowo danych, przy łączeniu różnych baz. Przy pomocy złożonych algorytmów baza jest skanowana w celu odnalezienia podobnych rekordów oraz oceniane jest ich podobieństwo. Wyszukane pary klasyfikowane są do poszczególnych grup według podziału na rekordy typu:
• takie same
• podobne
• różne

Deduplikacja danych pozwala na oznaczanie podwójnych rekordów , następnie umożliwia ich usunięcie, co pozwala na zmniejszenie ilości wymaganej pamięci do przechowywania danych.

Schemat działania deduplikacji danych:
Schemat działania deduplikacji danych
 

Doświadczenie



Od ponad 15 lat prowadzimy dla was Bazy Wiedzy


Profesjonalizm



Najbardziej kompleksowa, rozbudowana i aktualna baza miejscowości i instytucji w Polsce

Zaufanie



Naszymi klientami jest już ponad 1000 największych firm i instytucji, takie zaufanie zobowiązuje
 
Wszelkie prawa zastrzeżone - WASKO S.A. 1988-2017

Zgodnie z art. 173 Prawa Telekomunikacyjnego informujemy, że odwiedzana strona korzysta z plików cookies. W związku z powyższym użytkownik strony może domyślnie ustawić w przeglądarce poziom, czy, ile i jakie chce cookies. Brak takich ustawień będzie świadomym aktem woli i akcetpacji plików cookies. Nie pokazuj więcej tego powiadomienia