No/VOL: 01b/2012 Page no. 26
Authors: Lejiang Guo , Wei Wang , Fangxin Chen , Xiao Tang , Weijiang Wang :
Title: Metoda detekcji podwójnych danych bazująca na rozmytym klastrowaniu
Abstract: Artykuł proponuje nowe metody czyszczenia danych z uwzględnieniem liczby przypadków, wielu źródeł, podwójnych rekordów i innych kryteriów oceny. Ulepszona metoda detekcji wykorzystuje algorytm rozmytego klastrowania w dystansem Levenshteina. W ten sposób szybko wykrywane są i usuwane podwójne wiersze danych.
Key words: czyszczenie danych, rozmyte klastrowanie.