Ko trūksta vertybių?
Duomenų analizėje trūkstamos reikšmės reiškia tam tikro kintamojo arba stebėjimo duomenų nebuvimą. Šios trūkstamos reikšmės paprastai vaizduojamos specialiu simboliu arba kodu, R ir daugelyje kitų programavimo kalbų dažnai žymimos NA (negalima).
na.omit() funkcija R
Thena.omit()>funkcija in R programavimo kalba naudojamas trūkstamoms reikšmėms (NA) pašalinti iš duomenų rėmelio, matricos ar vektoriaus. Pavadinimas na.omit reiškia omit NAs. Ši funkcija ypač naudinga dirbant su duomenų rinkiniais, kuriuose trūksta reikšmių, ir iš analizės norite neįtraukti stebėjimų su trūkstamais duomenimis.
Sintaksė:
na.omit(data)
Parametras:
duomenys: Nurodytų duomenų rėmelio, matricos arba vektoriaus reikšmių rinkinys.
Grąžinimai: Vertybių diapazonas po NA praleidimo.
Trūkstamų reikšmių pašalinimas iš vektoriaus
R
# Create a vector with missing values> vector <->c>(1, 2,>NA>, 4, 5)> vector> # Use na.omit() to remove missing values> cleaned_vector <->na.omit>(vector)> # Display the cleaned vector> cleaned_vector> |
masyvas vs masyvo sąrašas
>
>
Išvestis:
[1] 1 2 NA 4 5 [1] 1 2 4 5>
Trūkstamų verčių pašalinimas iš matrica
R
# Create a matrix with missing values> mat<->c>(>NA>,1,2,>NA>,3,4,>NA>,5,6,>NA>,7,8)> var<->matrix>(mat,3,4)> var> # Use na.omit() to remove missing values> na.omit>(var)> |
>
>
Išvestis:
[,1] [,2] [,3] [,4] [1,] NA NA NA NA [2,] 1 3 5 7 [3,] 2 4 6 8 [,1] [,2] [,3] [,4] [1,] 1 3 5 7 [2,] 2 4 6 8>
Trūkstamų verčių pašalinimas iš Duomenų rėmeliai
R
eilutę palyginti su
# Create a data frame with missing values> data <->data.frame>(> >ID =>c>(1, 2, 3, 4),> >Value =>c>(5,>NA>, 7, 8)> )> data> # Use na.omit() to remove rows with missing values> cleaned_data <->na.omit>(data)> # Display the cleaned data> print>(cleaned_data)> |
>
>
Išvestis:
ID Value 1 1 5 2 2 NA 3 3 7 4 4 8 ID Value 1 1 5 3 3 7 4 4 8>