Sådan fjerner du outliers i Google Sheets
Google Ark Google Google Docs Helt / / June 02, 2023
![](/f/2844e34d7f8d7517a3f19f03912a30c4.jpg)
Udgivet
![Arbejde i et regneark fremhævet](/f/8e936d17152f00be1d9df561d9dc7868.png)
Nogle gange kan dit regneark indeholde usædvanligt høje eller lave værdier, der skævvrider dine resultater. Lær, hvordan du fjerner outliers i Google Sheets her.
Når du analyserer data, får du et eller to resultater, der kan kaste alt ud i skødet. Datapunkter, der er væsentligt højere eller væsentligt lavere end størstedelen af dine data, kan forvride mål som f.eks. gennemsnittet væsentligt. I nogle tilfælde er det bedre at fjerne disse afvigere fra dine data, før du starter din analyse.
Hvis du har nogle datapunkter, der ikke rigtig passer, så lær, hvordan du fjerner afvigelser i Google Sheets nedenfor.
Hvad er en Outlier?
En outlier er et datapunkt, der er væsentligt større eller mindre end størstedelen af dataene i sættet.
For eksempel, hvis du måler væksten af fem planter, og resultaterne var 5 cm, 7 cm, 6 cm, 7 cm og 25 cm, så ville det endelige resultat være en outlier. Størstedelen af resultaterne er alle omkring den samme værdi, og det endelige resultat er væsentligt højere end resten.
Der er metoder til at bestemme, hvilke værdier der vil blive betragtet som outliers, der er baseret på rækkevidden eller spredningen af dine data.
Hvorfor fjerne outliers?
I nogle tilfælde kan outliers i dine data skævvride resultaterne, når du analyserer dine data.
For eksempel, i tilfældet ovenfor, hvis vi tager gennemsnittet af væksten af alle fem planter, vil det være (5+7+6+7+25)/5 eller 10 cm. Fire af planterne voksede meget mindre end dette, med kun én plante, der voksede væsentligt mere, så det gennemsnitlige gennemsnit er ikke rigtig repræsentativt for nogen af datapunkterne.
Men hvis vi fjerner outlieren, vil gennemsnittet være (5+7+6+7)/4 eller 6,25. Dette er meget mere repræsentativt for de resterende værdier og giver en mere nøjagtig afspejling af dataene.
Nogle statistikker, såsom medianen, vil være upåvirket af outliers, men i mange tilfælde kan outliers have en betydelig indflydelse.
Sådan finder du en outlier
Der er flere måder at bestemme outliers på, baseret på rækkevidden eller spredningen af data. En af de enkleste involverer at bruge interkvartil rækkevidde.
En kvartil er simpelthen et datapunkt fundet ved at opdele dine data i fire lige store dele. Den nederste kvartil er tallet en fjerdedel af vejen gennem dine data, når de er opført i rækkefølge fra laveste til højeste. Den øverste kvartil er værdien tre fjerdedele af vejen gennem dine data.
Interkvartilområdet er forskellen mellem disse to værdier. Da det er forskellen mellem den nedre kvartil og den øvre kvartil, vil præcis halvdelen af dine værdier ligge inden for dette interkvartilområde.
Du kan bestemme den øvre grænse for outliers ved at gange interkvartilområdet med 1,5 og lægge resultatet til værdien af den øvre kvartil. Enhver værdi over dette tal er en outlier. På samme måde kan du finde den nedre grænse for outliers ved at gange interkvartilområdet med 1,5 og trække dette fra værdien af den nedre kvartil. Ethvert tal under denne værdi vil være en outlier.
Sådan finder du en outlier i Google Sheets
Hvis alt ovenstående lyder som lidt for meget matematik til din smag, så frygt aldrig. Google Sheets gør alt det hårde arbejde for dig. Det hjælper dig med at beregne den øvre kvartil, den nedre kvartil og interkvartilområdet for dine data, og du kan derefter oprette en formel for at bestemme, om hver værdi er en outlier eller ej.
Sådan finder du en afviger i Google Sheets:
- Vælg en celle, hvor du vil beregne den nederste kvartil.
- Indtaste følgende:
=KVARTIL(
- Vælg alle dine data.
- Indtast et komma og derefter et 1, efterfulgt af en lukket parentes.
- Trykke Gå ind og den nederste kvartil vil beregne.
- Vælg den næste celle ned og indtast følgende:
=KVARTIL(
- Vælg alle dine data.
- Indtast et komma, derefter et 3, efterfulgt af en lukket parentes.
- Trykke Gå ind og den øverste kvartil vil beregne.
- Vælg den næste række ned og skriv = og vælg derefter cellen, der indeholder den øverste kvartil.
- Indtast et minus (-) og vælg cellen, der indeholder den nederste kvartil.
- Trykke Gå ind og interkvartilområdet beregnes.
- Vælg cellen ved siden af den øverste celle af dine data, og indtast følgende formel, og erstat C3 med placeringen af din øverste celle med data, $C$18 med cellen, der indeholder nederste kvartil (sørg for at sætte et $-tegn før bogstavet og tallet), $C$19 med cellen, der indeholder din øvre kvartil, og $C$20 med cellen, der indeholder din interkvartil rækkevidde:
=HVIS(C3$C$19+1,5*$C$20,"Outlier",""))
- Hvis dit første datapunkt er en outlier, vil din formel returnere teksten outlier. Ellers vil det være tomt.
- For at anvende formlen på de andre celler i dine data skal du klikke og holde trækhåndtaget i nederste hjørne af cellen.
- Træk ned over de celler, hvor du vil anvende formlen.
- Giv slip, og din formel vil blive kopieret og vil beregne. Du kan nu tydeligt se alle værdier, der er afvigende.
Sådan fjerner du en outlier i Google Sheets
Du ved nu, hvordan man finder udliggere, men hvad med at fjerne dem?
Det kan vi gøre ved hjælp af en simpel HVIS formel, der fjerner data fra alle celler, der er angivet som outliers, men returnerer den oprindelige værdi for alle, der ikke er det.
Sådan fjerner du outliers i Google Sheets:
- Følg trinene i afsnittet ovenfor for at bestemme, hvilke værdier der er afvigende værdier.
- Vælg cellen to kolonner langs fra dit øverste datapunkt.
- Indtast følgende formel, og erstat C3 med positionen for din øverste celle og D3 med positionen af cellen til højre:
=IF(D3="Outlier","",C3)
- Trykke Gå ind. Hvis den øverste celle er en outlier, vil formlen returnere et tomt felt. Ellers returnerer det værdien af din øverste celle.
- For at anvende formlen på resten af dine celler skal du klikke og holde trækhåndtaget i nederste hjørne af cellen.
- Træk ned over de celler, hvor du vil anvende formlen.
- Når du slipper musen, kopieres formlen, og Google Sheets beregner slutresultatet. Alle værdier, der er angivet som outliers, vil blive fjernet.
Manipulering af data i Google Sheets
At lære, hvordan du fjerner afvigelser i Google Sheets, sikrer, at dine data ikke bliver skævvridet af værdier, der ligger væsentligt uden for rækkevidden af størstedelen af dine data. I nogle tilfælde kan dette have stor betydning for den statistik, som du bruger til at analysere dine data.
At vide, hvordan du fjerner disse værdier, giver dig mulighed for at slippe af med dem, hvis du ønsker det, eller inkludere dem, hvis du vil analysere hele datasættet. Du kan endda prøve begge dele og sammenligne resultaterne.
Google Sheets er fantastisk til statistisk analyse, men det kan meget, meget mere. Du kan samarbejde med andre brugere, når du opretter et Google Sheets-dokument og endda kommentere og reagere på deres arbejde. Du kan indsæt Google Sheets-tabeller i dine Google Dokumenter, og du kan endda oprette QR-koder i Google Sheets.