library(tidyverse)
<- tibble::tibble(
nyhetsbrev brevinnhold = c("ikke laks", "laks"),
antall = c(10, 26)
)
Hver ukedag får jeg et nyhetsbrev fra SSB hvor de gir et overblikk over de siste sakene de har publisert, statistikken der har produsert og rapportene de har rapportert. Siden rundt årsskiftet 2023 syns jeg å ha merka en markant endring i innholdet til disse nyhetsbreva. Det var noe som dukka opp til stadighet. Det var …
Nei, ikke torsken. Men laksen! Nesten daglig kunne vi lese om laksepriser, lakseeksport, lakseskatt, og så videre.
Så er det jo slik at vi mennesker er feilbarlig. Kanskje jeg bare innbiller meg at jeg ser laks hver dag. Her må vi gå vitenskapelig til verks.
Vitenskapelig i dette tilfelle vil si at jeg tok et utvalg av alle nyhetsbrev publisert fra 1. januar 2023 og fram til i dag. Disse tok jeg et kjapt søk gjennom for å finne ut hvor mange av dem som inneholdt ordet “laks”. Resultatet finner du her:
Ideelt sett skulle datasett ha blitt til ved en automatisk gjennomsøk av alle nyhetsbrev som kom til innboksen min. Men av en eller annen grunn syns ikke ITs sikkerhetsavdeling det var en smart idé å la et amerikansk selskaps programvare få fri tilgang til e-posten min. Så det blir med denne manuelle opptellinga.
Vi sender resultatet videre til ggplot. Som et hvert grafproduserende verktøy med sjølrespekt nekter ggplot å produsere kakediagram. Derfor tyr vi til en omvei via to andre diagrammer etter inspirasjon fra Yan Holtz.
Hvor stor andel av SSBs nyhetsbrev inneholder laks?
library(ggplot2)
ggplot(nyhetsbrev, aes(x = "", y = antall, fill = brevinnhold)) +
geom_bar(stat = "identity", width = 1, colour = "white") +
coord_polar("y", start = 0) +
theme_void() +
labs(title = "Analyse av lakseinnhold hos SSBs nyhetsbrev",
subtitle = paste("Analysert i perioden 2023-01-01 til 2023-02-24"),
caption = paste("Antall brev som inneholder laks:",
filter(nyhetsbrev, brevinnhold == "laks")$antall,
"— og antall brev som ikke inneholder laks: ",
filter(nyhetsbrev, brevinnhold == "ikke laks")$antall)) +
theme(plot.background = element_rect(fill = "white", colour = "white"))
En ganske stor andel, altså.