Visualizing Starwars characters

Author

Matilde Trevisani

  1. Dai uno sguardo al dataframe starwars.
glimpse(starwars)
Rows: 87
Columns: 14
$ name       <chr> "Luke Skywalker", "C-3PO", "R2-D2", "Darth Vader", "Leia Or…
$ height     <int> 172, 167, 96, 202, 150, 178, 165, 97, 183, 182, 188, 180, 2…
$ mass       <dbl> 77.0, 75.0, 32.0, 136.0, 49.0, 120.0, 75.0, 32.0, 84.0, 77.…
$ hair_color <chr> "blond", NA, NA, "none", "brown", "brown, grey", "brown", N…
$ skin_color <chr> "fair", "gold", "white, blue", "white", "light", "light", "…
$ eye_color  <chr> "blue", "yellow", "red", "yellow", "brown", "blue", "blue",…
$ birth_year <dbl> 19.0, 112.0, 33.0, 41.9, 19.0, 52.0, 47.0, NA, 24.0, 57.0, …
$ sex        <chr> "male", "none", "none", "male", "female", "male", "female",…
$ gender     <chr> "masculine", "masculine", "masculine", "masculine", "femini…
$ homeworld  <chr> "Tatooine", "Tatooine", "Naboo", "Tatooine", "Alderaan", "T…
$ species    <chr> "Human", "Droid", "Droid", "Human", "Human", "Human", "Huma…
$ films      <list> <"The Empire Strikes Back", "Revenge of the Sith", "Return…
$ vehicles   <list> <"Snowspeeder", "Imperial Speeder Bike">, <>, <>, <>, "Imp…
$ starships  <list> <"X-wing", "Imperial shuttle">, <>, <>, "TIE Advanced x1",…
  1. Esplora la relazione tra peso e altezza evidenziando l’eventuale impatto del sesso (sex) e / o del genere (gender) sulla distribuzione.
ggplot(starwars, 
       aes(x = height, y = mass, color = sex, shape = gender)) +
  geom_point()

La leggibilità del grafico è scarsa. Perchè ? Come possiamo migliorarla ?

Ha senso mantenere la distinzione tra sesso e genere nei dati alla mano ?

  1. Modifica il grafico sopra cambiando il colore di tutti i punti in “rosa” (e mantenendo solo la visibilità dei fattori potenzialmente interessanti).
ggplot(___, 
       aes(x = height, y = mass, shape = gender)) +
  geom_point(col = "pink3")
  1. Aggiungi le labels per title, assi x e y, ed eventuali altre estetiche.
ggplot(___, 
       aes(x = height, y = mass, shape = gender)) +
  geom_point(color = "pink3") +
  labs(
    #title = "___",
    #x = "___", 
    #y = "___",
    #___
    )
  1. Seleziona una singola variabile numerica e fai un istogramma fissando opportunamente l’ampiezza dei rettangoli (binwidth).
ggplot(starwars, aes(___)) +
  geom___
  1. Seleziona una variabile numerica e una variabile categoriale e visualizza la loro relazione (scegli tu come!). Dai anche un’interpretazione di ciò che vedi.
  1. Seleziona una singola variabile categoriale e fai un barplot della sua distribuzione.
  1. Seleziona due variabili categoriali e visualizzane la relazione. Dai anche un’interpretazione di ciò che vedi.
  1. Seleziona due variabili numeriche e due variabili categoriali e produci una visualizzazione che incorpori tutte e quattro le variabili. Fornisci una domanda e un’interpretazione dei risultati.