1 Goals for Lab 02

Review dplyr functions
Practice using dplyr functions to get to know a new dataset
Map global plot aesthetics to variables in ggplot2
Create facetted plots with ggplot2

2 Slides for today

knitr::include_url("slides/02-slides.html")

3 Inspiration + data

We’ll use data from the Museum of Modern Art (MoMA)

Publicly available on GitHub
As analyzed by fivethirtyeight.com
And by others

4 Packages needed

library(here) # to set file path if working from local file
library(tidyverse) # readr, ggplot2, dplyr
library(dplyr) # just to make sure that dplyr's summarise, count, etc. "win"

5 Read in the data

Note! This is not the original data- We did a lot of cleaning and decision-making in the pre-processing, and stored the result in data/artworks-cleaned.csv. The below contains only paintings and drawings in the MoMA collection.

The finished data set is available at here, and is also present locally in the Posit Cloud project:

library(here)
library(readr)
moma <- read_csv(here::here("data", "artworks-cleaned.csv"))

6 Know your data

Challenge #1:

Try to answer all of these questions using dplyr. Answers are below but try them on your own first!

How many paintings (rows) are in moma? How many variables (columns) are in moma?
What is the first painting acquired by MoMA? Which year? Which artist? What title?
What is the oldest painting in the collection? Which year? Which artist? What title?
How many distinct artists are there?
Which artist has the most paintings in the collection? How many paintings are by this artist?
How many paintings by male vs female artists?

If you want more:

How many artists of each gender are there?
In what year were the most paintings acquired? Created?
In what year was the first painting by a (solo) female artist acquired? When was that painting created? Which artist? What title?

6.1 How many paintings?

How many rows/observations are in moma?
How many variables are in moma?

Hint: These questions can be answered using the dplyr function glimpse.

library(dplyr)
moma

# A tibble: 2,253 × 23
   title  artist artis…¹ artis…² artis…³ num_a…⁴ n_fem…⁵ n_mal…⁶ artis…⁷ year_…⁸
   <chr>  <chr>  <chr>     <dbl>   <dbl>   <dbl>   <dbl>   <dbl> <chr>     <dbl>
 1 "Rope… Joan … (Spani…    1893    1983       1       0       1 Male       1936
 2 "Fire… Paul … (Germa…    1879    1940       1       0       1 Male       1970
 3 "Port… Paul … (Germa…    1879    1940       1       0       1 Male       1966
 4 "Guit… Pablo… (Spani…    1881    1973       1       0       1 Male       1955
 5 "Gran… Arthu… (Ameri…    1880    1946       1       0       1 Male       1939
 6 "\"M'… Franc… (Frenc…    1879    1953       1       0       1 Male       1968
 7 "Unti… Blink… (Germa…    1943    1977       1       0       1 Male       1997
 8 "Dayl… Pierr… (Frenc…    1880    1950       1       0       1 Male       1931
 9 "The … Paul … (Frenc…    1839    1906       1       0       1 Male       1934
10 "Synt… Enric… (Itali…    1894    1956       1       0       1 Male       1941
# … with 2,243 more rows, 13 more variables: year_created <dbl>,
#   circumference_cm <lgl>, depth_cm <dbl>, diameter_cm <lgl>, height_cm <dbl>,
#   length_cm <lgl>, width_cm <dbl>, seat_height_cm <lgl>, purchase <lgl>,
#   gift <lgl>, exchange <lgl>, classification <chr>, department <chr>, and
#   abbreviated variable names ¹artist_bio, ²artist_birth_year,
#   ³artist_death_year, ⁴num_artists, ⁵n_female_artists, ⁶n_male_artists,
#   ⁷artist_gender, ⁸year_acquired

glimpse(moma)

Rows: 2,253
Columns: 23
$ title             <chr> "Rope and People, I", "Fire in the Evening", "Portra…
$ artist            <chr> "Joan Miró", "Paul Klee", "Paul Klee", "Pablo Picass…
$ artist_bio        <chr> "(Spanish, 1893–1983)", "(German, born Switzerland. …
$ artist_birth_year <dbl> 1893, 1879, 1879, 1881, 1880, 1879, 1943, 1880, 1839…
$ artist_death_year <dbl> 1983, 1940, 1940, 1973, 1946, 1953, 1977, 1950, 1906…
$ num_artists       <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1…
$ n_female_artists  <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
$ n_male_artists    <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1…
$ artist_gender     <chr> "Male", "Male", "Male", "Male", "Male", "Male", "Mal…
$ year_acquired     <dbl> 1936, 1970, 1966, 1955, 1939, 1968, 1997, 1931, 1934…
$ year_created      <dbl> 1935, 1929, 1927, 1919, 1925, 1919, 1970, 1929, 1885…
$ circumference_cm  <lgl> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, …
$ depth_cm          <dbl> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, …
$ diameter_cm       <lgl> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, …
$ height_cm         <dbl> 104.8, 33.8, 60.3, 215.9, 50.8, 129.2, 200.0, 54.6, …
$ length_cm         <lgl> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, …
$ width_cm          <dbl> 74.6, 33.3, 36.8, 78.7, 54.0, 89.9, 200.0, 38.1, 96.…
$ seat_height_cm    <lgl> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, …
$ purchase          <lgl> FALSE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE, FAL…
$ gift              <lgl> TRUE, FALSE, FALSE, TRUE, TRUE, FALSE, TRUE, TRUE, F…
$ exchange          <lgl> FALSE, FALSE, FALSE, FALSE, TRUE, FALSE, FALSE, FALS…
$ classification    <chr> "Painting", "Painting", "Painting", "Painting", "Pai…
$ department        <chr> "Painting & Sculpture", "Painting & Sculpture", "Pai…

There are 2253 paintings in moma.

6.2 What is the first painting acquired?

What is the first painting acquired by MoMA (since they started tracking)?
What year was it acquired?
Which artist?
What title?

Hint: These questions can be answered by combining two dplyr functions: select and arrange.

moma %>% 
  select(artist, title, year_acquired) %>% 
  arrange(year_acquired)

# A tibble: 2,253 × 3
   artist            title                                               year_…¹
   <chr>             <chr>                                                 <dbl>
 1 Edward Hopper     House by the Railroad                                  1930
 2 Bernard Karfiol   Seated Nude                                            1930
 3 Pierre Roy        Daylight Savings Time                                  1931
 4 Preston Dickinson Plums on a Plate                                       1931
 5 Otto Dix          Dr. Mayer-Hermann                                      1932
 6 Paul Cézanne      The Bather                                             1934
 7 Paul Cézanne      Pines and Rocks (Fontainebleau?)                       1934
 8 Paul Cézanne      Still Life with Ginger Jar, Sugar Bowl, and Oranges    1934
 9 Paul Cézanne      Still Life with Apples                                 1934
10 Arthur B. Davies  Italian Landscape                                      1934
# … with 2,243 more rows, and abbreviated variable name ¹year_acquired

6.3 What is the oldest painting in the MoMA collection?

What is the oldest painting in the MoMA collection historically (since they started tracking)?
What year was it created?
Which artist?
What title?

Hint: These questions can be answered by combining two dplyr functions: select and arrange.

moma %>% 
  select(artist, title, year_created) %>% 
  arrange(year_created)

# A tibble: 2,253 × 3
   artist       title                                    year_created
   <chr>        <chr>                                           <dbl>
 1 Odilon Redon Landscape at Daybreak                            1872
 2 Odilon Redon Apache (Man on Horseback)                        1875
 3 Odilon Redon Apache (Man on Horseback II)                     1875
 4 Odilon Redon Fishing Boat                                     1875
 5 Odilon Redon Rocky Peak                                       1875
 6 Odilon Redon The Rocky Slope                                  1875
 7 Odilon Redon Landscape with Rocks, near Royan                 1875
 8 Paul Cézanne Still Life with Fruit Dish                       1879
 9 Paul Cézanne L'Estaque                                        1879
10 Claude Monet On the Cliff at Pourville, Clear Weather         1882
# … with 2,243 more rows

To do inline comments, I could say that the oldest painting is Landscape at Daybreak, painted by Odilon Redon in 1872.

6.4 How many artists?

How many distinct artists are there?

Hint: Try dplyr::distinct.

moma %>% 
  distinct(artist)

# A tibble: 989 × 1
   artist           
   <chr>            
 1 Joan Miró        
 2 Paul Klee        
 3 Pablo Picasso    
 4 Arthur Dove      
 5 Francis Picabia  
 6 Blinky Palermo   
 7 Pierre Roy       
 8 Paul Cézanne     
 9 Enrico Prampolini
10 Jankel Adler     
# … with 979 more rows

You could add a tally() too to get just the number of rows. You can also then use pull() to get that single number out of the tibble:

num_artists <- moma %>% 
  distinct(artist) %>% 
  tally() %>% 
  pull()
num_artists

[1] 989

Then I can refer to this number in inline comments like: there are 989 total.

6.5 Which artist has the most paintings?

Which artist has the most paintings ever owned by moma?
How many paintings in the MoMA collection by that artist?

Hint: Try dplyr::count. Use ?count to figure out how to sort the output.

moma %>% 
  count(artist, sort = TRUE)

# A tibble: 989 × 2
   artist               n
   <chr>            <int>
 1 Pablo Picasso       55
 2 Henri Matisse       32
 3 On Kawara           32
 4 Jacob Lawrence      30
 5 Batiste Madalena    25
 6 Jean Dubuffet       25
 7 Odilon Redon        25
 8 Ben Vautier         24
 9 Frank Stella        23
10 Philip Guston       23
# … with 979 more rows

In the ?count documentation, it says: “count and tally are designed so that you can call them repeatedly, each time rolling up a level of detail.” Try running count() again (leave parentheses empty) on your last code chunk.

moma %>% 
  count(artist, sort = TRUE) %>% 
  count()

# A tibble: 1 × 1
      n
  <int>
1   989

6.6 How many paintings by male vs female artists?

moma %>% 
  count(artist_gender)

# A tibble: 3 × 2
  artist_gender     n
  <chr>         <int>
1 Female          252
2 Male           1991
3 <NA>             10

Now together we’ll count the number of artists by gender. You’ll need to give count two variable names in the parentheses: artist_gender and artist.

moma %>% 
  count(artist_gender, artist, sort = TRUE)

# A tibble: 989 × 3
   artist_gender artist               n
   <chr>         <chr>            <int>
 1 Male          Pablo Picasso       55
 2 Male          Henri Matisse       32
 3 Male          On Kawara           32
 4 Male          Jacob Lawrence      30
 5 Male          Batiste Madalena    25
 6 Male          Jean Dubuffet       25
 7 Male          Odilon Redon        25
 8 Male          Ben Vautier         24
 9 Male          Frank Stella        23
10 Male          Philip Guston       23
# … with 979 more rows

This output is not superhelpful as we already know that Pablo Picasso has 55 paintings in the MoMA collection. But how can we find out which female artist has the most paintings? We have a few options. Let’s first add a filter for females.

moma %>% 
  count(artist_gender, artist, sort = TRUE) %>% 
  filter(artist_gender == "Female")

# A tibble: 143 × 3
   artist_gender artist                    n
   <chr>         <chr>                 <int>
 1 Female        Sherrie Levine           12
 2 Female        Agnes Martin              9
 3 Female        Elizabeth Murray          8
 4 Female        Susan Rothenberg          8
 5 Female        Joan Mitchell             6
 6 Female        Loren MacIver             6
 7 Female        R. H. Quaytman            6
 8 Female        Helen Frankenthaler       5
 9 Female        Georgia O'Keeffe          4
10 Female        Lynette Yiadom-Boakye     4
# … with 133 more rows

Another option is to use another dplyr function called top_n(). Use ?top_n to see how it works. How it won’t work in this context:

moma %>% 
  count(artist_gender, artist, sort = TRUE) %>% 
  top_n(2)

# A tibble: 3 × 3
  artist_gender artist            n
  <chr>         <chr>         <int>
1 Male          Pablo Picasso    55
2 Male          Henri Matisse    32
3 Male          On Kawara        32

How it will work better is following a group_by(artist_gender):

moma %>% 
  count(artist_gender, artist, sort = TRUE) %>% 
  group_by(artist_gender) %>% 
  top_n(1)

# A tibble: 3 × 3
# Groups:   artist_gender [3]
  artist_gender artist                                                 n
  <chr>         <chr>                                              <int>
1 Male          Pablo Picasso                                         55
2 Female        Sherrie Levine                                        12
3 <NA>          Gilbert & George, Gilbert Proesch, George Passmore     2

Now we can see that Sherrie Levine has 12 paintings. This is a pretty far cry from the 55 paintings by Pablo Picasso.

6.7 How many artists of each gender are there?

This is a harder question to answer than you think! This is because the level of observation in our current moma dataset is unique paintings. We have multiple paintings done by the same artists though, so counting just the number of unique paintings is different than counting the number of unique artists.

Remember how count can be used back-to-back to roll up a level of detail? Try running count(artist_gender) again on your last code chunk.

moma %>% 
  count(artist_gender, artist) %>% 
  count(artist_gender)

# A tibble: 3 × 2
  artist_gender     n
  <chr>         <int>
1 Female          143
2 Male            837
3 <NA>              9

This output takes the previous table (made with count(artist_gender, artist)), and essentially ignores the n column. So we no longer care about how many paintings each individual artist created. Instead, we want to count the rows in this new table where each row is a unique artist. By counting by artist_gender in the last line, we are grouping by levels of that variable (so Female/Male/NA) and nn is the number of unique artists for each gender category recorded.

6.8 When were the most paintings in the collection acquired?

Hint: Try dplyr::count. Use ?count to figure out how to sort the output.

moma %>% 
  count(year_acquired, sort = TRUE)

# A tibble: 88 × 2
   year_acquired     n
           <dbl> <int>
 1          1985    86
 2          1942    71
 3          1979    71
 4          1991    67
 5          2005    67
 6          1967    65
 7          2008    55
 8          1961    45
 9          1969    45
10          1956    42
# … with 78 more rows

6.9 When were the most paintings in the collection created?

Hint: Try dplyr::count. Use ?count to figure out how to sort the output.

moma %>% 
  count(year_created, sort = TRUE)

# A tibble: 139 × 2
   year_created     n
          <dbl> <int>
 1         1977    57
 2         1940    56
 3         1964    56
 4         1961    50
 5         1962    49
 6         1963    44
 7         1959    42
 8         1968    40
 9         1960    39
10         1914    37
# … with 129 more rows

6.10 What about the first painting by a solo female artist?

Hint: Try combining three dplyr functions: filter, select, and arrange.

When was the first painting by a solo female artist acquired?

moma %>% 
  filter(num_artists == 1 & n_female_artists == 1) %>% 
  select(title, artist, year_acquired, year_created) %>% 
  arrange(year_acquired)

# A tibble: 252 × 4
   title                           artist                  year_acquired year_…¹
   <chr>                           <chr>                           <dbl>   <dbl>
 1 Landscape, 47                   Natalia Goncharova               1937    1912
 2 Shack                           Loren MacIver                    1938    1934
 3 Hopscotch                       Loren MacIver                    1940    1940
 4 Shadows with Painting           Irene Rice Pereira               1941    1940
 5 Figure                          Varvara Stepanova                1941    1921
 6 Still Life in Red               Amelia Peláez Del Casal          1942    1938
 7 White Lines                     Irene Rice Pereira               1942    1942
 8 Musical Squash                  Maud Morgan                      1942    1942
 9 Desolation                      Raquel Forner                    1942    1942
10 Self-Portrait with Cropped Hair Frida Kahlo                      1943    1940
# … with 242 more rows, and abbreviated variable name ¹year_created

What is the oldest painting by a solo female artist, and when was it created?

moma %>% 
  filter(num_artists == 1 & n_female_artists == 1) %>% 
  select(title, artist, year_acquired, year_created) %>% 
  arrange(year_created)

# A tibble: 252 × 4
   title                                                  artist year_…¹ year_…²
   <chr>                                                  <chr>    <dbl>   <dbl>
 1 Self-Portrait with Two Flowers in Her Raised Left Hand Paula…    2017    1907
 2 Girl with Bare Shoulders                               Gwen …    1958    1909
 3 Girl Reading at a Window                               Gwen …    1971    1911
 4 Landscape, 47                                          Natal…    1937    1912
 5 Cubist Nude                                            Alexa…    1991    1912
 6 Rayonism, Blue-Green Forest                            Natal…    1985    1913
 7 The Factory and the Bridge                             Olga …    1985    1913
 8 Subject from a Dyer's Shop                             Lyubo…    1985    1914
 9 Portuguese Market                                      Sonia…    1955    1915
10 Girl with a Blue Scarf                                 Gwen …    1963    1915
# … with 242 more rows, and abbreviated variable names ¹year_acquired,
#   ²year_created

# or, because artist_gender is missing when num_artists > 1
moma %>% 
  filter(artist_gender == "Female") %>% 
  select(title, artist, year_acquired, year_created) %>% 
  arrange(year_acquired)

7 Basics of `ggplot2`

Challenge #2:

We’ll do this together (nothing to turn in): see slides.

8 Plot your data

8.1 Plot year painted vs year acquired

Challenge #3:

Let’s recreate this plot from fivethirtyeight (mostly)!

Things to consider:

You’ll want to play around with setting an alpha value here- keep in mind that 0 is totally transparent and 1 is opaque.
Try using geom_abline() to add the line in red (use the default intercept value of 0). The actual red line is difficult to recreate- here is what the authors say: “The red regression line shows the “modernizing” of MoMA’s collection — how quickly the museum has moved toward acquiring recent paintings.”
Go back to Lab 01 to review how to do the following:
- Change the x- and y-axis labels and the plot title to match the plot above

ggplot(moma, aes(year_created, year_acquired)) +
  geom_point(alpha = .1, na.rm = TRUE) +
  geom_abline(intercept = c(0,0), colour = "red") +
  labs(x = "Year Painted", y = "Year Acquired") +
  ggtitle("MoMA Keeps Its Collection Current")

8.2 Facet by artist gender

Can you make the same plot above, but facet by artist gender?

Hint: For this to make sense, you probably want to do some filtering to select only those paintings where there was one “solo” artist.

moma_solo <- moma %>% 
  filter(num_artists == 1)
ggplot(moma_solo, aes(year_created, year_acquired)) +
  geom_point(alpha = .1) +
  geom_abline(intercept = c(0,0), colour = "red") +
  labs(x = "Year Painted", y = "Year Acquired") +
  ggtitle("MoMA Keeps Its Collection Current") +
  facet_wrap(~artist_gender)

9 Plot painting dimensions

Challenge #4:

Let’s (somewhat) try to recreate this scatterplot from fivethirtyeight.

To recreate, some things to consider:

Try filtering all paintings with height less than 600 cm and width less than 760 cm.
If you want to add color as in the original, you’ll need to create a new variable using mutate.

Hint: You’ll probably also want to look into case_when to create a categorical variable to color by.

moma_dim <- moma %>% 
  filter(height_cm < 600, width_cm < 760) %>% 
  mutate(hw_ratio = height_cm / width_cm,
         hw_cat = case_when(
           hw_ratio > 1 ~ "taller than wide",
           hw_ratio < 1 ~ "wider than tall",
           hw_ratio == 1 ~ "perfect square"
         ))
library(ggthemes)
ggplot(moma_dim, aes(x = width_cm, y = height_cm, colour = hw_cat)) +
  geom_point(alpha = .5) +
  ggtitle("MoMA Paintings, Tall and Wide") +
  scale_colour_manual(name = "",
                      values = c("gray50", "#FF9900", "#B14CF0")) +
  theme_fivethirtyeight() +
  theme(axis.title = element_text()) +
  labs(x = "Width", y = "Height")

Those colors are intense! Would different ones work better?

library(ggthemes)
ggplot(moma_dim, aes(x = width_cm, y = height_cm, colour = hw_cat)) +
  geom_point(alpha = .5) +
  ggtitle("MoMA Paintings, Tall and Wide") +
  scale_colour_manual(name = "",
                      values = c("gray50", "#ee5863", "#6999cd")) +
  theme_fivethirtyeight() +
  theme(axis.title = element_text()) +
  labs(x = "Width", y = "Height")

We could also do away with the legend and use geom_annotate instead.

library(ggthemes)
ggplot(moma_dim, aes(x = width_cm, y = height_cm, colour = hw_cat)) +
  geom_point(alpha = .5, show.legend = FALSE) +
  ggtitle("MoMA Paintings, Tall and Wide") +
  scale_colour_manual(name = "",
                      values = c("gray50", "#ee5863", "#6999cd")) +
  theme_fivethirtyeight() +
  theme(axis.title = element_text()) +
  labs(x = "Width", y = "Height") +
  annotate(x = 200, y = 380, geom = "text", 
           label = "Taller than\nWide", color = "#ee5863", 
           size = 5, family = "Lato", hjust = 1, fontface = 2) +
    annotate(x = 375, y = 100, geom = "text", 
             label = "Wider than\nTall", color = "#6999cd", 
             size = 5, family = "Lato", hjust = 0, fontface = 2)

10 Plot something new & different!

Challenge #5:

It can be anything- you can change colors, add annotations, switch the geoms, add new variables to examine- the world is your oyster! The only requirements are:

You make one new plot that is original, and
You write 1-2 sentences to present the plot and why it makes sense. What questions do you think your plot can help you to answer?

It does not have to be pretty right now, but it must make sense as a visualization- you must be able to intelligently and succintly tell us about it in real words.

LS0tCnRpdGxlOiAnTGFiIDAyOiBNb01BIE11c2V1bSBUb3VyJwphdXRob3I6ICJBbGlzb24gSGlsbCwgd2l0aCAoc2xpZ2h0KSBtb2RpZmljYXRpb25zIGJ5IFN0ZXZlbiBCZWRyaWNrIgpzdWJ0aXRsZTogQk1JIDUvNjI1Cm91dHB1dDoKICAjIHBkZl9kb2N1bWVudDoKICAjICAgdG9jOiB5ZXMKICAjICAgdG9jX2RlcHRoOiAnMicKICBodG1sX2RvY3VtZW50OgogICAgdGhlbWU6IGZsYXRseQogICAgdG9jOiB5ZXMKICAgIHRvY19mbG9hdDogeWVzCiAgICB0b2NfZGVwdGg6IDIKICAgIG51bWJlcl9zZWN0aW9uczogeWVzCiAgICBjb2RlX2ZvbGRpbmc6IGhpZGUKICAgIGNvZGVfZG93bmxvYWQ6IHllcwotLS0KYGBge3Igc2V0dXAsIGluY2x1ZGUgPSBGQUxTRSwgY2FjaGUgPSBGQUxTRX0Ka25pdHI6Om9wdHNfY2h1bmskc2V0KGVycm9yID0gVFJVRSwgY29tbWVudCA9IE5BLCB3YXJuaW5nID0gRkFMU0UsIGVycm9ycyA9IEZBTFNFLCBtZXNzYWdlID0gRkFMU0UsIHRpZHkgPSBGQUxTRSwgY2FjaGUgPSBGQUxTRSkKYGBgCgojIEdvYWxzIGZvciBMYWIgMDIKCi0gUmV2aWV3IGBkcGx5cmAgZnVuY3Rpb25zIAotIFByYWN0aWNlIHVzaW5nIGBkcGx5cmAgZnVuY3Rpb25zIHRvIGdldCB0byBrbm93IGEgbmV3IGRhdGFzZXQKLSBNYXAgZ2xvYmFsIHBsb3QgYWVzdGhldGljcyB0byB2YXJpYWJsZXMgaW4gYGdncGxvdDJgCi0gQ3JlYXRlIGZhY2V0dGVkIHBsb3RzIHdpdGggYGdncGxvdDJgCgojIFNsaWRlcyBmb3IgdG9kYXkKCmBgYHtyfQprbml0cjo6aW5jbHVkZV91cmwoInNsaWRlcy8wMi1zbGlkZXMuaHRtbCIpCmBgYAoKCgoKIyBJbnNwaXJhdGlvbiArIGRhdGEKCldlJ2xsIHVzZSBkYXRhIGZyb20gdGhlIE11c2V1bSBvZiBNb2Rlcm4gQXJ0IChNb01BKQoKLSBQdWJsaWNseSBhdmFpbGFibGUgb24gW0dpdEh1Yl0oaHR0cHM6Ly9naXRodWIuY29tL011c2V1bW9mTW9kZXJuQXJ0L2NvbGxlY3Rpb24pCi0gQXMgYW5hbHl6ZWQgYnkgW2ZpdmV0aGlydHllaWdodC5jb21dKGh0dHBzOi8vZml2ZXRoaXJ0eWVpZ2h0LmNvbS9mZWF0dXJlcy9hLW5lcmRzLWd1aWRlLXRvLXRoZS0yMjI5LXBhaW50aW5ncy1hdC1tb21hLykKLSBBbmQgYnkgW290aGVyc10oaHR0cHM6Ly9tZWRpdW0uY29tL0Bmb2UvaGVyZS1zLWEtcm91bmR1cC1vZi1ob3ctcGVvcGxlLWhhdmUtdXNlZC1vdXItZGF0YS1zby1mYXItODA4NjJlNGNlMjIwKQoKIyBQYWNrYWdlcyBuZWVkZWQKCmBgYHtyfQpsaWJyYXJ5KGhlcmUpICMgdG8gc2V0IGZpbGUgcGF0aCBpZiB3b3JraW5nIGZyb20gbG9jYWwgZmlsZQpsaWJyYXJ5KHRpZHl2ZXJzZSkgIyByZWFkciwgZ2dwbG90MiwgZHBseXIKbGlicmFyeShkcGx5cikgIyBqdXN0IHRvIG1ha2Ugc3VyZSB0aGF0IGRwbHlyJ3Mgc3VtbWFyaXNlLCBjb3VudCwgZXRjLiAid2luIgpgYGAKCgojIFJlYWQgaW4gdGhlIGRhdGEKCk5vdGUhIFRoaXMgaXMgbm90IHRoZSBvcmlnaW5hbCBkYXRhLSBXZSBkaWQgYSBsb3Qgb2YgY2xlYW5pbmcgYW5kIGRlY2lzaW9uLW1ha2luZyBpbiB0aGUgcHJlLXByb2Nlc3NpbmcsIGFuZCBzdG9yZWQgdGhlIHJlc3VsdCBpbiBgZGF0YS9hcnR3b3Jrcy1jbGVhbmVkLmNzdmAuIFRoZSBiZWxvdyBjb250YWlucyBvbmx5IHBhaW50aW5ncyBhbmQgZHJhd2luZ3MgaW4gdGhlIE1vTUEgY29sbGVjdGlvbi4KClRoZSBmaW5pc2hlZCBkYXRhIHNldCBpcyBhdmFpbGFibGUgYXQgW2hlcmVdKGh0dHBzOi8vc3RldmVuYmVkcmljay5naXRodWIuaW8vZGF0YS12aXMtbGFicy0yMDIzL2RhdGEvYXJ0d29ya3MuY3N2KSwgYW5kIGlzIGFsc28gcHJlc2VudCBsb2NhbGx5IGluIHRoZSBQb3NpdCBDbG91ZCBwcm9qZWN0OgoKYGBge3IgZXZhbCA9IEZBTFNFfQpsaWJyYXJ5KGhlcmUpCmxpYnJhcnkocmVhZHIpCm1vbWEgPC0gcmVhZF9jc3YoaGVyZTo6aGVyZSgiZGF0YSIsICJhcnR3b3Jrcy1jbGVhbmVkLmNzdiIpKQpgYGAKCmBgYHtyIGVjaG89RkFMU0V9CmxpYnJhcnkoaGVyZSkKbGlicmFyeShyZWFkcikKbW9tYSA8LSByZWFkX2NzdihoZXJlOjpoZXJlKCJkYXRhIiwgImFydHdvcmtzLWNsZWFuZWQuY3N2IikpCmBgYAoKIyBLbm93IHlvdXIgZGF0YQoKPGRpdiBjbGFzcz0icGFuZWwgcGFuZWwtc3VjY2VzcyI+CiAgPGRpdiBjbGFzcz0icGFuZWwtaGVhZGluZyI+Q2hhbGxlbmdlICMxOjwvZGl2PgogIDxkaXYgY2xhc3M9InBhbmVsLWJvZHkiPgpUcnkgdG8gYW5zd2VyIGFsbCBvZiB0aGVzZSBxdWVzdGlvbnMgdXNpbmcgYGRwbHlyYC4gQW5zd2VycyBhcmUgYmVsb3cgYnV0IHRyeSB0aGVtIG9uIHlvdXIgb3duIGZpcnN0IQoKMS4gSG93IG1hbnkgcGFpbnRpbmdzIChyb3dzKSBhcmUgaW4gYG1vbWFgPyBIb3cgbWFueSB2YXJpYWJsZXMgKGNvbHVtbnMpIGFyZSBpbiBgbW9tYWA/CjEuIFdoYXQgaXMgdGhlIGZpcnN0IHBhaW50aW5nIGFjcXVpcmVkIGJ5IE1vTUE/IFdoaWNoIHllYXI/IFdoaWNoIGFydGlzdD8gV2hhdCB0aXRsZT8KMS4gV2hhdCBpcyB0aGUgb2xkZXN0IHBhaW50aW5nIGluIHRoZSBjb2xsZWN0aW9uPyBXaGljaCB5ZWFyPyBXaGljaCBhcnRpc3Q/IFdoYXQgdGl0bGU/CjEuIEhvdyBtYW55IGRpc3RpbmN0IGFydGlzdHMgYXJlIHRoZXJlPwoxLiBXaGljaCBhcnRpc3QgaGFzIHRoZSBtb3N0IHBhaW50aW5ncyBpbiB0aGUgY29sbGVjdGlvbj8gSG93IG1hbnkgcGFpbnRpbmdzIGFyZSBieSB0aGlzIGFydGlzdD8KMS4gSG93IG1hbnkgcGFpbnRpbmdzIGJ5IG1hbGUgdnMgZmVtYWxlIGFydGlzdHM/CgoKSWYgeW91IHdhbnQgbW9yZToKCjEuIEhvdyBtYW55IGFydGlzdHMgb2YgZWFjaCBnZW5kZXIgYXJlIHRoZXJlPwoxLiBJbiB3aGF0IHllYXIgd2VyZSB0aGUgbW9zdCBwYWludGluZ3MgYWNxdWlyZWQ/IENyZWF0ZWQ/CjEuIEluIHdoYXQgeWVhciB3YXMgdGhlIGZpcnN0IHBhaW50aW5nIGJ5IGEgKHNvbG8pIGZlbWFsZSBhcnRpc3QgYWNxdWlyZWQ/IFdoZW4gd2FzIHRoYXQgcGFpbnRpbmcgY3JlYXRlZD8gV2hpY2ggYXJ0aXN0PyBXaGF0IHRpdGxlPwogIDwvZGl2Pgo8L2Rpdj4KCiMjIEhvdyBtYW55IHBhaW50aW5ncz8KCi0gSG93IG1hbnkgcm93cy9vYnNlcnZhdGlvbnMgYXJlIGluIGBtb21hYD8KLSBIb3cgbWFueSB2YXJpYWJsZXMgYXJlIGluIGBtb21hYD8KCjxwIGNsYXNzPSJ0ZXh0LWluZm8iPiBfX0hpbnQ6X18gVGhlc2UgcXVlc3Rpb25zIGNhbiBiZSBhbnN3ZXJlZCB1c2luZyB0aGUgYGRwbHlyYCBmdW5jdGlvbiBgZ2xpbXBzZWAuPC9wPgoKCmBgYHtyfQpsaWJyYXJ5KGRwbHlyKQptb21hCmdsaW1wc2UobW9tYSkKYGBgCgpUaGVyZSBhcmUgYHIgbnJvdyhtb21hKWAgcGFpbnRpbmdzIGluIGBtb21hYC4KCiMjIFdoYXQgaXMgdGhlIGZpcnN0IHBhaW50aW5nIGFjcXVpcmVkPwoKCi0gV2hhdCBpcyB0aGUgZmlyc3QgcGFpbnRpbmcgYWNxdWlyZWQgYnkgTW9NQSAoc2luY2UgdGhleSBzdGFydGVkIHRyYWNraW5nKT8gCi0gV2hhdCB5ZWFyIHdhcyBpdCBhY3F1aXJlZD8KLSBXaGljaCBhcnRpc3Q/Ci0gV2hhdCB0aXRsZT8KCjxwIGNsYXNzPSJ0ZXh0LWluZm8iPiBfX0hpbnQ6X18gVGhlc2UgcXVlc3Rpb25zIGNhbiBiZSBhbnN3ZXJlZCBieSBjb21iaW5pbmcgdHdvIGBkcGx5cmAgZnVuY3Rpb25zOiBgc2VsZWN0YCBhbmQgYGFycmFuZ2VgLjwvcD4KCgpgYGB7cn0KbW9tYSAlPiUgCiAgc2VsZWN0KGFydGlzdCwgdGl0bGUsIHllYXJfYWNxdWlyZWQpICU+JSAKICBhcnJhbmdlKHllYXJfYWNxdWlyZWQpCmBgYAoKIyMgV2hhdCBpcyB0aGUgb2xkZXN0IHBhaW50aW5nIGluIHRoZSBNb01BIGNvbGxlY3Rpb24/CgoKLSBXaGF0IGlzIHRoZSBvbGRlc3QgcGFpbnRpbmcgaW4gdGhlIE1vTUEgY29sbGVjdGlvbiBoaXN0b3JpY2FsbHkgKHNpbmNlIHRoZXkgc3RhcnRlZCB0cmFja2luZyk/IAotIFdoYXQgeWVhciB3YXMgaXQgY3JlYXRlZD8KLSBXaGljaCBhcnRpc3Q/Ci0gV2hhdCB0aXRsZT8KCjxwIGNsYXNzPSJ0ZXh0LWluZm8iPiBfX0hpbnQ6X18gVGhlc2UgcXVlc3Rpb25zIGNhbiBiZSBhbnN3ZXJlZCBieSBjb21iaW5pbmcgdHdvIGBkcGx5cmAgZnVuY3Rpb25zOiBgc2VsZWN0YCBhbmQgYGFycmFuZ2VgLjwvcD4KCgoKYGBge3J9Cm1vbWEgJT4lIAogIHNlbGVjdChhcnRpc3QsIHRpdGxlLCB5ZWFyX2NyZWF0ZWQpICU+JSAKICBhcnJhbmdlKHllYXJfY3JlYXRlZCkKYGBgCgpgYGB7ciBpbmNsdWRlID0gRkFMU0V9Cm9sZGVzdCA8LSBtb21hICU+JSAKICBzZWxlY3QoYXJ0aXN0LCB0aXRsZSwgeWVhcl9jcmVhdGVkKSAlPiUgCiAgYXJyYW5nZSh5ZWFyX2NyZWF0ZWQpICU+JSAKICBzbGljZSgxKQpgYGAKClRvIGRvIGlubGluZSBjb21tZW50cywgSSBjb3VsZCBzYXkgdGhhdCB0aGUgb2xkZXN0IHBhaW50aW5nIGlzIGByIG9sZGVzdCAlPiUgcHVsbCh0aXRsZSlgLCBwYWludGVkIGJ5IGByIG9sZGVzdCAlPiUgcHVsbChhcnRpc3QpYCBpbiBgciBvbGRlc3QgJT4lIHB1bGwoeWVhcl9jcmVhdGVkKWAuCgojIyBIb3cgbWFueSBhcnRpc3RzPwoKLSBIb3cgbWFueSBkaXN0aW5jdCBhcnRpc3RzIGFyZSB0aGVyZT8KCjxwIGNsYXNzPSJ0ZXh0LWluZm8iPiBfX0hpbnQ6X18gVHJ5IGBkcGx5cjo6ZGlzdGluY3RgLjwvcD4KIAoKYGBge3J9Cm1vbWEgJT4lIAogIGRpc3RpbmN0KGFydGlzdCkKYGBgCgpZb3UgY291bGQgYWRkIGEgYHRhbGx5KClgIHRvbyB0byBnZXQganVzdCB0aGUgbnVtYmVyIG9mIHJvd3MuIFlvdSBjYW4gYWxzbyB0aGVuIHVzZSBgcHVsbCgpYCB0byBnZXQgdGhhdCBzaW5nbGUgbnVtYmVyIG91dCBvZiB0aGUgdGliYmxlOgoKYGBge3J9Cm51bV9hcnRpc3RzIDwtIG1vbWEgJT4lIAogIGRpc3RpbmN0KGFydGlzdCkgJT4lIAogIHRhbGx5KCkgJT4lIAogIHB1bGwoKQpudW1fYXJ0aXN0cwpgYGAKClRoZW4gSSBjYW4gcmVmZXIgdG8gdGhpcyBudW1iZXIgaW4gaW5saW5lIGNvbW1lbnRzIGxpa2U6IHRoZXJlIGFyZSBgciBudW1fYXJ0aXN0c2AgdG90YWwuCgojIyBXaGljaCBhcnRpc3QgaGFzIHRoZSBtb3N0IHBhaW50aW5ncz8KCi0gV2hpY2ggYXJ0aXN0IGhhcyB0aGUgbW9zdCBwYWludGluZ3MgZXZlciBvd25lZCBieSBgbW9tYWA/IAotIEhvdyBtYW55IHBhaW50aW5ncyBpbiB0aGUgTW9NQSBjb2xsZWN0aW9uIGJ5IHRoYXQgYXJ0aXN0PwoKPHAgY2xhc3M9InRleHQtaW5mbyI+IF9fSGludDpfXyBUcnkgYGRwbHlyOjpjb3VudGAuIFVzZSBgP2NvdW50YCB0byBmaWd1cmUgb3V0IGhvdyB0byBzb3J0IHRoZSBvdXRwdXQuPC9wPgoKCmBgYHtyfQptb21hICU+JSAKICBjb3VudChhcnRpc3QsIHNvcnQgPSBUUlVFKQpgYGAKCmBgYHtyIGluY2x1ZGUgPSBGQUxTRX0KcGFibG8gPC0gbW9tYSAlPiUgCiAgY291bnQoYXJ0aXN0LCBzb3J0ID0gVFJVRSkgJT4lIAogIHNsaWNlKDEpCmBgYAoKSW4gdGhlIGA/Y291bnRgIGRvY3VtZW50YXRpb24sIGl0IHNheXM6ICJgY291bnRgIGFuZCBgdGFsbHlgIGFyZSBkZXNpZ25lZCBzbyB0aGF0IHlvdSBjYW4gY2FsbCB0aGVtIHJlcGVhdGVkbHksIGVhY2ggdGltZSByb2xsaW5nIHVwIGEgbGV2ZWwgb2YgZGV0YWlsLiIgVHJ5IHJ1bm5pbmcgYGNvdW50KClgIGFnYWluIChsZWF2ZSBwYXJlbnRoZXNlcyBlbXB0eSkgb24geW91ciBsYXN0IGNvZGUgY2h1bmsuCgpgYGB7cn0KbW9tYSAlPiUgCiAgY291bnQoYXJ0aXN0LCBzb3J0ID0gVFJVRSkgJT4lIAogIGNvdW50KCkKYGBgCgojIyBIb3cgbWFueSBwYWludGluZ3MgYnkgbWFsZSB2cyBmZW1hbGUgYXJ0aXN0cz8KCgpgYGB7cn0KbW9tYSAlPiUgCiAgY291bnQoYXJ0aXN0X2dlbmRlcikKYGBgCgoKTm93IHRvZ2V0aGVyIHdlJ2xsIGNvdW50IHRoZSBudW1iZXIgb2YgYXJ0aXN0cyBieSBnZW5kZXIuIFlvdSdsbCBuZWVkIHRvIGdpdmUgYGNvdW50YCB0d28gdmFyaWFibGUgbmFtZXMgaW4gdGhlIHBhcmVudGhlc2VzOiBgYXJ0aXN0X2dlbmRlcmAgYW5kIGBhcnRpc3RgLgoKYGBge3J9Cm1vbWEgJT4lIAogIGNvdW50KGFydGlzdF9nZW5kZXIsIGFydGlzdCwgc29ydCA9IFRSVUUpIApgYGAKClRoaXMgb3V0cHV0IGlzIG5vdCBzdXBlcmhlbHBmdWwgYXMgd2UgYWxyZWFkeSBrbm93IHRoYXQgYHIgcGFibG8gJT4lIHB1bGwoYXJ0aXN0KWAgaGFzIGByIHBhYmxvICU+JSBwdWxsKG4pYCBwYWludGluZ3MgaW4gdGhlIE1vTUEgY29sbGVjdGlvbi4gQnV0IGhvdyBjYW4gd2UgZmluZCBvdXQgd2hpY2ggZmVtYWxlIGFydGlzdCBoYXMgdGhlIG1vc3QgcGFpbnRpbmdzPyBXZSBoYXZlIGEgZmV3IG9wdGlvbnMuIExldCdzIGZpcnN0IGFkZCBhIGBmaWx0ZXJgIGZvciBmZW1hbGVzLgoKYGBge3J9Cm1vbWEgJT4lIAogIGNvdW50KGFydGlzdF9nZW5kZXIsIGFydGlzdCwgc29ydCA9IFRSVUUpICU+JSAKICBmaWx0ZXIoYXJ0aXN0X2dlbmRlciA9PSAiRmVtYWxlIikKYGBgCgpBbm90aGVyIG9wdGlvbiBpcyB0byB1c2UgYW5vdGhlciBgZHBseXJgIGZ1bmN0aW9uIGNhbGxlZCBgdG9wX24oKWAuIFVzZSBgP3RvcF9uYCB0byBzZWUgaG93IGl0IHdvcmtzLiBIb3cgaXQgd29uJ3Qgd29yayBpbiB0aGlzIGNvbnRleHQ6CgpgYGB7cn0KbW9tYSAlPiUgCiAgY291bnQoYXJ0aXN0X2dlbmRlciwgYXJ0aXN0LCBzb3J0ID0gVFJVRSkgJT4lIAogIHRvcF9uKDIpCmBgYAoKSG93IGl0IHdpbGwgd29yayBiZXR0ZXIgaXMgZm9sbG93aW5nIGEgYGdyb3VwX2J5KGFydGlzdF9nZW5kZXIpYDoKCmBgYHtyfQptb21hICU+JSAKICBjb3VudChhcnRpc3RfZ2VuZGVyLCBhcnRpc3QsIHNvcnQgPSBUUlVFKSAlPiUgCiAgZ3JvdXBfYnkoYXJ0aXN0X2dlbmRlcikgJT4lIAogIHRvcF9uKDEpCmBgYAoKCmBgYHtyIGluY2x1ZGUgPSBGQUxTRX0Kc2hlcnJpZSA8LSBtb21hICU+JSAKICBjb3VudChhcnRpc3RfZ2VuZGVyLCBhcnRpc3QsIHNvcnQgPSBUUlVFKSAlPiUgCiAgZmlsdGVyKGFydGlzdF9nZW5kZXIgPT0gIkZlbWFsZSIpICU+JSAKICBzbGljZSgxKQpgYGAKCk5vdyB3ZSBjYW4gc2VlIHRoYXQgYHIgc2hlcnJpZSAlPiUgcHVsbChhcnRpc3QpYCBoYXMgYHIgc2hlcnJpZSAlPiUgcHVsbChuKWAgcGFpbnRpbmdzLiBUaGlzIGlzIGEgcHJldHR5IGZhciBjcnkgZnJvbSB0aGUgYHIgcGFibG8gJT4lIHB1bGwobilgIHBhaW50aW5ncyBieSBgciBwYWJsbyAlPiUgcHVsbChhcnRpc3QpYC4KCiMjIEhvdyBtYW55IGFydGlzdHMgb2YgZWFjaCBnZW5kZXIgYXJlIHRoZXJlPwoKVGhpcyBpcyBhIGhhcmRlciBxdWVzdGlvbiB0byBhbnN3ZXIgdGhhbiB5b3UgdGhpbmshIFRoaXMgaXMgYmVjYXVzZSB0aGUgbGV2ZWwgb2Ygb2JzZXJ2YXRpb24gaW4gb3VyIGN1cnJlbnQgYG1vbWFgIGRhdGFzZXQgaXMgKnVuaXF1ZSBwYWludGluZ3MqLiBXZSBoYXZlIG11bHRpcGxlIHBhaW50aW5ncyBkb25lIGJ5IHRoZSBzYW1lIGFydGlzdHMgdGhvdWdoLCBzbyBjb3VudGluZyBqdXN0IHRoZSBudW1iZXIgb2YgdW5pcXVlIHBhaW50aW5ncyBpcyBkaWZmZXJlbnQgdGhhbiBjb3VudGluZyB0aGUgbnVtYmVyIG9mIHVuaXF1ZSBhcnRpc3RzLiAKClJlbWVtYmVyIGhvdyBgY291bnRgIGNhbiBiZSB1c2VkIGJhY2stdG8tYmFjayB0byByb2xsIHVwIGEgbGV2ZWwgb2YgZGV0YWlsPyBUcnkgcnVubmluZyBgY291bnQoYXJ0aXN0X2dlbmRlcilgIGFnYWluIG9uIHlvdXIgbGFzdCBjb2RlIGNodW5rLgoKYGBge3J9Cm1vbWEgJT4lIAogIGNvdW50KGFydGlzdF9nZW5kZXIsIGFydGlzdCkgJT4lIAogIGNvdW50KGFydGlzdF9nZW5kZXIpCmBgYAoKClRoaXMgb3V0cHV0IHRha2VzIHRoZSBwcmV2aW91cyB0YWJsZSAobWFkZSB3aXRoIGBjb3VudChhcnRpc3RfZ2VuZGVyLCBhcnRpc3QpYCksIGFuZCBlc3NlbnRpYWxseSBpZ25vcmVzIHRoZSBgbmAgY29sdW1uLiBTbyB3ZSBubyBsb25nZXIgY2FyZSBhYm91dCBob3cgKm1hbnkqIHBhaW50aW5ncyBlYWNoIGluZGl2aWR1YWwgYXJ0aXN0IGNyZWF0ZWQuIEluc3RlYWQsIHdlIHdhbnQgdG8gYGNvdW50YCB0aGUgcm93cyBpbiB0aGlzICpuZXcqIHRhYmxlIHdoZXJlIGVhY2ggcm93IGlzIGEgdW5pcXVlIGFydGlzdC4gQnkgY291bnRpbmcgYnkgYGFydGlzdF9nZW5kZXJgIGluIHRoZSBsYXN0IGxpbmUsIHdlIGFyZSBncm91cGluZyBieSBsZXZlbHMgb2YgdGhhdCB2YXJpYWJsZSAoc28gRmVtYWxlL01hbGUvYE5BYCkgYW5kIGBubmAgaXMgdGhlIG51bWJlciBvZiB1bmlxdWUgYXJ0aXN0cyBmb3IgZWFjaCBnZW5kZXIgY2F0ZWdvcnkgcmVjb3JkZWQuCgojIyBXaGVuIHdlcmUgdGhlIG1vc3QgcGFpbnRpbmdzIGluIHRoZSBjb2xsZWN0aW9uIGFjcXVpcmVkPwoKCjxwIGNsYXNzPSJ0ZXh0LWluZm8iPiBfX0hpbnQ6X18gVHJ5IGBkcGx5cjo6Y291bnRgLiBVc2UgYD9jb3VudGAgdG8gZmlndXJlIG91dCBob3cgdG8gc29ydCB0aGUgb3V0cHV0LjwvcD4KCmBgYHtyfQptb21hICU+JSAKICBjb3VudCh5ZWFyX2FjcXVpcmVkLCBzb3J0ID0gVFJVRSkKYGBgCgojIyBXaGVuIHdlcmUgdGhlIG1vc3QgcGFpbnRpbmdzIGluIHRoZSBjb2xsZWN0aW9uIGNyZWF0ZWQ/CgoKPHAgY2xhc3M9InRleHQtaW5mbyI+IF9fSGludDpfXyBUcnkgYGRwbHlyOjpjb3VudGAuIFVzZSBgP2NvdW50YCB0byBmaWd1cmUgb3V0IGhvdyB0byBzb3J0IHRoZSBvdXRwdXQuPC9wPgoKYGBge3J9Cm1vbWEgJT4lIAogIGNvdW50KHllYXJfY3JlYXRlZCwgc29ydCA9IFRSVUUpCmBgYAoKCiMjIFdoYXQgYWJvdXQgdGhlIGZpcnN0IHBhaW50aW5nIGJ5IGEgc29sbyBmZW1hbGUgYXJ0aXN0PwoKCgo8cCBjbGFzcz0idGV4dC1pbmZvIj4gX19IaW50Ol9fIFRyeSBjb21iaW5pbmcgdGhyZWUgYGRwbHlyYCBmdW5jdGlvbnM6IGBmaWx0ZXJgLCBgc2VsZWN0YCwgYW5kIGBhcnJhbmdlYC48L3A+CgpXaGVuIHdhcyB0aGUgZmlyc3QgcGFpbnRpbmcgYnkgYSBzb2xvIGZlbWFsZSBhcnRpc3QgYWNxdWlyZWQ/CgpgYGB7cn0KbW9tYSAlPiUgCiAgZmlsdGVyKG51bV9hcnRpc3RzID09IDEgJiBuX2ZlbWFsZV9hcnRpc3RzID09IDEpICU+JSAKICBzZWxlY3QodGl0bGUsIGFydGlzdCwgeWVhcl9hY3F1aXJlZCwgeWVhcl9jcmVhdGVkKSAlPiUgCiAgYXJyYW5nZSh5ZWFyX2FjcXVpcmVkKQpgYGAKCldoYXQgaXMgdGhlIG9sZGVzdCBwYWludGluZyBieSBhIHNvbG8gZmVtYWxlIGFydGlzdCwgYW5kIHdoZW4gd2FzIGl0IGNyZWF0ZWQ/CgpgYGB7cn0KbW9tYSAlPiUgCiAgZmlsdGVyKG51bV9hcnRpc3RzID09IDEgJiBuX2ZlbWFsZV9hcnRpc3RzID09IDEpICU+JSAKICBzZWxlY3QodGl0bGUsIGFydGlzdCwgeWVhcl9hY3F1aXJlZCwgeWVhcl9jcmVhdGVkKSAlPiUgCiAgYXJyYW5nZSh5ZWFyX2NyZWF0ZWQpCmBgYAoKYGBge3IgZXZhbCA9IEZBTFNFfQojIG9yLCBiZWNhdXNlIGFydGlzdF9nZW5kZXIgaXMgbWlzc2luZyB3aGVuIG51bV9hcnRpc3RzID4gMQptb21hICU+JSAKICBmaWx0ZXIoYXJ0aXN0X2dlbmRlciA9PSAiRmVtYWxlIikgJT4lIAogIHNlbGVjdCh0aXRsZSwgYXJ0aXN0LCB5ZWFyX2FjcXVpcmVkLCB5ZWFyX2NyZWF0ZWQpICU+JSAKICBhcnJhbmdlKHllYXJfYWNxdWlyZWQpCmBgYAoKIyBCYXNpY3Mgb2YgYGdncGxvdDJgCgo8ZGl2IGNsYXNzPSJwYW5lbCBwYW5lbC1zdWNjZXNzIj4KICA8ZGl2IGNsYXNzPSJwYW5lbC1oZWFkaW5nIj5DaGFsbGVuZ2UgIzI6PC9kaXY+CiAgPGRpdiBjbGFzcz0icGFuZWwtYm9keSI+CldlJ2xsIGRvIHRoaXMgdG9nZXRoZXIgKihub3RoaW5nIHRvIHR1cm4gaW4pKjogc2VlIFtzbGlkZXNdKGh0dHBzOi8vc3RldmVuYmVkcmljay5naXRodWIuaW8vZGF0YS12aXMtbGFicy0yMDIzL3NsaWRlcy8wMi1zbGlkZXMuaHRtbCMxNikuCiAgPC9kaXY+CjwvZGl2PgoKCgojIFBsb3QgeW91ciBkYXRhCgoKCiMjIFBsb3QgeWVhciBwYWludGVkIHZzIHllYXIgYWNxdWlyZWQKCiAKCgoKPGRpdiBjbGFzcz0icGFuZWwgcGFuZWwtc3VjY2VzcyI+CiAgPGRpdiBjbGFzcz0icGFuZWwtaGVhZGluZyI+Q2hhbGxlbmdlICMzOjwvZGl2PgogIDxkaXYgY2xhc3M9InBhbmVsLWJvZHkiPgpMZXQncyByZWNyZWF0ZSB0aGlzIHBsb3QgZnJvbSBbZml2ZXRoaXJ0eWVpZ2h0XShodHRwczovL2ZpdmV0aGlydHllaWdodC5jb20vZmVhdHVyZXMvYS1uZXJkcy1ndWlkZS10by10aGUtMjIyOS1wYWludGluZ3MtYXQtbW9tYS8pIChtb3N0bHkpIQoKIVtdKGh0dHBzOi8vZml2ZXRoaXJ0eWVpZ2h0LmNvbS93cC1jb250ZW50L3VwbG9hZHMvMjAxNS8wOC9yb2VkZXItZmVhdHVyZS1tb21hLTEucG5nP3c9MTE1MCkKClRoaW5ncyB0byBjb25zaWRlcjoKCi0gWW91J2xsIHdhbnQgdG8gcGxheSBhcm91bmQgd2l0aCBzZXR0aW5nIGFuIGBhbHBoYWAgdmFsdWUgaGVyZS0ga2VlcCBpbiBtaW5kIHRoYXQgYDBgIGlzIHRvdGFsbHkgdHJhbnNwYXJlbnQgYW5kIGAxYCBpcyBvcGFxdWUuIAotIFRyeSB1c2luZyBgZ2VvbV9hYmxpbmUoKWAgdG8gYWRkIHRoZSBsaW5lIGluIHJlZCAodXNlIHRoZSBkZWZhdWx0IGludGVyY2VwdCB2YWx1ZSBvZiAwKS4gVGhlIGFjdHVhbCByZWQgbGluZSBpcyBkaWZmaWN1bHQgdG8gcmVjcmVhdGUtIGhlcmUgaXMgd2hhdCB0aGUgYXV0aG9ycyBzYXk6ICJUaGUgcmVkIHJlZ3Jlc3Npb24gbGluZSBzaG93cyB0aGUg4oCcbW9kZXJuaXppbmfigJ0gb2YgTW9NQeKAmXMgY29sbGVjdGlvbiDigJQgaG93IHF1aWNrbHkgdGhlIG11c2V1bSBoYXMgbW92ZWQgdG93YXJkIGFjcXVpcmluZyByZWNlbnQgcGFpbnRpbmdzLiIKLSBHbyBiYWNrIHRvIFtMYWIgMDFdKGh0dHBzOi8vc3RldmVuYmVkcmljay5naXRodWIuaW8vZGF0YS12aXMtbGFicy0yMDIzLzAxLWVkYV9ob3RfZG9ncy5odG1sKSB0byByZXZpZXcgaG93IHRvIGRvIHRoZSBmb2xsb3dpbmc6CiAgICAtIENoYW5nZSB0aGUgeC0gYW5kIHktYXhpcyBsYWJlbHMgYW5kIHRoZSBwbG90IHRpdGxlIHRvIG1hdGNoIHRoZSBwbG90IGFib3ZlCiAgPC9kaXY+CjwvZGl2PgoKCmBgYHtyfQpnZ3Bsb3QobW9tYSwgYWVzKHllYXJfY3JlYXRlZCwgeWVhcl9hY3F1aXJlZCkpICsKICBnZW9tX3BvaW50KGFscGhhID0gLjEsIG5hLnJtID0gVFJVRSkgKwogIGdlb21fYWJsaW5lKGludGVyY2VwdCA9IGMoMCwwKSwgY29sb3VyID0gInJlZCIpICsKICBsYWJzKHggPSAiWWVhciBQYWludGVkIiwgeSA9ICJZZWFyIEFjcXVpcmVkIikgKwogIGdndGl0bGUoIk1vTUEgS2VlcHMgSXRzIENvbGxlY3Rpb24gQ3VycmVudCIpIApgYGAKCgoKIyMgRmFjZXQgYnkgYXJ0aXN0IGdlbmRlcgoKQ2FuIHlvdSBtYWtlIHRoZSBzYW1lIHBsb3QgYWJvdmUsIGJ1dCBmYWNldCBieSBhcnRpc3QgZ2VuZGVyPyAKCjxwIGNsYXNzPSJ0ZXh0LWluZm8iPiBfX0hpbnQ6X18gRm9yIHRoaXMgdG8gbWFrZSBzZW5zZSwgeW91IHByb2JhYmx5IHdhbnQgdG8gZG8gc29tZSBmaWx0ZXJpbmcgdG8gc2VsZWN0IG9ubHkgdGhvc2UgcGFpbnRpbmdzIHdoZXJlIHRoZXJlIHdhcyBvbmUgInNvbG8iIGFydGlzdC48L3A+CgpgYGB7cn0KbW9tYV9zb2xvIDwtIG1vbWEgJT4lIAogIGZpbHRlcihudW1fYXJ0aXN0cyA9PSAxKQpnZ3Bsb3QobW9tYV9zb2xvLCBhZXMoeWVhcl9jcmVhdGVkLCB5ZWFyX2FjcXVpcmVkKSkgKwogIGdlb21fcG9pbnQoYWxwaGEgPSAuMSkgKwogIGdlb21fYWJsaW5lKGludGVyY2VwdCA9IGMoMCwwKSwgY29sb3VyID0gInJlZCIpICsKICBsYWJzKHggPSAiWWVhciBQYWludGVkIiwgeSA9ICJZZWFyIEFjcXVpcmVkIikgKwogIGdndGl0bGUoIk1vTUEgS2VlcHMgSXRzIENvbGxlY3Rpb24gQ3VycmVudCIpICsKICBmYWNldF93cmFwKH5hcnRpc3RfZ2VuZGVyKQpgYGAKCgojIFBsb3QgcGFpbnRpbmcgZGltZW5zaW9ucwoKPGRpdiBjbGFzcz0icGFuZWwgcGFuZWwtc3VjY2VzcyI+CiAgPGRpdiBjbGFzcz0icGFuZWwtaGVhZGluZyI+Q2hhbGxlbmdlICM0OjwvZGl2PgogIDxkaXYgY2xhc3M9InBhbmVsLWJvZHkiPgpMZXQncyAoc29tZXdoYXQpIHRyeSB0byByZWNyZWF0ZSB0aGlzIHNjYXR0ZXJwbG90IGZyb20gW2ZpdmV0aGlydHllaWdodF0oaHR0cHM6Ly9maXZldGhpcnR5ZWlnaHQuY29tL2ZlYXR1cmVzL2EtbmVyZHMtZ3VpZGUtdG8tdGhlLTIyMjktcGFpbnRpbmdzLWF0LW1vbWEvKS4gCgoKIVtdKGh0dHBzOi8vZml2ZXRoaXJ0eWVpZ2h0LmNvbS93cC1jb250ZW50L3VwbG9hZHMvMjAxNS8wOC9yb2VkZXItZmVhdHVyZS1tb21hLTMucG5nP3c9MTE1MCkKClRvIHJlY3JlYXRlLCBzb21lIHRoaW5ncyB0byBjb25zaWRlcjoKCi0gVHJ5IGZpbHRlcmluZyBhbGwgcGFpbnRpbmdzIHdpdGggaGVpZ2h0IGxlc3MgdGhhbiA2MDAgY20gYW5kIHdpZHRoIGxlc3MgdGhhbiA3NjAgY20uIAotIElmIHlvdSB3YW50IHRvIGFkZCBjb2xvciBhcyBpbiB0aGUgb3JpZ2luYWwsIHlvdSdsbCBuZWVkIHRvIGNyZWF0ZSBhIG5ldyB2YXJpYWJsZSB1c2luZyBgbXV0YXRlYC4gCgoKPHAgY2xhc3M9InRleHQtaW5mbyI+IF9fSGludDpfXyBZb3UnbGwgcHJvYmFibHkgYWxzbyB3YW50IHRvIGxvb2sgaW50byBgY2FzZV93aGVuYCB0byBjcmVhdGUgYSBjYXRlZ29yaWNhbCB2YXJpYWJsZSB0byBjb2xvciBieS48L3A+CiAgPC9kaXY+CjwvZGl2PgoKCgoKCgoKYGBge3J9Cm1vbWFfZGltIDwtIG1vbWEgJT4lIAogIGZpbHRlcihoZWlnaHRfY20gPCA2MDAsIHdpZHRoX2NtIDwgNzYwKSAlPiUgCiAgbXV0YXRlKGh3X3JhdGlvID0gaGVpZ2h0X2NtIC8gd2lkdGhfY20sCiAgICAgICAgIGh3X2NhdCA9IGNhc2Vfd2hlbigKICAgICAgICAgICBod19yYXRpbyA+IDEgfiAidGFsbGVyIHRoYW4gd2lkZSIsCiAgICAgICAgICAgaHdfcmF0aW8gPCAxIH4gIndpZGVyIHRoYW4gdGFsbCIsCiAgICAgICAgICAgaHdfcmF0aW8gPT0gMSB+ICJwZXJmZWN0IHNxdWFyZSIKICAgICAgICAgKSkKbGlicmFyeShnZ3RoZW1lcykKZ2dwbG90KG1vbWFfZGltLCBhZXMoeCA9IHdpZHRoX2NtLCB5ID0gaGVpZ2h0X2NtLCBjb2xvdXIgPSBod19jYXQpKSArCiAgZ2VvbV9wb2ludChhbHBoYSA9IC41KSArCiAgZ2d0aXRsZSgiTW9NQSBQYWludGluZ3MsIFRhbGwgYW5kIFdpZGUiKSArCiAgc2NhbGVfY29sb3VyX21hbnVhbChuYW1lID0gIiIsCiAgICAgICAgICAgICAgICAgICAgICB2YWx1ZXMgPSBjKCJncmF5NTAiLCAiI0ZGOTkwMCIsICIjQjE0Q0YwIikpICsKICB0aGVtZV9maXZldGhpcnR5ZWlnaHQoKSArCiAgdGhlbWUoYXhpcy50aXRsZSA9IGVsZW1lbnRfdGV4dCgpKSArCiAgbGFicyh4ID0gIldpZHRoIiwgeSA9ICJIZWlnaHQiKSAKYGBgCgoKVGhvc2UgY29sb3JzIGFyZSBpbnRlbnNlISBXb3VsZCBkaWZmZXJlbnQgb25lcyB3b3JrIGJldHRlcj8KCmBgYHtyfQpsaWJyYXJ5KGdndGhlbWVzKQpnZ3Bsb3QobW9tYV9kaW0sIGFlcyh4ID0gd2lkdGhfY20sIHkgPSBoZWlnaHRfY20sIGNvbG91ciA9IGh3X2NhdCkpICsKICBnZW9tX3BvaW50KGFscGhhID0gLjUpICsKICBnZ3RpdGxlKCJNb01BIFBhaW50aW5ncywgVGFsbCBhbmQgV2lkZSIpICsKICBzY2FsZV9jb2xvdXJfbWFudWFsKG5hbWUgPSAiIiwKICAgICAgICAgICAgICAgICAgICAgIHZhbHVlcyA9IGMoImdyYXk1MCIsICIjZWU1ODYzIiwgIiM2OTk5Y2QiKSkgKwogIHRoZW1lX2ZpdmV0aGlydHllaWdodCgpICsKICB0aGVtZShheGlzLnRpdGxlID0gZWxlbWVudF90ZXh0KCkpICsKICBsYWJzKHggPSAiV2lkdGgiLCB5ID0gIkhlaWdodCIpIApgYGAKCldlIGNvdWxkIGFsc28gZG8gYXdheSB3aXRoIHRoZSBsZWdlbmQgYW5kIHVzZSBgZ2VvbV9hbm5vdGF0ZWAgaW5zdGVhZC4KCmBgYHtyfQpsaWJyYXJ5KGdndGhlbWVzKQpnZ3Bsb3QobW9tYV9kaW0sIGFlcyh4ID0gd2lkdGhfY20sIHkgPSBoZWlnaHRfY20sIGNvbG91ciA9IGh3X2NhdCkpICsKICBnZW9tX3BvaW50KGFscGhhID0gLjUsIHNob3cubGVnZW5kID0gRkFMU0UpICsKICBnZ3RpdGxlKCJNb01BIFBhaW50aW5ncywgVGFsbCBhbmQgV2lkZSIpICsKICBzY2FsZV9jb2xvdXJfbWFudWFsKG5hbWUgPSAiIiwKICAgICAgICAgICAgICAgICAgICAgIHZhbHVlcyA9IGMoImdyYXk1MCIsICIjZWU1ODYzIiwgIiM2OTk5Y2QiKSkgKwogIHRoZW1lX2ZpdmV0aGlydHllaWdodCgpICsKICB0aGVtZShheGlzLnRpdGxlID0gZWxlbWVudF90ZXh0KCkpICsKICBsYWJzKHggPSAiV2lkdGgiLCB5ID0gIkhlaWdodCIpICsKICBhbm5vdGF0ZSh4ID0gMjAwLCB5ID0gMzgwLCBnZW9tID0gInRleHQiLCAKICAgICAgICAgICBsYWJlbCA9ICJUYWxsZXIgdGhhblxuV2lkZSIsIGNvbG9yID0gIiNlZTU4NjMiLCAKICAgICAgICAgICBzaXplID0gNSwgZmFtaWx5ID0gIkxhdG8iLCBoanVzdCA9IDEsIGZvbnRmYWNlID0gMikgKwogICAgYW5ub3RhdGUoeCA9IDM3NSwgeSA9IDEwMCwgZ2VvbSA9ICJ0ZXh0IiwgCiAgICAgICAgICAgICBsYWJlbCA9ICJXaWRlciB0aGFuXG5UYWxsIiwgY29sb3IgPSAiIzY5OTljZCIsIAogICAgICAgICAgICAgc2l6ZSA9IDUsIGZhbWlseSA9ICJMYXRvIiwgaGp1c3QgPSAwLCBmb250ZmFjZSA9IDIpCmBgYAoKIyBQbG90IHNvbWV0aGluZyBuZXcgJiBkaWZmZXJlbnQhCgo8ZGl2IGNsYXNzPSJwYW5lbCBwYW5lbC1zdWNjZXNzIj4KICA8ZGl2IGNsYXNzPSJwYW5lbC1oZWFkaW5nIj5DaGFsbGVuZ2UgIzU6PC9kaXY+CiAgPGRpdiBjbGFzcz0icGFuZWwtYm9keSI+Ckl0IGNhbiBiZSBhbnl0aGluZy0geW91IGNhbiBjaGFuZ2UgY29sb3JzLCBhZGQgYW5ub3RhdGlvbnMsIHN3aXRjaCB0aGUgZ2VvbXMsIGFkZCBuZXcgdmFyaWFibGVzIHRvIGV4YW1pbmUtIHRoZSB3b3JsZCBpcyB5b3VyIG95c3RlciEgVGhlIG9ubHkgcmVxdWlyZW1lbnRzIGFyZToKCjEuIFlvdSAqbWFrZSogb25lIG5ldyBwbG90IHRoYXQgaXMgb3JpZ2luYWwsIGFuZCAKMi4gWW91ICp3cml0ZSogMS0yIHNlbnRlbmNlcyB0byBwcmVzZW50IHRoZSBwbG90IGFuZCB3aHkgaXQgbWFrZXMgc2Vuc2UuIFdoYXQgcXVlc3Rpb25zIGRvIHlvdSB0aGluayB5b3VyIHBsb3QgY2FuIGhlbHAgeW91IHRvIGFuc3dlcj8KCkl0IGRvZXMgbm90IGhhdmUgdG8gYmUgcHJldHR5IHJpZ2h0IG5vdywgYnV0IGl0IG11c3QgbWFrZSBzZW5zZSBhcyBhIHZpc3VhbGl6YXRpb24tIHlvdSBtdXN0IGJlIGFibGUgdG8gaW50ZWxsaWdlbnRseSBhbmQgc3VjY2ludGx5IHRlbGwgdXMgYWJvdXQgaXQgaW4gcmVhbCB3b3Jkcy4KICA8L2Rpdj4KPC9kaXY+CgoKCgoK

Lab 02: MoMA Museum Tour

BMI 5/625

Alison Hill, with (slight) modifications by Steven Bedrick

1 Goals for Lab 02

2 Slides for today

3 Inspiration + data

4 Packages needed

5 Read in the data

6 Know your data

6.1 How many paintings?

6.2 What is the first painting acquired?

6.3 What is the oldest painting in the MoMA collection?

6.4 How many artists?

6.5 Which artist has the most paintings?

6.6 How many paintings by male vs female artists?

6.7 How many artists of each gender are there?

6.8 When were the most paintings in the collection acquired?

6.9 When were the most paintings in the collection created?

6.10 What about the first painting by a solo female artist?

7 Basics of `ggplot2`

8 Plot your data

8.1 Plot year painted vs year acquired

8.2 Facet by artist gender

9 Plot painting dimensions

10 Plot something new & different!

Lab 02: MoMA Museum Tour

BMI 5/625

Alison Hill, with (slight) modifications by Steven Bedrick

1 Goals for Lab 02

2 Slides for today

3 Inspiration + data

4 Packages needed

5 Read in the data

6 Know your data

6.1 How many paintings?

6.2 What is the first painting acquired?

6.3 What is the oldest painting in the MoMA collection?

6.4 How many artists?

6.5 Which artist has the most paintings?

6.6 How many paintings by male vs female artists?

6.7 How many artists of each gender are there?

6.8 When were the most paintings in the collection acquired?

6.9 When were the most paintings in the collection created?

6.10 What about the first painting by a solo female artist?

7 Basics of ggplot2

8 Plot your data

8.1 Plot year painted vs year acquired

8.2 Facet by artist gender

9 Plot painting dimensions

10 Plot something new & different!

7 Basics of `ggplot2`