How to filter rows by group

Question

I would like from this tibble :

mydf <- tribble(
  ~siren_us, ~eff,
  "A",   3,
  "A",   2,
  "B",   1,
  "B",   NA,
  "C",   3,
  "C",   5,
  "C",   4,
  "D",   NA,
  "E",   1,
  "E",   NA
)

get this one :

more precisely, I want to retrieve the rows from mydf for which siren_us exists at least twice and which have the eff column equal to NA. In my example, I don't want the row "D" in result

result <- tribble(
  ~siren_us, ~eff,
  "B",   NA,
  "E",   NA
)

I think it could be madewith dplyr instructions group_by and filter ?

Many thanks in advance

Sinh Nguyen · Accepted Answer

Using group_by & filter from dplyr package

library(dplyr)
mydf %>%
  group_by(siren_us) %>%
  filter(
    # group that have at least two records
    n() >= 2 &
    # and at least one eff is.na
    any(is.na(eff)))

Output

# A tibble: 4 x 2
# Groups:   siren_us [2]
  siren_us   eff
      
1 B            1
2 B           NA
3 E            1
4 E           NA

How to filter rows by group

Answers (2)

Related Questions