Modify regex to exclude characters that occur at beginning

Question

Using below code I'm extracting a generated html link :

mystr <- c("/url?q=http://www.mypage.html&sa=U&ved=0ahUKEwjgyMPj2pXXAhWB5CYKHXysDlsQqQIIKSgAMAg&usg=AOvVaw1VCvT8iznodM3l4xvc8CVq")

str_extract(mystr, "^.*(?=(&sa))")

This returns :

[1] "/url?q=http://www.mypage.html"

How to modify regex in order to exclude /url?q= ? So just http://www.mypage.html is returned ?

Sotos · Accepted Answer

You can replace the beginning of the string (i.e. ^) with http,

stringr::str_extract(mystr, "http.*(?=(&sa))") 
#[1] "http://www.mypage.html"

Modify regex to exclude characters that occur at beginning

Answers (2)

Related Questions