1. 程式人生 > >R語言爬蟲:穿越表單

R語言爬蟲:穿越表單

lis value val text pen null htm 以及 使用

使用rvest包實現實現穿越表單以及頁面的跳轉

formurl <- "http://open.xmu.edu.cn/oauth2/authorize?client_id=1010&response_type=code"
session <- html_session(formurl) 
#創建會話
form <- html_form(session) 
#得到網頁內的所有表單,以list形式返回
str(form)
form <- form[[1]] 
#提取我們想要的表單
UserName <- "*******" #這裏填寫你自己的學號
Password <- "*******" #這裏把password替換成你自己的密碼
form <- set_values(form,'UserName'=UserName,'Password'=Password) 
#填寫表單內容
out_url <- submit_form(session,form,submit=NULL) 
#在會話中提交表單,實現表單穿越
class(out_url)
session2 <- follow_link(out_url,'Advanced Econometrics')
course.info <- session2 %>% html_nodes("ul.section") %>% html_text() 
#爬取屬性為section的ul節點,獲取其下面列表的所有文本內容
cat(course.info[1])

R語言爬蟲:穿越表單