R語言爬蟲:穿越表單
阿新 • • 發佈:2018-01-18
lis value val text pen null htm 以及 使用
使用rvest包實現實現穿越表單以及頁面的跳轉
formurl <- "http://open.xmu.edu.cn/oauth2/authorize?client_id=1010&response_type=code" session <- html_session(formurl) #創建會話 form <- html_form(session) #得到網頁內的所有表單,以list形式返回 str(form) form <- form[[1]] #提取我們想要的表單 UserName <- "*******" #這裏填寫你自己的學號 Password <- "*******" #這裏把password替換成你自己的密碼 form <- set_values(form,'UserName'=UserName,'Password'=Password) #填寫表單內容 out_url <- submit_form(session,form,submit=NULL) #在會話中提交表單,實現表單穿越 class(out_url) session2 <- follow_link(out_url,'Advanced Econometrics') course.info <- session2 %>% html_nodes("ul.section") %>% html_text() #爬取屬性為section的ul節點,獲取其下面列表的所有文本內容 cat(course.info[1])
R語言爬蟲:穿越表單