[R] 웹 크롤링_스크레핑1
크롤링 프로젝트 1 1. 스크레핑 - 웹 사이트에 있는 특정 정보를 추출하는 기술 2. 크롤링 - 프로그램이 웹 사이트를 정기적으로 돌며 정보를 추출하는 기술 -------------------------------------------------------------------------------------- 스크레핑 과정 1. 대상 URL 할당 (URL 지정) 2. 웹 문서 추출 : (R) htmlParser() 3. 특정 태그의 Data 추출 : XPathSApply() 4. Data 정제 (불필요한 특수문자, 공백문자 제거) : Gsub('\n', ' ', name) #name에서 '\n' 문자를 제거한다. 5. Data 프레임화 : data.frame() 6. Data 정렬 : Format()..