제주 탈출 일지

빅데이터 분석 - R 웹크롤링 포스팅 정리 본문

빅데이터 분석

빅데이터 분석 - R 웹크롤링 포스팅 정리

귀건 2020. 9. 30. 00:51
728x90
반응형

이것은 포스팅이 아니고 웹 크롤링 관련 참고 포스팅이나 글들을 정리하기 위함이다. 

 

 

1. 웹 크롤링 기초.

https://statkclee.github.io/yonsei/data/R_Web_Crawling.pdf

 

2. 웹 크롤링 기초2.

https://mrchypark.github.io/getWebR/

 

R로 웹 데이터를 가져오는 4가지 방법(은 크롤링)

 

mrchypark.github.io

3. 보배 드림 크롤링 예제.

https://insightteller.tistory.com/entry/R%EB%A1%9C-%ED%81%AC%EB%A1%A4%EB%A7%81%ED%95%98%EA%B8%B0-%EB%B3%B4%EB%B0%B0%EB%93%9C%EB%A6%BC-%EC%98%88%EC%A0%9C\

 

R로 크롤링하기 - 보배드림 예제

R기초6 R 로 데이터 수집하기 이번 시간에는 인터넷 상에 있는 데이터를 R을 이용해서 수집하는 scraping을 보겠습니다. 흔히, 크롤링(crawling)이라는 표현을 쓰는데, 이는 검색 엔진에 더 적합한 표��

insightteller.tistory.com

: 세부 내용을 가지고 올때, 각 데이터가 형식이 다 다름

(어떤 차는 수동에 11인승에 45kg ...인데, 어떤차는 6인승 이렇게만 적혀있는 데이터가 있음. 데이터 별로 입력된 내용이 상이하여 어떻게 정리할지 잘 모르겠음...ㅁㄴㅇㄹ)

 

 

 

4. 네이버 뉴스 크롤링

https://m.blog.naver.com/PostView.nhn?blogId=knowch&logNo=221060289410&proxyReferer=https:%2F%2Fwww.google.com%2F

 

[R] 네이버 뉴스 크롤링

인터넷 세상에는 많은 정보(데이터)가 있어, 데이터를 가져와서 무언가(혹은 분석)로 활용하고 싶을 때가 ...

blog.naver.com

한 기사의 데이터만을 가져오는 것은 성공, 반복문으로 여러 기사를 가져오는 것은 양식이 달라져서 다시 한번 찾아봐야 할듯;

 

5. 영화 크롤링하기.

https://prohannah.tistory.com/39

 

R 네이버 영화 웹 크롤링하기 #2 - 영화 리뷰 키워드 수집

전편 [R 네이버 영화 웹 크롤링하기 #1] 에 이어서 내용 계속하도록 하겠습니다. 너무 오랜만에 코드를 보니까 남이 짠 것 코드를 보는 것 마냥 새롭네요..ㅎ 전 내용에서는 '네이버 영화 랭킹 페

prohannah.tistory.com

 

 

 

이 글들과 예제들을 차분히 보고, 머릿속으로 정리가 되면 한번 나만의 예제를 한번 만들어서 진행해볼 예정이다.

728x90
반응형
Comments