프로젝트 정리/실시간 검색어 프로젝트

#8 Selenium으로 Nate 크롤링하기

https://stackoverflow.com/questions/10720325/selenium-webdriver-wait-for-complex-page-with-javascript-to-load

 

Selenium WebDriver: Wait for complex page with JavaScript to load

I have a web application to test with Selenium. There is a lot of JavaScript running on page load. This JavaScript code is not so well written but I can't change anything. So waiting for an element...

stackoverflow.com

현재 네이트 페이지 크롤링 중인데 

js파일이 로딩되어 실시간 검색어 목록이 refresh될 떄 까지 기다리게 하는 방법에 대해서 찾고 있다.

 

json파일 내용을 parsing하는 방법도 있는것으로 보이고 일단 메모만 남겨둬야지

 

셀레니움은 사용하지 않고https://www.nate.com/js/data/jsonLiveKeywordDataV1.js?v=202109041200이 주소로 request를 보내서 데이터를 가져왔다.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Reference

 

https://wonyong-jang.github.io/java/2020/07/01/Java-Selenium.html

 

[Java] 동적 웹 크롤링을 위한 셀레니움 1 - SW Developer

셀레니움 셀레니움이란 가상의 브라우저를 띄워서 이를 활용하여 테스트 자동화 및 크롤링 할수 있는 툴이다. WebDriver를 사용해서 브라우저에서의 동작을 컨트롤 할수 있어 정적 Jsoup같은 정적 W

wonyong-jang.github.io

https://m.blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=bb_&logNo=222009164517 

 

[JAVA] HttpUrlConnection 한글 깨짐 해결

[JAVA] HttpUrlConnection 한글 깨짐 해결 원하는 페이지 주소를 직접 입력했을 때 한글이 깨지지 ...

blog.naver.com

https://blog.naver.com/PostView.nhn?blogId=rhkrehduq&logNo=221526106085&parentCategoryNo=&categoryNo=22&viewDate=&isShowPopularPosts=true&from=search 

 

java - http request 요청 보내는 방법

java 소스에서 http 요청을 보내는 방법은 아래의 예제와 같다. 각 프로젝트 마다 인증방식에 따라서 setti...

blog.naver.com