Data Project (2) 썸네일형 리스트형 2022년 11월 서울시 버스 승하차량 분석해보기 관련 프로젝트 깃허브: https://github.com/dangsunm/2022-11-Seoul-bus GitHub - dangsunm/2022-11-Seoul-bus Contribute to dangsunm/2022-11-Seoul-bus development by creating an account on GitHub. github.com 대중교통을 취미로 가지고 있어서 관련해서 여러가지 데이터를 만지작 해보고 있는데, 그 결과 분석 내용이다. 이 깃의 readme를 통해 설명을 잘 볼 수 있을 테고, 코드와 결과는 Jupyter notebook을 통해 개산되었기에, 깃에서 확인 가능. 1. 버스 승차량 관련 분석 1-1 실 운행대수를 바탕으로 대당 승하차량 분석 1-2 종류별 승하차량 분석 2. 최.. [파이썬] 한국어 위키백과 최근 변경된 문서를 크롤링 해보자 목표: 한국어 위키백과 내에서 최근 바뀜을 가져와 웹을 크롤링 해보기 왜 한국어 위키백과? - 실시간으로 내용을 바꿔서 다른 데이터를 적용 시켜줄 수 있기 떄문에, 웹 구조를 이해해 틀을 갖추는 크롤링을 해보고 싶었음. 교재에서 나무위키를 대상으로 크롤링을 했었는데.. 영리적인 목적에 어둠의 이유도 있어서... 구조가 바뀌어서 크롤링 자체가 어려워지게 바뀜, 그 반면 위키백과는 태그가 복잡하긴 하더라도, 어느정도 구조화된 코드 구조가 있어서, 크롤링이 가능했다. 분석 내용 1. 특수:최근 바뀜을 통해 실시간으로 편집된 문서 리스트를 가져옴 2. 최근 편집된 문서에 가서 가져옴 사용한 Libary: Pandas selenium/webdriver bs4/BeautifulSoup 사이트 구조를 가져오는 과정 .. 이전 1 다음