-
채용알림서비스 만들기SW/Project 2018. 1. 5. 23:00
개요
인터넷에는 사람인, 잡코리아등 많은 구직 사이트가 존재하고 새로운 정보가 어마어마하게 있고 지금 또한 올라오고 있다. 나와 상관 없는 분야, 또는 같은 분야에서 내 관심분야 밖인 공고도 많이 볼 수 있다. 황금같은 시간을 조금이나마 줄이기 위해 나에게 적합한 공고, 내가 원하는 분야만 볼 수 있도록 시작하게 되었다.
Web Crawling
- 위사진과 같이 requests 와 BeautifulSoup을 import 한다.
- requests.get에 다가 크롤링 할 주소를 쓴다.
- 위에서 선언한 BeautifulSoup을 가지고 이쁘게 html을 뽑는다.
- 가지고온 html을 필요한 부분만 가지고 오기 위해서 soup.find_all을 사용한다.
find_all안에 넣을 부분은 브라우져에서 F12를 누르고 해당 부분을 오른쪽 마우스->copy->copy selector을 누르면 필요한 부분이 복사된다. 처음에는 어려웠지만 여러번 시행착오를 거치면 쉬워진다. 밑에 참고 사이트를 가면 더욱더 자세히 나와 있다.
Selenium
- pip install selenium
- https://github.com/mozilla/geckodriver/releases 드라이버 다운받기(firefox)
- from selenium import webdriver 선언
- webdriver.Firefox에 executable_path="다운받은 드라이버경로"(executable_path 없이 한 분들도 있었는데 내 경우는 오류가 발생하였다.)
- 다음은 그림과 같이 주석을 보고 따라하면 이해할 수 있다. 밑에 참고 사이트를 가면 더욱더 자세히 나와 있다.
Facebook Messager
- form fbchat import Client 를 선언한다.
- Client()에 아이디,패스워드를 입력한다.
- searchForUsers()에 받는 사람을 적는다(이메일|아이디)
- 보낼 메시지를 적는다.
Word2Vec
- from gensim.models.word2vec import Word2Vec 선언한다.
- from konlpy.tag import Kkma 선언한다.
- kkma.nouns()를 가지고 문장들을 단어별로 나눈다.
- Word2Vec()로 단어들을 학습시킨다.
- embedding.most_similar()가지고 내가 원하는 단어들과 가장 유사한 단어를 뽑는다.
result
'SW > Project' 카테고리의 다른 글
[C/C++] OPENGL 실시간 그래프 그리기 (0) 2018.08.01 라즈베리파이를 이용한 자율주행 자동차 (1) 2018.02.23 오목고 (0) 2018.02.01