Skip to content

Doyun-lab/Cover_Letter_help

Repository files navigation

Cover-Letter Guide

본 프로젝트는 Gitlab에서 진행됐었습니다.

Participant

정영섭: Professor
권도윤: Student (e-mail : kc0823@naver.com)
박명석: Student (e-mail : pmsk98@naver.com)
서민지: Student (e-mail : jaaaamj0711@gmail.com)

How to use

  1. crawler를 통해 데이터를 수집
  2. Preoprocessing으로 데이터 전처리 진행
  3. 원하는 모델(LDA, LSTM 등)선택 후 py파일 실행

Requirements

- tensorflow == 1.14.0
- gensim == 3.8.3
- konlpy == 0.5.2
- wordcloud == 1.8.1
- bs4 == 4.6.0
- Python >= 3.6
- PyTorch == 1.5.0
- MXNet == 1.6.0
- onnxruntime == 1.5.2
- gluonnlp == 0.9.1
- sentencepiece >= 0.1.85
- transformers == 2.11.0
  • LDA 모델을 사용하기 위해서는 MALLET 패키지 다운이 필요합니다. 해당 모델을 사용할 경우 MALLET 에서
    다운 받아 사용하여 주세요.

  • 저희는 SKT-AI에서 약 20GB의 한국어 데이터를 Pre-Training 시킨 KoGPT2 모델을 사용하였습니다.
    따라서 KoGPT2 사용을 위해서는 아래와 같은 작업 및 설치가 필요합니다.

    Kogpt2 How to install

       git clone https://github.com/SKT-AI/KoGPT2.git
       pip install -r requirements.txt
       pip install .
    

License

KOGPT2와 LDA는 modified MIT 라이선스 하에 공개되어 있습니다. 해당 모델및 코드를 사용할 경우 모델 및 코드를 사용할 경우 라이선스 내용을 준수해주세요. 라이선스 내용은 LICENSE 파일에서 확인할 수 있습니다.
(코드의 세부적인 사항은 구글링을 통해 얻어진 자료를 참고한 것입니다.)

Introduce

취업을 준비하는 과정에서 가장 기본적으로 필수로 준비해야 되는 것은 바로 자기소개서 입니다.
취준생들은 자기소개서를 작성하는데 있어서 많은 어려움을 겪고 있습니다.
이에 본 프로젝트에서는 합격 자기소개서를 바탕으로 분석하여 취준생들에게 자기소개서 작성에 관한 도움을 주고자 합니다.

우리가 제공하는 기능은 다음과 같습니다.

(1) 특정 분야 및 기업에 관한 키워드

자신이 원하는 분야 및 기업에서 합격을 이루었던 중요한 단어들이 무엇인지 파악하여 자기소개서 작성 시 해당 키워드를 참고하여 반영할 수 있도록 합니다.

(2) 막힌 단어 추천 제공

자기소개서 작성 시 단어 선택에 있어서 고민이 되는 경우가 많습니다. 막힌 단어와 비슷한 단어들을 추천하여 단어 선택에 관한 고민을 해결해 줄 수 있습니다.

(3) 자기소개서 중요 문장 제공

자기소개서 안에서 중요한 문장을 제공함으로써 자신이 의도한 자기소개서 방향과 맞는지 확인할 수 있습니다.

(4) 소제목 작성 제공

실제 인사당담자들은 선호하는 자기소개서 유형으로 "소제목이 있는 자기소개서" 를 뽑았습니다.(http://news.bookdb.co.kr/bdb/IssueStory.do?_method=detail&sc.webzNo=37399&Nnews) 키워드 입력시 소제목을 작성해 주는 기능을 통해 소제목 작성에 관한 고민을 해결해주며 현재 취업 트렌드에 맞는 자기소개서를 작성할 수 있도록 도움을 줄 수 있습니다

Project structure

|--Cralwer
|  |--crawler_jobkorea1.py          # jobkorea 사이트 합격 자소서 크롤링 1 
|  |--crawler_jobkorea1.py          # jobkorea 사이트 합격 자소서 크롤링 2  
  
    |--Preprocessing
    |  |--job_answer_preprocess.py     # 데이터 전처리 1
    |  |-- spec_preprocess.py    # 데이터 전처리 2

        |--jobkorea_all.csv     # 전처리 완료 데이터
        |--dataset.txt     # 소제목 데이터

        |--Hannanum
           |--hannanum_().py     # 학과 관련 분야 키워드 워드클라우드(Hannanum 사용)

        |--Komoran
           |--komoran_().py     # 학과 관련 분야 키워드 워드클라우드(Komoran 사용)

        |--Okt
           |--okt_().py      # 학과 관련 분야 키워드 워드클라우드(Okt 사용)

        |--Okt_FastText
           |--okt_FastText_model.py     # FastText 모델(Okt.morphs 사용)
           |--okt_nouns_FastText_model.py     # FastText 적용(Okt.nouns 사용)

        |--Okt_Word2Vec
           |--okt_Word2Vec_model.py    # Word2Vec 모델(Okt.morphs 사용)
           |-- okt_nouns_word2vec_model.py     # Word2Vec 적용(Okt.nouns 사용)

        |--LDA
           |--Hannanum_LDA.py     # LDA 모델(Hannanum 사용)
           |--komoran_LDA.py     # LDA 모델(Komoran 사용)
           |--okt_LDA.py     # LDA 모델(Okt 사용)

        |--TextRank
           |--Hannanum_TextRank.py     # TextRank 모델(Hannanum 사용)
           |--komoran_TextRank.py     # TextRank 모델(Komoran 사용)
           |--okt_TextRank.py     # TextRank 모델(Okt 사용)

        |--SentenceGenerator
           |--RNN_SentenceGenerator.py     # RNN을 사용한 문장 생성 모델
           |--LSTM_SentenceGenerator.py    # LSTM을 사용한 문장 생성 모델
           |--kogpt2_train_SentenceGenerator.py
           |--kogpt2_SenteceGenerator.py

Usage model

  • LDA

  • RNN

  • LSTM

  • GPT2

About

It helps you write a cover letter.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published