진행상황

TrOCR의 Decoder를 KoBERT로 대체

  1. RoBERTa 스터디 후 Text Transformer를 KoBERT로 대체

    tokenizer와 layer 수정

  2. parameter setting

    wanDB 사용예정

  3. 데이터 추가학습

CRNN 학습 + 보조액터

TrOCR를 학습한 CRNN으로 대체

+) ocr 데이터 노이즈 있는 것들은 분리해두기

  1. dataset 가공 (전처리)
  2. recog모델
  3. colab 학습
  4. 성능 테스트
  5. 사전, 사후처리 알고리즘 구축 및 성능개선