Two Track

  1. CRNN (많이 알려진 방법) + 보조액터 → 인쇄체, 필기체 따로 2개 만들어야한다.

    배경화면이 다양한 이미지에서 텍스트를 인식하는게 필요하다.

    다음주까지 가지고 있는 데이터로 학습시켜보기

  2. RoBERTa 를 koBERT로 변환

    DEiT fine tunning

    https://arxiv.org/pdf/1907.11692.pdf

Dataset

수직 제외

detection된 잘라진 이미지만 필요

OCR DB파일 → DEiT

→ 자정까지 구글 드라이브에 데이터set합치기

Meet Google Drive - One place for all your files

요기에 올려주세용

<aside> 🔥 (OCR) 다음주까지 할 Task - 민선, 창윤

</aside>

https://github.com/Belval/TextRecognitionDataGenerator