11/05 회의록

Two Track

CRNN (많이 알려진 방법) + 보조액터 → 인쇄체, 필기체 따로 2개 만들어야한다.

배경화면이 다양한 이미지에서 텍스트를 인식하는게 필요하다.

다음주까지 가지고 있는 데이터로 학습시켜보기
RoBERTa 를 koBERT로 변환

DEiT fine tunning

https://arxiv.org/pdf/1907.11692.pdf

Dataset

수직 제외

detection된 잘라진 이미지만 필요

OCR DB파일 → DEiT

→ 자정까지 구글 드라이브에 데이터set합치기

요기에 올려주세용

<aside> 🔥 (OCR) 다음주까지 할 Task - 민선, 창윤

</aside>