dataset 만들기 분담

CRAFT, TROCR 논문 reading

CRAFT

https://arxiv.org/pdf/1904.01941.pdf

TrOCR

https://arxiv.org/pdf/2109.10282.pdf

한글 필기체(혁훈, 지선)

AIHub

  1. 다양한 형태의 한글 문자 OCR https://aihub.or.kr/aidata/33987
  2. 한국어 글자체 이미지 https://aihub.or.kr/aidata/133
  3. 야외 실제 촬영 한글 이미지 https://aihub.or.kr/aidata/33985
  4. PHD08 (https://www.dropbox.com/s/69cwkkqt4m1xl55/phd08.alz?dl=0) 패딩이 없는 데이터 binary파일로 8GB
  5. https://github.com/callee2006/HangulDB
  6. http://semanticweb.kaist.ac.kr/org/bora/04_01.php 한글 1,200자
  7. http://101.101.175.217:8080/static/dataset/korean_hand

mxfont - 혁훈

단어를 지정할 수 있다.

https://github.com/Belval/TextRecognitionDataGenerator