dataset 만들기 분담
CRAFT, TROCR 논문 reading
CRAFT
https://arxiv.org/pdf/1904.01941.pdf
TrOCR
https://arxiv.org/pdf/2109.10282.pdf
한글 필기체(혁훈, 지선)
AIHub
- 다양한 형태의 한글 문자 OCR https://aihub.or.kr/aidata/33987
- 한국어 글자체 이미지 https://aihub.or.kr/aidata/133
- 야외 실제 촬영 한글 이미지 https://aihub.or.kr/aidata/33985
PHD08 (https://www.dropbox.com/s/69cwkkqt4m1xl55/phd08.alz?dl=0) 패딩이 없는 데이터 binary파일로 8GB
- https://github.com/callee2006/HangulDB
- http://semanticweb.kaist.ac.kr/org/bora/04_01.php 한글 1,200자
http://101.101.175.217:8080/static/dataset/korean_hand
mxfont - 혁훈
단어를 지정할 수 있다.
https://github.com/Belval/TextRecognitionDataGenerator