https://papertohtml.org/
- 머신러닝을 이용하여 PDF, LaTeX, PubMed Central XML 의 내용을 읽어서 HTML로 변환 - 접근성 증대 목적 - AI 기반 연구자료 검색엔진인 Semantic Scholar 의 실험적 프로토타입 - 현재는 추출된 이미지/콘텐츠만 캐슁하며, 똑같은 문서를 업로드한 사람에게만 빠르게 서비스하는 용도로 사용됨. 업로드한 파일은 보관하지 않음 - 제한 사항 ㅤ→ 표(Table)는 이미지로 추출 됨 ㅤ→ 수학(Math) 콘텐츠는 정확도가 낮거나 거의 추출되지 않음 ㅤ→ LaTex/PubMed 처리는 PDF보다 기능이 일부 부족할 수 있음 - 차후에 Semantic Scholar 에 접근성 기능을 추가할 계획을 가지고 있음 Text-to-speech function is limited to 200 characters |