인터넷에는 다양한 정보가 넘치고 유익한 정보를 표나 그래프로 표시하는 경우가 많지만 이미지 상태가 많다. 이런 이미지 상태 표를 텍스트 데이터 형식으로 변환하고 싶을 때 편리한 게 표 이미지에서 테이블을 자동 생성해주는 익스트랙트 테이블(Extract Table)이다. 익스트렉트 테이블은 사진에 찍혀 있는 텍스트나 필기를 인식하고 이를 텍스트 데이터로 자동 추출할 수 있는 아마존 기계학습 서비스인 아마존 텍스트렉트(Amazon Textract)를 구사하고 있다.
이용 방법은 간단하다. PC에서 테이블화하려는 테이블 이미지를 선택하고 등록을 누르면 표 이미지를 테이블로 출력할 수 있다. 테이블은 CSV 파일 형태로 내려받을 수 있다. 다운로드한 CSV 파일은 구글 스프레드시트와 같은 스프레드시트로 가져올 수 있다.
영문의 경우 텍스트로 변환하는 작업은 정확하게 할 수 있지만 한국어의 경우 제대로 인식하지 못한다. 관련 내용은 이곳에서 확인할 수 있다.