테크레시피

엑셀 한계가 원인? 英 코로나19 검사 보고 누락 발생

영국 보건청 PHE가 데이터 로드에 일어난 기술적 문제로 인해 1만 5,841건에 이르는 증례 보고 누락이 있었다고 발표했다.

PHE는 영국 전역 공공과 민간 연구소가 제공하는 코로나19 검사 결과 일치성 확인을 맡고 있다. 이 데이터는 매일 공표되어야 하며 데이터베이스는 접촉자 추적 대책에 사용된다. 그런데 기술적 문제로 인해 9월 25∼10월 2일에 걸쳐 입력된 데이터가 일시적으로 중단됐다는 것. 손실 데이터 대부분은 9월 30일부터 10월 2일까지 보고된 것이다.

PHE는 양성이라고 진단한 모든 환자가 검사 결과를 통보해 현재는 모든 정보를 국민보험 서비스 NHS 접촉자 추적 시스템에 추가했다고 밝히고 있다. 하지만 이번 문제로 상당 시간을 허비하게 됐다. 이 문제를 간과한 사이에도 접촉자 5만 명이 발생했다고 추정되고 있다.

이 같은 사태를 초래한 원인은 뭘까. PHE는 검사 결과 비교에 사용한 엑셀 스프레드시트가 데이터 한도에 도달했지만 너무 늦게까지 아무도 눈치채지 못했기 때문이라는 의구심이 높아지고 있다. 보도에 따르면 실험실에서 받은 CSV 파일을 마스터 목록에 추가할 때 스프레드시트가 최대값에 도달한 게 아닐까 추정하고 있다. 스프레드시트 상한은 104만 8,576행과 1만 6,384열이다.

이번 사건 뿐 아니라 지난 2013년 JP모건은 600억 달러 손실을 부분적으로 재무 모델링에 사용한 엑셀 스프레드시트 오류 때문이라고 밝히기도 했다. 지난 8월에는 엑셀이 유전자 약어를 날짜로 변환해버리는 문제로 연구팀은 27개 유전자명을 바꾸겠다고 발표하기도 했다. 관련 내용은 이곳에서 확인할 수 있다.

추천기사