테크레시피

엑셀 때문에 유전자 명칭 바꾼다?

엑셀에서 1-1을 입력하면 자동으로 1월 1일로 변환해주는 기능은 때론 유용하지만 단순히 1-1을 입력하고 싶었다면 참견으로 느낄 수 있다. 실제로 이 기능을 통해 인간 유전자 약어를 마음대로 날짜로 변환해버리는 문제가 유전자 학자를 괴롭히고 있으며 결국 과학자 측이 유전자 이름을 바꿀 예정이라고 보도되고 있다.

엑셀이 문자열을 마음대로 바꾸고 사용자가 의도하지 않은 표현으로 바꿔 버리는 문제는 일찌감치 유전자 학자를 괴롭혀왔다. 예를 들어 인간 세포 내에 존재하는 단백질 일종인 Septin 2의 명칭에 있는 SEPT2는 2-Sep(9 월 2 일)로, 또 다른 유전자(Membrane-Associated Ring Finger(C3HC4) 1, E3 Ubiquitin Protein Ligase) 명칭인 MARCH1은 1-Mar(3월 1일)로 바뀌어 버린다.

2016년 발표된 연구는 유전자를 다룬 논문 3,597건 중 엑셀이 원인으로 보이는 실수가 발견된 건 704건으로 논문 중 20%에 이렇게 엑셀 자동 변환 기능 영향이 나타나고 있는 걸 알 수 있다.

엑셀에서 이런 자동 변환이 발생하면 표시 뿐 아니라 데이터 자체가 바뀌어 버리기 때문에 나중에 수정하는 건 어렵다. 유전자 학자는 셀 서식을 문자열로 변경하는 등 대응해왔지만 다른 사람이 같은 엑셀 파일을 열면 또 마음대로 자동 변환해버리는 등 문제 해결에 고심하고 있었던 것.

이에 따라 인간 유전자 분석 기구인 인간게놈명명법위원회(HGNC)는 2020년 8월 3일(현지시간) 새로운 지침을 발표하고 데이터 처리와 검색에 영향을 미치는 기호를 바꾸겠다고 선언했다. 따라서 앞으로 SEPT2는 SEPTIN2, MARCH1은 MARCHF1로 표기하며 앞으로 새로 발견되는 유전자 명칭은 엑셀 자동 변환을 배려하는 것으로 결정했다.

HGNC 측은 가이드라인 발표 전부터 유전자 이름 변경은 이뤄지고 있었고 지난 1년 만에 유전자 27종 이름을 바꿨다고 한다. 유전자 이름은 가볍게 바꾸는 게 물론 좋은 건 아니지만 변경 자체가 드문 일은 아니라고 설명한다. 예를 들어 지금까지 명사와 헛갈린다는 이유로 CARS는 CARS1으로, WARS는 WARS1으로 바뀐 바 있다.

그 밖에도 인간 암 관련 유전자 중 일부는 파리에서 발견한 유사 유전자를 기념해 이름 붙인 headcase homolog(Drosophila)라는 유전자가 있다. 하지만 여기에는 미치광이(headcase)라는 차별어를 포함하고 있어 Hdc Homolog, Cell Cycle Regulator로 바꾼 사례도 있다. 관련 내용은 이곳에서 확인할 수 있다.

추천기사