본문

코로나바이러스 시대에 데이터 공유에 대한 6가지 팁

개인정보보호

등록일  2020.05.27

조회수  32657

  

연구원들은 대유행을 막기 위해 자원과 데이터 세트를 서둘러 모으고 있지만, 개방성의 새로운 시대는 사생활, 소유권, 윤리에 대한 우려가 있음.

 

코로나바이러스 대유행이 일어나기 전, 연구자들은 종종 그들의 데이터를 공유하는 것에 대해 신중했음-완전히 원하지 않는 것은 아닐지라도. 벨기에 겐트대(Ghent University in Belgium)에서 프라이버시법과 생명윤리학을 연구하는 마흐사 샤바니(Mahsa Shabani)"역사적으로 연구자들이 자료 수집에 많은 공을 들였고 충분한 신용(credit)을 받기 원하기 때문에 그것은 도전으로 비춰졌다"고 말했음.

 

그러나 대유행은 기존 데이터를 공유하고 마이닝(mining)하고 자원을 통합하는 데 새롭고 더 시급한 관심을 불러일으켰음. 오클랜드 소재 캘리포니아 디지털 라이브러리(California Digital Library)에 기반을 둔 데이터 공유 플랫폼 Dryad의 제품 관리자인 다니엘라 로웬버그(Daniela Lowenberg)"우리는 여러 분야에 걸쳐 제공(submissions)이 증가했으며 다른 저장소에서도 그러한 일이 일어나고 있다는 것을 알고 있다"고 말했음.

 

런던의 바이오의학 연구 전문가 웰컴(Wellcome)의 임상 데이터 공유 관리자인 조지나 험프리스(Georgina Humphreys)는 대부분의 과학자들은 최소한 원칙적으로 데이터 공유가 도덕적 의무(moral obligation)라는 데 동의한다고 말함. 연구자들이 더 많은 데이터에 접근할수록 바이러스를 더 빨리 이해하고 치료법과 백신을 개발할 수 있음.

 

웰컴은 지난 3월 금융서비스업체 마스터카드, & 멜린다 게이츠 재단과 손잡고 미국 워싱턴주 시애틀에 COVID-19 치료제 액셀러레이터(Therapeutic Accelerator)를 설립했으며, 이 펀드는 대유행을 막기 위한 약물과 치료제의 신속한 평가를 지원하는 기금으로, 결국 다른 병원균을 해결하기를 희망하고 있음. 데이터를 최대한 광범위하고 신속하게 공유하는 것이 이니셔티브의 핵심 목표였다고 험프리스는 말함.

 

글로벌 Cochrane COVID-19 Study Register에 따르면 COVID-19 치료를 위한 2,800개 이상의 관찰 임상시험이 현재 등재되어 있음. 험프리스는 더 큰 공유로의 전환이 2020년 말까지 성공적인 치료법을 개발하는 데 핵심이라고 말함. "연구자들은 그들의 데이터가 이용 가능한지 확인하는 것에 대해 더 걱정하기 때문에, 그들의 프로파일은 그것에 대한 신용을 얻지 못하는 것과 반대로 발생된다."고 그녀는 말함.

 

험프리스 등은 COVID-19 데이터를 공유하려는 수요의 급증이 지속적인 영향을 주는 마라톤으로 변하기를 바라고 있다. "데이터 공유의 중요성은 변하지 않았다; COVID-19는 그것이 얼마나 중요한지를 강조한다," 라고 로웬버그는 말한다. 게이츠재단 이사장인 마크 수즈만(Mark Suzman)은 성명에서 COVID-19 치료제 액셀러레이터 출범과 관련해 "COVID-19와 같은 발병으로부터 세계를 안전하게 만들려면 연구개발이 더 빠르게 진행될 수 있는 방법을 찾아야 한다"고 말함.

 

동남아시아에서 주로 일하는 런던 위생 및 열대 의과대학(London School of Hygiene and Tropical Medicine)의 보건-정책 연구원인 마르코 리바니(Marco Liverani)는 대부분의 데이터가 충분히 사용되지 않고 있다고 말함. "이차적인 데이터 세트를 사용하여 가치 있는 지식을 창출하는 것은 확실히 가능하다"고 그는 말함. "역사 연구뿐 아니라 학문 전반에 걸쳐 방대한 분량이 존재했던 지난 몇 년 동안에도 깊이 파고들 자료는 얼마든지 있다." 일부 기관과 자금 조달자는 데이터 공유를 장려하는 이니셔티브를 설계했음.

 

비록 그 관행이 유행하고 있지만, 그것은 복잡하고 법적, 윤리적, 과학적 고려에 대한 이해가 필요함. 다음은 일반적인 데이터 공유 오류를 피하는 여섯 가지 방법임.

 

데이터 기여 관리하기

데이터를 처리하고 분석하는 데 필요한 코드뿐만 아니라 -데이터 수집 방법을 포함한 데이터에 대한 정보- 충분한 메타데이터를 제공하십시오. 분석 프로그램에서 접근할 수 없는 형식의 파일-또는 기술적이고 기계적으로 읽을 수 있는 열 제목, 'readme' 파일 또는 다른 연구자가 이해하는 데 도움이 되는 사용 참고 사항이 없는 경우-은 덜 유용하다고 로웬버그는 말함. 그녀는 연구자들이 특정 데이터에 가장 적합한 저장소(repository)와 데이터 세트를 재사용하기 위해 필요한 것을 결정하기 위해 대학 사서들의 도움을 구할 것을 제안함.

 

개인정보의 익명화하기

인간대상 연구 참가자와 관련된 데이터를 제공할 때 적절한 윤리적, 법적 승인을 받도록 해야 한다고 로웬버그는 말함. 데이터는 적절히 익명화하고 식별을 해제해야 함. 그녀는 "COVID-19 데이터 제공에는 환자 이름과 전체 의무 기록과 같은 개인식별정보가 많이 포함되어 있기 때문에 주요한 수정이 필요하다"고 말했음. 이 정보는 공유할 수 없으므로 삭제해야 함.

 

데이터 사용 시 주의하기

험프리스는 "원시 데이터뿐만 아니라 프로토콜, 데이터 수집 방법과 위치, 초기 이유 등 데이터가 수집된 맥락을 반드시 이해해야 한다"고 말함. 함께 제공된 문서에서 명확하지 않은 경우 데이터를 생성한 팀에 문의하십시오. 샤바니는 "가능하면 콜라보레이션으로 만들어라"고 말함. 험프리스는 -사회과학과 인구조사 결과를 호스트하는- 영국 바이오뱅크(UK BioBank)나 영국 데이터 아카이브(UK Data Archive)와 같은 일부 제약회사와 데이터 저장소는 문의사항에 응답할 수 있는 직원이 있으며 사람들이 자신이 나열한(제공한) 데이터를 이용할 수 있기를 희망하고 있다고 덧붙였음.

 

팀의 통계 역량 확인하기

일부 과학자들은 여러 개의 복잡한 데이터 세트를 다루는 데 필요한 전문지식을 가지고 있지 않다고 험프리스는 말함. 그녀는 단일 연구를 분석하는 것은 다양한 출처의 풀링된 데이터에 대한 분석을 수행하는 것과 매우 다르며, 데이터 접근 요청이 필요한 기술적 능력을 증명하지 못하는 경우 이를 할 수 없다고 지적했음.

 

법적 의무 주의하기

샤바니는 특히 발병 초기 광란의 시기에 일부 연구자들은 질병 확산에 대한 데이터를 수집하기 위해 스마트폰 앱을 사용할 수도 있다고 말했음. 그러나 그러한 데이터의 향후 사용은 사전동의와 같은 국가별 요건의 대상이 될 수 있음. 특히 사람으로부터 이러한 데이터를 수집하거나 사용하는 연구자는 소속 기관의 감독이나 윤리위원회에 확인하여 연구 프로토콜이 제대로 되어 있는지, 진실성(integrity)에 대한 의문이 없는지 확인해야 함.

 

유전체학(genomics)과 같은 일부 데이터베이스는 개인 데이터의 오용으로부터 보호하고 프라이버시를 훼손하지 않기 위해 데이터 공유 계약을 요구함. 데이터 이용자들은 자신의 연구기관을 인증하고 협정이 위반될 경우 책임을 묻기 위해 배경 정보를 제공한다고 샤바니는 말함. 험프리스는 이러한 데이터에 접근하고자 하는 사람들은 어떤 합의도 소속 기관의 법률 팀에게 신속히 회람해야 한다고 말함.

 

데이터 생성자 확인하기

공유 데이터에 기반한 논문을 게재하는 경우, 데이터를 생성한 사람을 저자로 기재해야 하는지 여부를 확인해야 함. 예를 들어, 일부 저널은 논문의 지적 내용을 설계, 수집 또는 분석하는 모든 사람에 대해 저작자가 필요하다. 샤바니는 모든 논문이 데이터 생성자를 인정해야 하며 논문에 기초한 발표와 마찬가지로 원본 데이터에 대한 관련 정보를 포함해야 한다고 말함. 그녀는 데이터 생성자가 그러한 수준의 연대가 없다면 공유를 지속할 동기가 거의 없을 것이라고 말함.

 

연구자들은 세계적인 불평등 우려를 고려해야 함. 리바니 교수는 "데이터 공유에 관한 한 아프리카나 남미 개발 지역의 연구기관들이 데이터를 공유할 수도 있지만, 그 혜택은 고소득 국가의 학계에 종종 귀속된다"고 말했음. "저자들은 개발 도상국의 동료들이 그들이 받을 만한 어떤 저자 신용이나 인정을 받도록 해야 한다"고 그는 말함.

 

 

 

출처: https://www.nature.com/articles/d41586-020-01516-0 (2020.5.19.)




첨부파일
이미지 5월 5주 해외언론동향 (1).jpg (48.5KB / 다운로드  73)
한글 5월 5주 해외언론동향 기사(1).hwp (18.5KB / 다운로드  39)
이전 글
다음 글