Amazon Web Services 한국 블로그
RODA(Registry of Open Data on AWS), 오픈 데이터 호스팅 서비스 출시
거의 10년 전에 제 동료인 Deepak Singh은 자신의 게시물 Paging Researchers, Analysts, and Developers에서 AWS 공개 데이터 세트를 소개했습니다. Deepak은 여전히 AWS 팀의 중요한 일원이며 퍼블릭 데이터 세트 프로그램이 여전히 강력하다는 사실을 알리게 되어 기쁩니다!
오늘 우리는 개방형 및 공개 데이터를 호스팅하는 새로운 시스템인 Registry of Open Data on AWS(RODA)를 발표합니다. 이 레지스트리는 기존 공개 데이터 세트를 포함하며, 이 레지스트리를 통해 누구든 AWS에서 액세스 및 분석될 수 있도록 자신의 데이터 세트를 추가할 수 있습니다.
레지스트리 내부
홈 페이지에 레지스트리의 모든 데이터 세트가 표시됩니다.
검색어를 입력하면 목록이 축소되면서 일치하는 데이터 세트만 표시됩니다.
각 데이터 세트에는 사용 예제, 라이선스 정보 및 AWS에서 데이터 세트를 찾아서 액세스하는 데 필요한 정보가 포함된 관련 세부 정보 페이지가 있습니다.
이 경우 간단한 CLI 명령을 사용하여 데이터에 액세스할 수 있습니다.
프로그래밍 방식으로 액세스하거나 EC2 인스턴스로 데이터를 다운로드할 수 있습니다.
리포지토리에 추가
공개적으로 사용 가능하며 RODA에 추가하려는 데이터 세트가 있는 경우 풀 요청을 AWS에 보낼 수 있습니다. open-data-registry 리포지토리로 가서 CONTRIBUTING 문서를 읽고 datasets 디렉터리에 있는 기존 파일 중 하나를 모델로 사용하여 데이터 세트를 기술하는 YAML 파일을 만드십시오.
AWS에서는 풀 요청을 정기적으로 검토합니다. 리포지토리에서 “별 모양 버튼을 사용하거나” 리포지토리를 확인하여 추가 사항 및 변경 사항을 추적할 수 있습니다.
강력하고 흥미로운 방법으로 데이터를 사용하는 방법을 알려주는 블로그 게시물 및 앱은 물론 새로운 데이터 세트가 쇄도할 것을 기대합니다. 멋진 결과가 있으면 알려 주시기 바랍니다.
— Jeff;