Amazon AWS Certified Data Analytics - Specialty (DAS-C01 Korean Version) - DAS-C01 Korean Exam Practice Test

제조 회사는 Amazon S3를 사용하여 데이터를 저장합니다.
ㅏ. 이 회사는 AWS Lake Formation을 사용하여 이러한 데이터 자산에 대한 세분화된 수준의 보안을 제공하려고 합니다. 데이터는 Apache Parquet 형식입니다. 회사는 컨설턴트가 데이터 레이크를 구축할 마감일을 정했습니다.
컨설턴트는 이러한 요구 사항을 충족하는 가장 비용 효율적인 솔루션을 어떻게 만들어야 합니까?
Correct Answer: B
Explanation: Only visible for TrainingDump members. You can sign-up / login (it's free).
한 회사가 AWS Lake Formation을 사용하여 데이터 레이크를 생성하고 있습니다. 데이터 레이크에 저장될 데이터에는 민감한 고객 정보가 포함되어 있으며 규제 요구 사항을 충족하기 위해 AWS KMS(AWS Key Management Service) 고객 관리형 키를 사용하여 저장 시 암호화해야 합니다.
회사는 이러한 요구 사항을 충족하기 위해 어떻게 데이터 레이크에 데이터를 저장할 수 있습니까?
Correct Answer: C
한 회사는 현재 Amazon Athena를 사용하여 글로벌 데이터 세트를 쿼리합니다. 지역 데이터는 us-east-1 및 us-west-2 지역의 Amazon S3에 저장됩니다. 데이터는 암호화되지 않습니다. 쿼리 프로세스를 단순화하고 중앙에서 관리하기 위해 회사는 us-west-2의 Athena를 사용하여 두 리전의 Amazon S3에서 데이터를 쿼리하려고 합니다. 솔루션은 가능한 한 저렴해야 합니다.
이 목표를 달성하기 위해 회사는 무엇을 해야 합니까?
Correct Answer: A
한 회사에서 자동 머신 러닝(ML) RCF(Random Cut Forest) 알고리즘을 사용하여 계절성 및 추세 감지, 외부 제외 및 결측값 대치와 같은 복잡한 실제 시나리오를 시각화하려고 합니다.
이 프로젝트에 참여하는 팀은 비기술적이며 최소한의 관리 오버헤드가 필요한 즉시 사용 가능한 솔루션을 찾고 있습니다.
이러한 요구 사항을 충족하는 솔루션은 무엇입니까?
Correct Answer: C
의료 회사는 여러 데이터 소스에서 환자 데이터를 수집하여 Amazon S3 스테이징 버킷에 저장합니다. AWS Glue ETL 작업은 S3 기반 데이터 레이크에 기록된 데이터를 변환하여 Amazon Athen a를 사용하여 쿼리합니다. 회사는 기록에 공통된 고유 식별자가 없는 경우에도 환자 기록을 일치시키려고 합니다.
이 요구 사항을 충족하는 솔루션은 무엇입니까?
Correct Answer: D
데이터 엔지니어가 AWS Glue ETL 작업을 사용하여 빈번한 간격으로 데이터를 처리합니다. 처리된 데이터는 Amazon S3에 복사됩니다. ETL 작업은 15분마다 실행됩니다. AWS Glue 데이터 카탈로그 파티션은 각 작업 완료 후 자동으로 업데이트되어야 합니다. 어떤 솔루션이 이러한 요구 사항을 가장 비용 효율적으로 충족합니까?
Correct Answer: A
회사에 암호화된 Amazon Redshift 클러스터가 있습니다. 이 회사는 최근 Amazon Redshift 감사 로그를 활성화했으며 감사 로그가 유휴 상태에서도 암호화되도록 해야 합니다. 로그는 1년간 보관됩니다. 감사자는 한 달에 한 번 로그를 쿼리합니다.
이러한 요구 사항을 충족하는 가장 비용 효율적인 방법은 무엇입니까?
Correct Answer: B
IoT 회사는 지능형 매트리스에서 밤새 수면을 추적하기 위해 데이터를 수집하는 새로운 장치를 출시하려고 합니다. 센서는 Amazon S3 버킷에 업로드될 데이터를 보냅니다. 침대당 매일 밤 약 2MB의 데이터가 생성됩니다. 각 사용자에 대해 데이터를 처리하고 요약해야 하며 결과를 가능한 한 빨리 사용할 수 있어야 합니다. 프로세스의 일부는 시간 창 및 기타 기능으로 구성됩니다. Python 스크립트를 사용한 테스트를 기반으로 모든 실행에는 약 1GB의 메모리가 필요하며 몇 분 안에 완료됩니다.
가장 비용 효율적인 방식으로 스크립트를 실행하는 솔루션은 무엇입니까?
Correct Answer: B
미디어 분석 회사는 소셜 미디어 게시물 스트림을 소비합니다. 게시물은 user_id로 분할된 Amazon Kinesis 데이터 스트림으로 전송됩니다. AWS Lambda 함수는 게시물을 Amazon Elasticsearch 클러스터에 로드하기 전에 레코드를 검색하고 콘텐츠를 검증합니다. 유효성 검사 프로세스는 지정된 사용자의 게시물을 받은 순서대로 받아야 합니다. 데이터 분석가는 사용량이 많은 시간에 소셜 미디어 플랫폼 게시물이 Elasticsearch 클러스터에 표시되는 데 1시간 이상 걸린다는 사실을 알아냈습니다.
데이터 분석가는 이 대기 시간을 어떻게 줄여야 합니까?
Correct Answer: D
한 회사에서 차량을 모니터링하는 서비스를 구축하고 있습니다. 이 회사는 각 차량의 장치에서 IoT 데이터를 수집하고 거의 실시간으로 Amazon Redshift에 데이터를 로드합니다. 차량 소유자는 차량 참조 데이터가 포함된 .csv 파일을 하루 중 서로 다른 시간에 Amazon S3에 업로드합니다. 야간 프로세스는 Amazon S3에서 Amazon Redshift로 차량 참조 데이터를 로드합니다. 이 회사는 장치의 IoT 데이터와 차량 참조 데이터를 결합하여 보고 및 대시보드를 강화합니다. 플릿 소유자는 대시보드가 ​​업데이트될 때까지 하루를 기다리느라 좌절하고 있습니다.
참조 데이터를 Amazon S3에 업로드하는 것과 소유자의 대시보드에 변경 사항이 표시되는 것 사이에 가장 짧은 지연 시간을 제공하는 솔루션은 무엇입니까?
Correct Answer: A
보험 회사에는 사전 정의된 일정 없이 Amazon Kinesis Data Firehose 전송 스트림을 통해 Amazon S3 버킷으로 전송되는 JSON 형식의 원시 데이터가 있습니다. AWS Glue 크롤러는 S3 버킷에 저장된 테이블의 데이터 카탈로그에서 스키마를 업데이트하기 위해 8시간마다 실행되도록 예약됩니다. 데이터 분석가는 AWS Glue 데이터 카탈로그를 메타스토어로 설정한 Amazon EMR에서 Apache Spark SQL을 사용하여 데이터를 분석합니다. 데이터 분석가들은 때때로 그들이 받는 데이터가 오래되었다고 말합니다. 데이터 엔지니어는 최신 데이터에 대한 액세스를 제공해야 합니다.
어떤 솔루션이 이러한 요구 사항을 충족합니까?
Correct Answer: A
Explanation: Only visible for TrainingDump members. You can sign-up / login (it's free).
0
0
0
0