Amazon AWS Certified Data Analytics - Specialty (DAS-C01日本語版) - DAS-C01日本語 Exam Practice Test

ある会社は、Amazon RDS で実行されるさまざまな顧客データベースからデータを読み取っています。データベースには多くの矛盾したフィールドが含まれています。たとえば、あるデータベースでは place_id である顧客レコード フィールドは、別のデータベースでは location_id です。この会社は、多くの顧客レコード フィールドが正確に一致しない場合でも、異なるデータベース間で顧客レコードをリンクしたいと考えています。これらの要件を満たす運用上のオーバーヘッドが最も少ないソリューションはどれですか?
Correct Answer: C
ある会社は、Amazon Redshift をデータ ウェアハウスとして使用しています。新しいテーブルには、機密データを含む列があります。テーブル内のデータは、最終的に、1 日に何度も実行されるいくつかの既存のクエリによって参照されます。
データ アナリストは、1,000 億行のデータを新しいテーブルに読み込む必要があります。これを行う前に、データ アナリストは、監査グループのメンバーのみが機密データを含む列を読み取ることができることを確認する必要があります。
データ アナリストは、メンテナンスのオーバーヘッドを最小限に抑えながら、これらの要件を満たすにはどうすればよいでしょうか?
Correct Answer: D
Explanation: Only visible for TrainingDump members. You can sign-up / login (it's free).
企業はパートナーからさまざまな頻度でデータセットを受信します。データセットには、ベースライン データと増分データが含まれます。企業は、データを再処理せずにすべてのデータセットを結合して保存する必要があります。
最小限の開発労力でこれらの要件を満たすソリューションはどれですか?
Correct Answer: C
Explanation: Only visible for TrainingDump members. You can sign-up / login (it's free).
大規模なマーケティング会社は、すべてのストリーミング ログを保存し、ほぼリアルタイムのダッシュボードを作成する必要があります。ダッシュボードは企業が重要なビジネス上の意思決定を行うために使用されるため、可用性が高くなければなりません。
これらの要件を満たすソリューションはどれですか?
Correct Answer: D
Explanation: Only visible for TrainingDump members. You can sign-up / login (it's free).
ある病院は、複数の病院や診療所から電子カルテ (EHR) システムからデータを取り込むための研究データ レイクを構築しています。EHR システムは互いに独立しており、共通の患者識別子はありません。データ エンジニアリング チームは機械学習 (ML) の経験がなく、取り込まれた記録の一意の患者 ID を生成するように依頼されました。
このタスクを達成するソリューションはどれですか?
Correct Answer: C
Explanation: Only visible for TrainingDump members. You can sign-up / login (it's free).
ある会社には、Amazon Kinesis Client Library (KCL) を使用して Kinesis データ ストリームからレコードを読み取るアプリケーションがあります。
マーケティング キャンペーンが成功した後、アプリケーションの使用が大幅に増加しました。その結果、データ アナリストはデータ ストリーム内のいくつかのシャードを分割する必要がありました。シャードが分割されると、アプリケーションは ExpiredIteratorExceptions エラーを散発的にスローし始めました。
これを解決するために、データ アナリストは何をすべきですか?
Correct Answer: A
銀行は Amazon S3 データレイクを構築しています。銀行は、パーソナライズされた推奨事項など、顧客データのニーズに対応する単一のデータ リポジトリを望んでいます。銀行は、Amazon Kinesis Data Firehose を使用して、顧客の個人情報、銀行口座、トランザクションをトランザクション リレーショナル データベースからほぼリアルタイムで取り込む必要があります。
S3 バケットに保存される個人を特定できる情報 (Pll) はすべてマスクする必要があります。銀行は S3 バケットのバージョン管理を有効にしました。
これらの要件を満たすソリューションはどれですか?
Correct Answer: B
ストリーミング アプリケーションは、Amazon Kinesis Data Streams からデータを読み取り、そのデータを 10 秒ごとにすぐに Amazon S3 バケットに書き込みます。アプリケーションは何百ものシャードからデータを読み取っています。別の要件があるため、バッチ間隔を変更することはできません。データは Amazon Athen によってアクセスされています。ユーザーは、時間の経過とともにクエリのパフォーマンスが低下していることに気付きます。
クエリのパフォーマンスを向上させるのに役立つアクションはどれですか?
Correct Answer: D
Explanation: Only visible for TrainingDump members. You can sign-up / login (it's free).
ある会社は、ストレージ用に履歴データセットを Amazon S3 に送信しています。同社のデータエンジニアは、Amazon Athen を使用してこれらのデータセットを分析できるようにしたいと考えています。エンジニアは、暗号化に AWS ソリューションを使用して、Athena クエリの結果を S3 結果の場所で暗号化することも望んでいます。クエリ結果を暗号化するための要件は次のとおりです。
プライマリ データセットのクエリ結果の暗号化には、カスタム キーを使用します。
他のすべてのクエリ結果には汎用暗号化を使用します。
キーがいつ誰によって使用されたかを示す、プライマリ データセット クエリの監査証跡を提供します。
これらの要件を満たすソリューションはどれですか?
Correct Answer: A
0
0
0
0