選取您的 Cookie 偏好設定

我們使用提供自身網站和服務所需的基本 Cookie 和類似工具。我們使用效能 Cookie 收集匿名統計資料,以便了解客戶如何使用我們的網站並進行改進。基本 Cookie 無法停用,但可以按一下「自訂」或「拒絕」以拒絕效能 Cookie。

如果您同意,AWS 與經核准的第三方也會使用 Cookie 提供實用的網站功能、記住您的偏好設定,並顯示相關內容,包括相關廣告。若要接受或拒絕所有非必要 Cookie,請按一下「接受」或「拒絕」。若要進行更詳細的選擇,請按一下「自訂」。

EMRFS S3 優化遞交通訊協定和分段上傳 - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

EMRFS S3 優化遞交通訊協定和分段上傳

若要利用 EMRFS S3 優化遞交通訊協定中的動態分割區覆寫優化,則必須在 Amazon EMR 中啟用多段上傳。分段上傳預設為啟用。您可以視需要重新啟用。如需詳細資訊,請參閱《Amazon EMR 管理指南》中的設定適用於 Amazon S3 的分段上傳

動態分割區覆寫期間,EMRFS S3 優化遞交通訊協定利用分段上傳類似交易的特性,確保由任務嘗試寫入的檔案只會在作業遞交時顯示於作業的輸出位置。透過以此方式使用多段上傳,遞交通訊協定將提升作業遞交效能,讓其比預設 SQLHadoopMapReduceCommitProtocol 更佳。使用 EMRFS S3 優化遞交通訊協定時,應考量傳統分段上傳行為的某些主要差異:

  • 無論檔案大小,分段上傳會一律執行。這不同於 EMRFS 的預設行為 (fs.s3n.multipart.uploads.split.size 屬性會控制分段上傳觸發時的檔案大小)。

  • 分段上傳會在不完整狀態維持較長的期間,直到任務遞交或中止。這不同於 EMRFS 的預設行為 (分段上傳會在任務完成寫入特定檔案時完成)。

由於這些差異,如果 Spark Executor JVM 在任務執行和寫入資料至 Amazon S3 時當機或終止,或者 Spark 驅動程式 JVM 在作業執行時當機或終止,則更可能會留下不完整的分段上傳。因此,在您使用 EMRFS S3 優化遞交通訊協定時,請務必依照最佳實務來管理失敗的分段上傳。如需詳細資訊,請參閱《Amazon EMR 管理指南》中有關使用 Amazon S3 儲存貯體的最佳實務

隱私權網站條款Cookie 偏好設定
© 2025, Amazon Web Services, Inc.或其附屬公司。保留所有權利。