本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
通過自定義詞彙和自定義語言模型提高轉錄準確性
如果您的媒體包含特定網域或非標準字詞 (例如品牌名稱、縮寫字、技術文字和行話),Amazon Transcribe可能無法在轉錄輸出中正確擷取這些字詞。
若要更正轉錄不準確性並針對特定使用案例自訂輸出,您可以建立自訂詞彙和自訂語言模型。
-
自訂詞彙旨在調整和提高所有情況下特定單詞的識別和格式。這涉及到提Amazon Transcribe供單詞和, 可選, 發音和顯示形式.
如果未Amazon Transcribe正確轉譯成績單中的特定詞彙,您可以建立自訂字彙檔案,告訴Amazon Transcribe您希望這些字詞的顯示方式。這種特定於單詞的方法最適合用於糾正品牌名稱和縮略詞之類的術語。
-
自訂語言模型旨在捕獲與術語相關聯的上下文。這涉及提Amazon Transcribe供大量特定於域的文本數據。
如果無法Amazon Transcribe正確呈現技術術語,或在成績單中使用不正確的同音字詞,您可以建立自訂語言模型來教導Amazon Transcribe您的網域特定語言。例如,自定義語言模型可以了解何時使用「浮冰」(浮冰)與「流」(線性流)。
這種情境感知方法最適合轉錄大量網域特定語音。自定義語言模型可以產生顯著的準確性提高單獨自定義詞彙。使用批次轉錄時,您可以在請求中同時包含自訂語言模型和自訂字彙。
提示
若要達到最高的轉錄準確度,請將自訂字彙與您的自訂語言模型搭配使用。
如需建立和使用自訂字彙的視訊逐步解說,請參閱:
如需建立和使用自訂語言模型的視訊逐步解說,請參閱: