텍스트 분류 - TensorFlow 작동 방식 - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

텍스트 분류 - TensorFlow 작동 방식

Text Classification - TensorFlow algorithm은 텍스트를 출력 클래스 레이블 중 하나로 분류합니다. 와 같은 딥 러닝 네트워크BERT는 텍스트 분류에 매우 정확합니다. 또한 와 같은 대규모 텍스트 데이터 세트에 대해 훈련된 딥 러닝 네트워크가 있으며 TextNet, 약 11,000개의 범주를 가진 1,100만 개 이상의 텍스트가 있습니다. 네트워크가 TextNet 데이터로 훈련된 후 특정 포커스가 있는 데이터 세트에서 네트워크를 미세 조정하여 더 구체적인 텍스트 분류 작업을 수행할 수 있습니다. Amazon SageMaker Text Classification - TensorFlow algorithm은 TensorFlow Hub에서 사용할 수 있는 많은 사전 훈련된 모델에서 전송 학습을 지원합니다.

훈련 데이터의 클래스 레이블 수에 따라 선택한 사전 훈련된 TensorFlow 모델에 텍스트 분류 계층이 연결됩니다. 분류 계층은 드롭아웃 계층, 밀도 계층, 2표준 정규화가 적용된 완전 연결 계층으로 구성되며 무작위 가중치로 초기화됩니다. 드롭아웃 계층의 드롭아웃 비율에 대한 하이퍼파라미터 값과 밀도 계층의 L2 정규화 계수를 변경할 수 있습니다.

네트워크 전체(사전 훈련 모델 포함)를 미세 조정하거나 새 훈련 데이터로 상위 분류 계층만 미세 조정할 수 있습니다. 이 전이 학습 메서드를 사용하면 더 작은 데이터 세트로 훈련할 수 있습니다.