개발자식

[Pytorch] nn.Embedding 임베딩 벡터 만들기 본문

AI/Pytorch

[Pytorch] nn.Embedding 임베딩 벡터 만들기

밍츠 2022. 10. 20. 01:38

파이토치에서 임베딩 벡터를 사용하는 방법

  • 임베딩 층을 만들어 훈련 데이터로부터 처음부터 임베딩 벡터를 학습하는 방법
  • 미리 사전에 훈련된 임베딩 벡터들을 가져와 사용하는 방법

 

여기서 첫 번째 방법으로 구현하려면 nn.Embedding()를 사용한다.

  • nn.Embedding은 크게 두 가지 인자를 받는데 각각 num_embeddings과 embedding_dim입니다.
  • num_embeddings : 임베딩을 할 단어들의 개수. 다시 말해 단어 집합의 크기입니다.
  • embedding_dim : 임베딩 할 벡터의 차원입니다. 사용자가 정해주는 하이퍼파라미터입니다.
  • padding_idx : 선택적으로 사용하는 인자입니다. 패딩을 위한 토큰의 인덱스를 알려줍니다.
Comments