6장 텍스트 시퀀스를 딥러닝1 시퀀스 데이터를 위한 딥러닝 모델은 기본적으로 순환 신경망(Recurrent Neural Network)과 1D 컨브넷이 있다. 6.1 텍스트 데이터 다루기 텍스트 데이터를 딥러닝 학습을 위한 수치형 텐서로 변환하여 딥러닝학습을 진행한다. 텍스트를 단어로 나누고 각 단어를 하나의 벡터로 변환 텍스트를 문자로 나누고 각 문자를 하나의 벡터로 변환 텍스트에서 단어나 문자의 n-그램을 추추랗여 각 n-그램을 하나의 백터로 변환 6.1.1 단어와 문자의 원-핫 인코딩 모든 단어에 고유한 정수 인덱스틀 부여하고 이 정수 인덱스 i를 크기가 N인 이진 벡터로 변환한다. 이 벡터는 i번째 원소만 1이고 나머지는 0이다. Tokenizer 원-핫 인코딩: 각각의 항목을 벡터차원으로 변환하..