반응형 자연어처리5 [Machine Learning] N-gram이란 무엇인가? 텍스트 분석의 핵심 이해하기 언어는 인간 커뮤니케이션의 기본 요소입니다. 디지털 시대에 접어들며, 우리는 매일 방대한 양의 텍스트 데이터와 상호작용하게 되었고, 이로 인해 텍스트 분석의 중요성이 급격히 증가했습니다. 그 중심에는 'N-gram'이라는 개념이 자리잡고 있습니다. 📖🔍 이 블로그 포스팅에서는 N-gram의 개념을 소개하고, 그것이 언어 처리와 텍스트 분석에 어떻게 활용되는지 탐구해보겠습니다. N-gram N-gram은 텍스트나 연설에서 N개의 연속적인 항목(문자, 음절, 단어 등)의 시퀀스를 말합니다. 'N'은 숫자를 나타내며, 이는 시퀀스에 포함된 항목의 수를 의미합니다. 예를 들어, "I love language processing" 이라는 문장에서 2-gram(또는 bigram)은 "I love", "love la.. 2024. 3. 13. 이전 1 2 다음 반응형