잘난 척을 위한 한 줄 요약N-gram은 텍스트를 한 단어씩 따로 보지 않고, 연속해서 붙어 나오는 단어 묶음으로 보는 방식이라서 “단어 자체”보다 “단어의 연결 패턴”을 잡아내는 데 강하다. N-Gram, 컴퓨터는 왜 단어 하나보다 ‘붙어 다니는 단어 묶음’을 더 중요하게 볼까먼저, N-Gram이 뭔지부터N-gram은 텍스트를 연속된 N개의 토큰 묶음으로 잘라 보는 방식이다.여기서 토큰은 보통 단어일 때가 많지만, 문자 단위일 수도 있다. 즉, 핵심은 아주 단순하다.1개씩 보면 1-gram2개씩 붙여 보면 2-gram3개씩 붙여 보면 3-gram 예를 들어 문장이 이렇게 있다고 해보자.“나는 오늘 커피를 마셨다”이걸 단어 기준으로 보면,1-gram나는오늘커피를마셨다2-gram나는 오늘오늘 커피를커피를 ..