1.1 음절의 뜻
음절은 한 번에 소리낼 수 있는 소리마디로서, 언어의 형식인 '음성'을 이용하여 문장을 분석한 단위이다.
1.2. 음절의 특성
소리를 중심으로 하여 분석한 것이다.
자음, 모음이라는 음운으로 나누어진다.
음절의 수는 발음이 되는 모음의 개수이다.
한 문장에서 글자 수는 음절의 수와 똑같다.
2.1 어절의 뜻
어절은 띄어 쓴 마디나 끊어 읽는 마디로서, 언어 사용상 의미 파악에 편리하며, 문장 성분의 단위와 일치한다.
2.2 어절의 특성
끊어읽기와 띄어쓰기의 마디와 일치한다.
하나 이상의 낱말이 모여서 이루어진다.
3.1 낱말의 뜻
'낱말'은 문장을 이루는 기본 단위로서, '어절'을 의미를 고려하여 더 작게 나눈 것이다.
낱말 분석의 기준이 되는 것은 '의미적 자립성'과 '분리성'이다.
3.2 낱말의 구성
의미적으로 자립할 수 있는 말 |
낱말은 보통 의미적으로 자립할 수 있는 하나의 단위를 말한다. 하나 이상의 형태소로 구성된다. |
자립하는 말에 붙어 쉽게 분리될 수 있는 말 |
홀로 설 수 없는 말이지만, 다른 말에 쉽게 붙어 낱말을 이룰 수 있고, 다른 낱말로 바꿔 쓸 수 있는 분리성 때문에 낱말로 인정한다. |
출처 : http://proi.edupia.com/contents/proicontents/proi/proi/middle/SchoolBook/seb/jd_seb1_content.asp?nTerm=2&nYear=7&nConID=928&nCatID=431&nDaeNumber=
'IT > Search' 카테고리의 다른 글
N-gram 알고리즘 기초 두번째 (0) | 2014.10.21 |
---|---|
N-gram 알고리즘 기초 (0) | 2014.10.21 |
구글 검색엔진에 관해 (0) | 2014.07.25 |
크롤링과 색인(Crawling and Indexing) (0) | 2014.07.25 |
웹 크롤러란? (0) | 2014.07.25 |