본문 바로가기

IT/Search

한국어.........

1.1 음절의

음절은 한 번에 소리낼 수 있는 소리마디로서, 언어의 형식인 '음성'을 이용하여 문장을 분석한 단위이다.

1.2. 음절의 특성


     circle03_blue.gif 소리를 중심으로 하여 분석한 것이다.
     circle03_blue.gif 자음, 모음이라는 음운으로 나누어진다.
     circle03_blue.gif 음절의 수는 발음이 되는 모음의 개수이다.
     circle03_blue.gif 한 문장에서 글자 수는 음절의 수와 똑같다.

2.1 어절의 뜻


어절은 띄어 쓴 마디나 끊어 읽는 마디로서, 언어 사용상 의미 파악에 편리하며, 문장 성분의 단위와 일치한다.

2.2 어절의 특성

      circle03_blue.gif 끊어읽기와 띄어쓰기의 마디와 일치한다.
      circle03_blue.gif 하나 이상의 낱말이 모여서 이루어진다.

3.1 낱말의 뜻

      '낱말'은 문장을 이루는 기본 단위로서, '어절'을 의미를 고려하여 더 작게 나눈 것이다.
      낱말 분석의 기준이 되는 것은 '의미적 자립성'과 '분리성'이다.

3.2 낱말의 구성


의미적으로 자립할 수 있는 말

낱말은 보통 의미적으로 자립할 수 있는 하나의 단위를 말한다. 하나 이상의 형태소로 구성된다.
(예) 나, 영희, 감나무, 진달래꽃, 동물원, 예쁘다, 공부한다, 맛있다

자립하는 말에 붙어 쉽게 분리될 수 있는 말

홀로 설 수 없는 말이지만, 다른 말에 쉽게 붙어 낱말을 이룰 수 있고, 다른 낱말로 바꿔 쓸 수 있는 분리성 때문에 낱말로 인정한다.
(예) 이, 는, 을, 의, 만, 도, 에게, 부터, 까지, 이다


출처 : http://proi.edupia.com/contents/proicontents/proi/proi/middle/SchoolBook/seb/jd_seb1_content.asp?nTerm=2&nYear=7&nConID=928&nCatID=431&nDaeNumber=

'IT > Search' 카테고리의 다른 글

N-gram 알고리즘 기초 두번째  (0) 2014.10.21
N-gram 알고리즘 기초  (0) 2014.10.21
구글 검색엔진에 관해  (0) 2014.07.25
크롤링과 색인(Crawling and Indexing)  (0) 2014.07.25
웹 크롤러란?  (0) 2014.07.25