본문 바로가기
AI

[자연어 처리] 언어학에 대해서 배워보자

by 은구잇 2021. 12. 27.
728x90

1. 언어학의 기본 원리

언어를 이루는 단위 : 음절, 형태소, 어절 ,품사

언어의 구조 : 구구조, 의존구조

 

단위 하나하나 자세히 알아보겠습니다.


2. 언어를 이루는 단위

1 ) 음절 (Syllable)

 - 언어를 말하고 들을 때, 하나의 덩어리로 여겨지는 가장 작은 발화의 단위

 - 초성, 중성, 종성으로 이루어져 있음

 - 초성은 음절에서 가장 처음에 오는 소리로 자음(Consonant, C)

 - 중성은 가운데 소리로 모음 (Vowel, V)

 - 종성은 마지막 소리로 자음

 

음절의 예시 

1) 이 문장에서 음절은 몇 개일까? 

2) 이 문장에서 음저른 멷 개일까? -> 이렇게 소리나는대로 적었을때의 한 글자를 말함

 

2) 형태소(Morpheme)

- 언어에서 의미를 가지는 가장 작은 단위로 형태소를 쪼개면 더이상 기능이나 의미를 갖지 않음.

- 실질적인 의미 

  실질 형태소(어휘), 형식 형태로(문법 형태소)로 나뉨

- 자립성의 유무

   자립 형태소 : 문장에서 홀로 쓰일 수 있음.

   의존 형태소 : 다른 형태소와 결합되어 사용될 수 있음

 

 

3) 어절

- 어절은 띄어쓰기 단위

- 한개 이상의 형태소가 모여 구성된 단위로 어절을 중심으로 끊어서 말함.

4) 품사

  • - 문장 내에서 단어가 수행하는 역할을 기준으로 체언, 수식언, 관계언, 독립언, 용언으로 나눔
  • - 형태에 따라서는 가변어(용언)와 불변어(체언, 수식언, 관계언, 독립언)
  • - 의미에 따라서는 명사, 대명사, 수사, 관형사, 부사, 조사, 감탄사, 동사, 형용사 9품사로 나눔.

 

3. 언어의 구조

1) 구구조

  • 구구조란 단어를 구성하고 있는 요소들이 서로 끌어당겨 한 덩어리가 됨으로써 형성되는 일정한 구조
  • 문장을 구성하는 2개 이상의 구성요소는 선행관계, 지배관계를 맺음.
  • 표면적으로 같은 언어 요소와 순서로 구성되어있어도 서로 다른 구조로 기술해서 뜻을 파악 할 수 있음.

 

2) 의존구조

  • 문장에 각 단어의 지배소와 의존소를 파악해서 의존관계를 분석하는 것.
  • 한국어는 비교적 어순이 자유로워서 의존 구문 분석이 주로 이용됨.
  • ex ) 과학자들은 우주에서 고래에 대해 공부한다 / 과학자들은 우주에 있는 고래에 대해 공부한다.
  • 위에 문장에서 의미를 파악해서 모호성을 해결할 수 있음.