AI
[자연어처리] 자연어 처리 기초 이론
은구잇
2021. 12. 27. 16:45
728x90
1. 자연어 처리란?
자연어 : 사람들의 사회생활에서 자연스럽게 발생해서 쓰이는 언어
자연어 처리는 사람들이 사용하는 자연어를 컴퓨터를 가지고 이해하고 생성하도록 하는 연구
2. 자연어 처리 응용분야
- 기계번역
- 음성인식
- 개인 비서 서비스
- 인공지능 스피커
3. 자연어처리 연구의 패러다임
1 ) 규칙기반
기계 번역 : 문장을 형태소 단위로 분해해서 그 안에 규칙 사용하여 번역
명령 인식 : 문장에서 목적어, 동사 등이 위치하는 규칙을 이용해 대상과 행동 이해
2) 통계 기반
단어나 어구 사이에 통계적으로 유의미한 값이 도출된다는 가정
사전에 수집된 대량의 문장들(코퍼스)를 처리해야 함
조건부 확률이라는 수학적 개념이 핵심적
통계적인 분석의 한계 -> 복잡한 규칙 처리에는 어려움이 있음
3) 딥러닝 기반
알고리즘 : 어떤 상황에 어떻게 어떤 값을 계산해야 하는지 사전에 지정된 연산 흐름
기계학습 : 입력으로 들어올 데이터를 대입시켜 알고리즙이 스스로 연산 가중치를 학습하게 함.
딥러닝 : 신경망 구조에서 은닉층 수를 많이 늘린것, 여러 복잡한 특징들을 처리할 수 있게 되어 각광받고 있음.
4. 딥러닝을 사용하는 자연어처리 연구
단어 임베딩
자연어로 되어있는 문장을 컴퓨터가 받아들일 수 있또록 하는 문장의 전처리 방법
단어간 연관성을 유지하는 벡터화 하는 방법이 많이 쓰임
문법적으로만 사용되는 단어는 일반적으로 삭제
5. 딥러닝을 사용하는 자연어처리 연구
코퍼스
매우 많은 수의 문장을 정제하여 모아둔 것
통계/딥러닝 기반 자연어 처리에서 가장 핵심을 담당하는 자료
감이 안잡혀서 토할거 같습니다..