[딥러닝] 단층 퍼셉트론의 한계(XOR 게이트)와 비선형함수의 등장

딥러닝, 논문 리뷰

[딥러닝] 단층 퍼셉트론의 한계(XOR 게이트)와 비선형함수의 등장

cheorish 2024. 12. 27. 16:06

단층 퍼셉트론

인공신경망의 가장 기초적인 형태 로젠트 블랑크 아저씨의 의해서 처음 제기됨

은닉층 없이 입력층과 출력층만 존재하는 가장 간단한 구조의 단층 신경망

출처 : https://lcyking.tistory.com/entry/%ED%8D%BC%EC%85%89%ED%8A%B8%EB%A1%A0%EC%9D%98-%EA%B0%9C%EC%9A%94

계산식

\(y = f\left(\sum_{i=1}^{n} w_i x_i + b \right)\)

단순하게 입력 값과 가중치를 곱한 값에 편향 값을 구한 값을 최종 출력단계에서 임계치에 도달하면 1 도달하지 못하면 0을 내뱉는(정수) 간단한 신호시스템과도 같은 구조이다.

XOR게이트

단층 퍼셉트론은 선형분류만을 가능하게끔 구성되어 있는데, 직선 하나로 데이터가 분류될 수 있는 문제만을 해결할 수 있다.

왜 그런지에 대해서 정리하려고 한다.

출처 : https://velog.io/@jhdai_ly/%EB%94%A5%EB%9F%AC%EB%8B%9DDL%ED%8D%BC%EC%85%89%ED%8A%B8%EB%A1%A0Perceptron2-%EB%8B%A4%EC%B8%B5-%ED%8D%BC%EC%85%89%ED%8A%B8%EB%A1%A0-XOR-%EA%B2%8C%EC%9D%B4%ED%8A%B8-%EA%B5%AC%ED%98%84-NAND-%EC%8B%A0%EA%B2%BD%EB%A7%9D-%EB%8F%84%EC%9E%85

상기 그림에 보여지는대로 XOR 게이트는 한 개의 선으로는 설명할 수 없는 상황이 벌어지게 되는데, 그걸 해결하고자 은닉층과 비선형 활성화 함수를 사용하여 비선형 문제를 해결할 수 있게한다.

어떻게?

은닉층: 데이터 패턴을 다양한 비선형 변환을 통해 다차원 공간으로 복잡하게 비튼다
출력층: 비틀어진 다차원 데이터를 선형 결합하여 최종 결과를 도출
결론: 데이터를 고차원 공간에서 선형적으로 분리할 수 있는 상태로 변환

수식:

은닉층에서 비선형 변환 적용
- \(h_1 = f(W_1x + b_1)\)
두 번째 은닉층(있을 경우)
- \(h_2 = f(W_2h_1 + b_2)\)
출력층에서 선형 결합
- \(y= g(W_3h_2 + b_3)\)

수식 설명:

\(f:\) 비선형 활성화 함수
\(g:\) 출력층 활성화 함수
\(W:\) 가중치 행렬
\(b:\) 편향

'딥러닝, 논문 리뷰' 카테고리의 다른 글

[딥러닝] BCE, MSE를 단순 분류, 회귀 문제에서만 사용했다고? - Deep Dive 1편(Loss Function편) (4)	2025.01.01
[딥러닝] Word2Vec 논문 리뷰 전 분석 - 1 (4)	2025.01.01
[딥러닝] RNN, LSTM, GRU Sequence - 1 (2)	2024.12.27
[딥러닝] AutoEncoder란? - 신경망 아키텍처 (1)	2024.12.20
[딥러닝, 논문리뷰] BERT모델과 HuggingFace Trainer를 이용한 KoBERT 감정분석 (7)	2024.12.20

현재글[딥러닝] 단층 퍼셉트론의 한계(XOR 게이트)와 비선형함수의 등장

으죨

영업, 데이터분석, ML/DL 공부한 내용 정리하는 블로그

Seq2Seq, BCE, ViT, 퍼셉트론, 딥러닝, deep learning, DeepLearning, encoder, llm, nlp, 논문리뷰, 손실함수, 최적화, MSE, Attention, 자연어처리, 멀티모달, 임베딩, Deep Dive, transformer,

Today :
Yesterday :

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

으죨