Neural Network

Neural Network

신경망

자동으로 학습

활성화 함수

계단 함수

파이썬으로 구현

def step_function(x):
    return np.array(x > 0, dtype=np.int)

X = np.arange(-5.0, 5.0, 0.1)
Y = step_function(X)
plt.plot(X, Y)
plt.ylim(-0.1, 1.1)
plt.show()

결과

시그모이드 함수

파이썬으로 구현

def sigmoid(x):
    return 1 / (1 + np.exp(-x))    

X = np.arange(-5.0, 5.0, 0.1)
Y = sigmoid(X)
plt.plot(X, Y)
plt.ylim(-0.1, 1.1)
plt.show()

결과

ReLU 함수

파이썬으로 구현

def relu(x):
    return np.maximum(0, x)

x = np.arange(-5.0, 5.0, 0.1)
y = relu(x)
plt.plot(x, y)
plt.ylim(-1.0, 5.5)
plt.show()

결과

SoftMax 함수

파이썬으로 구현

def softmax(x):
    if x.ndim == 2:
        x = x.T
        x = x - np.max(x, axis=0)
        y = np.exp(x) / np.sum(np.exp(x), axis=0)
        return y.T 

    x = x - np.max(x) # 오버플로 대책
    return np.exp(x) / np.sum(np.exp(x))

특징

소프트맥스 함수의 출력을 '확률'로 해석해도 무방.

신경망으로 분류할 때는 출력층의 소프트맥스 함수를 생략함.(일반적으로)

신경망내에서 값(데이터) 전달

w1, w2, w3 = network['W1'], network['W2'], network['W3']
b1, b2, b3 = network['b1'], network['b2'], network['b3']

a1 = np.dot(x, w1) + b1 # 입력층 -> 1층 신호(=값, =데이터) 전달
z1 = sigmoid(a1) # 1층에서의 활성화 함수 처리
a2 = np.dot(z1, w2) + b2 # 1층 -> 2층
z2 = sigmoid(a2) # 2층에서의 활성화 함수 처리
a3 = np.dot(z2, w3) + b3 # 2층 -> 출력층
y = softmax(a3) # 출력층의 활성화 함수 처리

출력층의 설계

회귀(regression) => 항등 함수
분류(classification) => 소프트맥스 함수

원-핫 인코딩 = one-hot encoding
전처리 = pre-processing

정규화
데이터 전체 분포 고려

데이터 백색화 = whitening

배치 처리

수치 계산 라이브러리 대부분이 큰 배열을 효율적으로 처리할 수 있도록 고도록 최적화 되어있음.
커다란 신경망에서는 데이터 전송이 병목으로 작용하는 경우가 자주 있는데, 배치 처리를 함으로써 버스에 주는 부하가 줄어듬. => 느린 I/O를 통해 데이터를 읽는 횟수가 줄고 빠른 CPU(또는 GPU)로 순수 계산을 수행하는 비율이 높아짐.

컴퓨터에서는 큰 배열을 한꺼번에 계산하는게 분할된 작은 배열을 여러 번 계산하는 것보다 빠름.

학습 : 훈련 데이터로부터 가중치 매개변수의 최적값을 자동으로 획득하는 것
기계 학습과의 비교

다크 프로그래머 님이 비교 정리 잘 해놓으신 블로그

데이터 구분

발생하는 문제

댓글