[신경망-활성화 함수] 소프트맥스 함수

2026. 1. 14. 22:03·AI/이론
반응형

👋 들어가기 전

 

신경망에 대해 맛보기를 끝낸 지금, 신경망은 어디에 이용할 수 있을까?

신경망은 크게 분류와 회귀에 이용될 수 있다.

 

💡 분류(classification)

데이터가 어느 클래스에 속하느냐를 결정하는 문제
💡 회귀(regression)

입력 데이터에서 연속적인 수치를 예측하는 문제

 

오늘은 출력층에서 사용되는 대표적인 함수, 항등함수와 소프트맥스 함수에 대해 알아보자.

 

소프트맥스에 조금 무게를 더 둘 예정


🏁 학습할 내용

  • 항등함수
  • 소프트맥스 함수

🟰 항등함수

 

🧩 역할

 

입력과 출력이 항상 같은 활성화 함수

🚀 특징

 

  • 회귀 문제에 주로 사용됨
  • y = x

🍦 소프트맥스 함수

 

🧩 역할

 

입력신호를 연속적인 확률(확률 분포)로 변환해주는 활성화 함수

 

🔎 수식

  • z: 입력신호
  • 분자: 알고싶은 i의 입력신호의 지수함수
  • 분모: 모든 입력신호의 지수함수의 합

 

💡 왜 최대 입력신호값을  뺄까?

지수함수의 특징은 입력이 조금만 증가해도 지수적으로 커지기 떄문에 항상 오버플로우를 조심해야한다.

지수함수는 같은 값을 빼줘도(실질적으로는 나누기연산) 비율은 똑같은 특징을 이용한 것

 

🚀 특징

  • 출력은 0.0 ~ 1.0 사이
  • 출력의 총합은 반드시 1
  • 문제를 확률적(통계적)으로 접근할 수 있게 해줌
  • 지수 함수는 단조 증가함수기때문에, 오버플로우 방지를 위해, 최댓값을 빼줘도 대소관계가 유지
  • 소프트 맥스는 학습에서는 사용되고, 추론에서는 잘 사용되지 않음
  • 출력층의 뉴런 수는 분류하고 싶은 클래스 수로 설정하는 것이 일반적

 

💡 학습과 추론

머신러닝의 문제풀이 단계는, 학습과 추론을 거친디ㅏ.

학습은 모델을 학습(훈련)하는 단계고
추론은 학습한 모델을 통해 미지의 데이터에 대해 추론(분류)를 수행 (실질적인 작업)
💡 추론 단계에서 사용하지 않는 이유

소프트맥스 함수의 특징 중, 단조 증가라는 특징이 있다.

즉, 소프트 맥스를 돌리기전에도 이전 출력이 가장 큰 뉴런이 소프트 맥스를 거쳐도 가장 큰 뉴런이다.
그렇기 때문에, 비용측면에서도 굳이 하지 않아도 된다.

하지만 학습에서는 사용해야한다.

학습은 정답과의 차이를 수치화해야하기떄문에 반드시 확률(통계)적인 접근이 필요하다.

 


출처

반응형

'AI > 이론' 카테고리의 다른 글

[신경망-학습] 학습이란?  (0) 2026.01.24
[신경망-MNIST] MNIST 데이터셋  (1) 2026.01.22
[신경망] 3층 신경망 구현해보기  (0) 2026.01.13
[신경망-활성화 함수] 활성화 함수  (0) 2026.01.12
퍼셉트론  (0) 2026.01.10
'AI/이론' 카테고리의 다른 글
  • [신경망-학습] 학습이란?
  • [신경망-MNIST] MNIST 데이터셋
  • [신경망] 3층 신경망 구현해보기
  • [신경망-활성화 함수] 활성화 함수
Hamp
Hamp
남들에게 보여주기 부끄러운 잡다한 글을 적어 나가는 자칭 기술 블로그입니다.
  • Hamp
    Hamp의 분리수거함
    Hamp
  • 전체
    오늘
    어제
    • 분류 전체보기 (325) N
      • CS (30)
        • 객체지향 (2)
        • Network (7)
        • OS (6)
        • 자료구조 (1)
        • LiveStreaming (3)
        • 이미지 (1)
        • 잡다한 질문 정리 (0)
        • Hardware (2)
        • 이론 (6)
        • 컴퓨터 그래픽스 (0)
      • Firebase (3)
      • Programing Langauge (41)
        • swift (34)
        • python (6)
        • Kotlin (1)
      • iOS (133) N
        • UIKit (37)
        • Combine (1)
        • SwiftUI (33) N
        • Framework (7)
        • Swift Concurrency (22)
        • Tuist (6)
        • Setting (11)
        • Modularization (1)
        • Instruments (6)
      • PS (59)
        • 프로그래머스 (24)
        • 백준 (13)
        • LeetCode (19)
        • 알고리즘 (3)
      • Git (18)
        • 명령어 (4)
        • 이론 (2)
        • hooks (1)
        • config (2)
        • action (7)
      • Shell Script (2)
      • Linux (6)
        • 명령어 (5)
      • Spring (20)
        • 어노테이션 (6)
        • 튜토리얼 (13)
      • CI-CD (4)
      • Android (0)
        • Jetpack Compose (0)
      • AI (9)
        • 이론 (9)
        • MCP (0)
  • 블로그 메뉴

    • 홈
    • 태그
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    투포인터
    CS
    Spring
    dfs
    dp
    AVFoundation
    SwiftUI
    IOS
    GIT
    Tuist
    boostcamp
    프로그래머스
    UIKit
    protocol
    lifecycle
    Swift
    property
    dispatch
    백준
    concurrency
  • 최근 댓글

  • 최근 글

  • 반응형
  • hELLO· Designed By정상우.v4.10.0
Hamp
[신경망-활성화 함수] 소프트맥스 함수
상단으로

티스토리툴바