[ai] 인공지능 구성요소
이 글은 초보자를 위한 안내서로, 인공지능의 구성 요소를 다음의 주제로 명확히 구분해 설명합니다
AI 개요 → 기술 분야 → 알고리즘 → 신경망 → 모델 → 데이터 → 학습 → 추론 → 평가 → 윤리
1. 인공지능이란 무엇인가? (AI: Artificial Intelligence)
인공지능은 인간의 지능을 모방해 문제를 해결하거나, 언어를 이해하고, 이미지를 인식하는 등 다양한 작업을 자동으로 수행하는 컴퓨터 시스템입니다. 대표적인 예로 챗봇, 번역기, 자율주행차, 추천 시스템 등이 있습니다.
2. 주요 기술 분야 (Technology Areas)
AI는 다양한 분야에 적용됩니다. 각 분야는 처리 대상 데이터(텍스트, 이미지, 음성 등)에 따라 특화된 기술로 구성됩니다.
| 기술 | 설명 |
| 자연어 처리 (NLP: Natural Language Processing) | 텍스트 생성, 요약, 번역, 감정 분석 등 언어 관련 작업 |
| 컴퓨터 비전 (CV: Computer Vision) | 이미지나 영상 분석, 객체 인식, 얼굴 인식 등 시각 작업 |
| 음성 인식 (ASR: Automatic Speech Recognition) | 사람의 음성을 텍스트로 변환하는 기술 |
3. 대표적인 알고리즘 (Algorithm)
알고리즘은 데이터를 처리해 예측하거나 분류하는 계산 절차입니다. 문제 유형에 따라 회귀(Regression), 분류(Classification), 군집화(Clustering), 강화학습(Reinforcement Learning) 등으로 나뉩니다.
| 알고리즘 | 유형 | 설명 |
| 선형 회귀 (LR: Linear Regression) | 회귀 | 연속형 값을 예측하는 기본적인 회귀 알고리즘 |
| 로지스틱 회귀 (LogR: Logistic Regression) | 분류 | 분류 문제에 사용하는 확률 기반 알고리즘 |
| 의사결정트리 (DT: Decision Tree) | 분류 | 조건 분기를 통해 데이터를 분류하는 트리 구조 알고리즘 |
| 랜덤 포레스트 (RF: Random Forest) | 분류 | 여러 결정트리를 조합한 앙상블 학습 기법 |
| 서포트 벡터 머신 (SVM: Support Vector Machine) | 분류 | 분류 경계선을 최적화하는 알고리즘 |
| K-최근접 이웃 (KNN: K-Nearest Neighbors) | 분류 | 주변 데이터와의 거리 기반으로 분류 또는 예측 |
| K-평균 군집화 (KMeans: K-Means Clustering) | 군집화 | 비슷한 데이터들을 자동으로 군집화하는 비지도 학습 |
| SARSA (SARSA: State-Action-Reward-State-Action) | 강화학습 | 현재 상태에서의 행동과 다음 상태의 행동을 함께 학습 |
| Q러닝 (Q-Learning) | 강화학습 | 보상을 기반으로 최적의 행동 정책을 학습 |
4. 신경망 구조 (Neural Network Architecture)
신경망은 입력 데이터를 여러 계층(layer)을 거쳐 처리하고 출력하는 구조로, 복잡한 패턴을 학습할 수 있는 심층 구조입니다.
| 신경망 | 설명 |
| 다층 퍼셉트론 (MLP: Multi-Layer Perceptron) | 기본적인 완전연결 신경망 구조 |
| 합성곱 신경망 (CNN: Convolutional Neural Network) | 이미지나 영상 분석에 최적화된 구조 |
| 순환 신경망 (RNN: Recurrent Neural Network) | 시계열 데이터에 적합한 구조 |
| 장단기 메모리 (LSTM: Long Short-Term Memory) | RNN의 장기 기억 문제를 해결한 구조 |
| 게이트 순환 유닛 (GRU: Gated Recurrent Unit) | LSTM의 경량화 구조로 학습 효율이 높음 |
| 트랜스포머 (Transformer) | 병렬 처리와 문맥 이해에 강한 구조로 최신 NLP 모델의 기반 |
| 생성적 적대 신경망 (GAN: Generative Adversarial Network) | 생성자와 판별자가 경쟁하며 데이터를 생성하는 구조 |
| 변분 오토인코더 (VAE: Variational Autoencoder) | 데이터를 압축하고 다시 복원하는 생성 구조 |
5. AI 모델 (AI Models)
모델은 신경망 구조에 데이터를 학습시켜 만들어진 결과물입니다. 실제로 사용하는 AI의 '실체'라고 볼 수 있습니다.
| 모델 | 사용 신경망 | 설명 |
| 지피티 (GPT: Generative Pre-trained Transformer) | 트랜스포머 (Transformer) | 텍스트 생성에 특화된 언어 모델 |
| 버트 (BERT: Bidirectional Encoder Representations from Transformers) | 트랜스포머 (Transformer) | 문장 이해와 분류에 뛰어난 언어 모델 |
| 달리 (DALL·E) | 트랜스포머 + 디퓨전 | 텍스트 설명을 기반으로 이미지를 생성하는 모델 |
| 클립 (CLIP: Contrastive Language–Image Pretraining) | 트랜스포머 + CNN | 텍스트와 이미지를 함께 이해하는 멀티모달 모델 |
| 위스퍼 (Whisper) | 트랜스포머 (Transformer) | 오픈소스 음성 인식 모델 |
| 스타일갠 (StyleGAN) | 생성적 적대 신경망 (GAN) | 고품질 이미지 합성 모델 |
| 라마 (LLaMA: Large Language Model Meta AI) | 트랜스포머 (Transformer) | Meta의 경량 고성능 언어 모델 |
| 파인튜닝된 버전들 (Alpaca, Vicuna 등) | 트랜스포머 (Transformer) | 기존 LLM에 특정 목적을 반영한 경량화/응답형 모델 |
6. 데이터 (Data)
AI는 데이터를 기반으로 학습합니다. 다양한 형태의 데이터가 있으며, 품질이 좋을수록 더 정교한 예측이 가능합니다.
| 데이터 유형 | 설명 |
| 텍스트 (Text) | 문장, 뉴스, 블로그 등 자연어 기반의 정보 |
| 이미지 (Image) | 사진, 그림, 도면 등 시각 정보 |
| 음성 (Audio) | 대화, 녹음 등 소리 정보 |
| 비디오 (Video) | 시간 정보가 결합된 영상 데이터 |
| 센서 데이터 (Sensor Data) | IoT, 의료기기 등에서 수집된 수치 |
| 로그 (Log) | 시스템 동작 기록, 사용자 행동 추적 |
| 메타데이터 (Metadata) | 데이터의 속성 정보 (예: 촬영 시각, 위치 등) |
7. 학습 (Training)
AI는 학습을 통해 데이터를 기반으로 문제 해결 능력을 획득합니다. 학습 방식은 여러 종류가 있습니다.
| 학습 방법 | 설명 |
| 지도학습 (SL: Supervised Learning) | 정답 데이터를 이용해 예측 학습 |
| 비지도학습 (UL: Unsupervised Learning) | 정답 없이 패턴을 발견 |
| 자기지도학습 (SSL: Self-Supervised Learning) | 일부 데이터를 숨기고 예측 |
| 강화학습 (RL: Reinforcement Learning) | 보상을 통해 행동을 학습 |
| 전이학습 (TL: Transfer Learning) | 기존 모델을 다른 문제에 적용 |
| 파인튜닝 (FT: Fine-tuning) | 사전학습된 모델을 특정 데이터에 맞게 미세 조정 |
8. 추론 (Inference)
추론은 학습된 모델이 새로운 입력에 대해 예측을 수행하는 과정입니다. 실시간 또는 일괄처리 방식으로 동작합니다.
| 추론 방식 | 설명 |
| 배치 추론 (BI: Batch Inference) | 여러 데이터를 한 번에 처리 |
| 실시간 추론 (RI: Real-time Inference) | 입력 즉시 결과 도출 |
| 스트리밍 추론 (SI: Streaming Inference) | 연속 입력 데이터 처리 |
9. 성능 평가 (Evaluation)
모델의 성능을 수치적으로 측정하여 실제 환경에서 신뢰할 수 있는지를 판단합니다.
| 지표 | 설명 |
| 정확도 (ACC: Accuracy) | 전체 중 정답 예측 비율 |
| 정밀도 (PRE: Precision) | 양성 예측 중 실제 양성 비율 |
| 재현율 (REC: Recall) | 실제 양성 중 맞춘 비율 |
| F1 점수 (F1: F1 Score) | 정밀도와 재현율의 평균 |
10. 윤리와 책임 (Ethics and Governance)
AI는 사회적 책임이 요구됩니다. 공정성과 개인정보 보호, 편향 방지 등 다양한 윤리 이슈를 고려해야 합니다.
| 요소 | 설명 |
| 편향 (BIAS: Bias) | 특정 그룹에 불리한 결과 유발 가능성 |
| 설명 가능성 (EXP: Explainability) | AI의 판단 근거를 사람이 이해할 수 있도록 설명 |
| 개인정보 보호 (PP: Privacy Protection) | 민감 정보가 유출되지 않도록 보호 |
| 공정성 (FAIR: Fairness) | 모든 사용자에게 평등하게 작동하도록 설계 |
이로써 인공지능의 전반적인 구성과 원리를 주제별로 구조화해 이해할 수 있게 되었습니다. 이제 관심 있는 주제를 중심으로 더 깊이 탐구해보세요!