From LLMs to hallucinations, here’s a simple guide to common AI terms
개요
인공지능(AI) 분야에서 자주 사용되는 전문 용어들을 설명하여 AI 기술에 대한 이해를 돕는 이 콘텐츠는 AGI, AI 에이전트, Chain of thought, Compute, Deep learning, Diffusion, Distillation, Fine-tuning, GAN, Hallucination, Inference, LLM, Memory cache, Neural network, RAMageddon, Training, Tokens, Transfer learning, Weights 등 다양한 개념들을 다룹니다.
주요 내용
* AGI (Artificial General Intelligence): 평균적인 인간보다 훨씬 더 많은 작업에서 능력이 뛰어난 AI를 의미하며, OpenAI는 '경제적으로 가치 있는 대부분의 업무에서 인간을 능가하는 고도로 자율적인 시스템'으로 정의하고 Google DeepMind는 '대부분의 인지 작업에서 인간만큼 능력이 뛰어난 AI'로 보고 있습니다.
* AI 에이전트: 경비 처리, 티켓 예약, 코드 작성 및 유지보수 등 단순한 AI 챗봇을 넘어 사용자를 대신하여 일련의 작업을 수행하는 AI 기술 기반 도구를 지칭합니다.
* Chain of thought: 논리 또는 코딩 맥락에서 문제 해결 시, 복잡한 문제를 작고 중간적인 단계로 분해하여 최종 결과물의 품질을 향상시키는 AI의 추론 방식입니다.
* Compute: AI 모델이 작동하는 데 필요한 핵심적인 연산 능력으로, GPU, CPU, TPU 등 AI 산업의 기반을 형성하는 하드웨어를 포함합니다.
* Deep learning: 다층적인 인공 신경망(ANN) 구조를 가진 기계 학습의 한 분야로, 인간의 뇌 신경망 구조에서 영감을 받아 데이터를 스스로 특징화하고 오류로부터 학습하여 출력을 개선합니다.
* Diffusion: 사진, 음악, 텍스트 생성 AI 모델의 핵심 기술로, 데이터를 노이즈로 파괴하는 물리적 확산 현상에서 영감을 얻어, 파괴된 데이터를 복원하는 '역확산' 과정을 학습합니다.
* Distillation: '교사-학생' 모델 구조를 사용하여 대규모 AI 모델의 지식을 추출하는 기법으로, 학생 모델이 교사 모델의 동작을 근사하도록 학습시켜 더 작고 효율적인 모델을 생성할 수 있습니다.
* Fine-tuning: AI 모델이 특정 작업이나 영역에 대해 더 나은 성능을 발휘하도록 새로운 전문 데이터를 추가하여 추가 훈련하는 과정입니다.
* GAN (Generative Adversarial Network): 사실적인 데이터를 생성하는 데 사용되는 머신러닝 프레임워크로, 생성자와 판별자라는 두 개의 신경망이 경쟁하며 서로를 개선합니다.
* Hallucination: AI 모델이 부정확하거나 잘못된 정보를 생성하는 현상으로, 훈련 데이터의 부족이나 AI 모델의 한계로 발생하며, 전문화된 AI 모델 개발을 촉진하는 요인이 됩니다.
* Inference: 학습된 AI 모델을 실행하여 예측을 수행하거나 데이터를 기반으로 결론을 도출하는 과정입니다.
* LLM (Large language model): ChatGPT, Gemini 등 AI 어시스턴트에서 사용되는 AI 모델로, 수십억 개의 파라미터를 가진 심층 신경망으로 단어와 구문 간의 관계를 학습하여 언어를 표현합니다.
* Memory cache: AI 모델이 사용자의 쿼리에 응답할 때 추론을 더 효율적으로 만들기 위해 특정 계산을 저장하는 최적화 기법입니다.
* Neural network: 딥러닝 및 생성 AI 도구의 기반이 되는 다층 알고리즘 구조로, GPU의 발전으로 인해 심층적인 학습이 가능해졌습니다.
* RAMageddon: AI 산업의 급성장으로 인해 RAM 칩의 수요가 급증하면서 발생하는 칩 부족 현상을 지칭합니다.
* Training: AI 모델이 데이터로부터 패턴을 학습하고 유용한 출력을 생성하도록 데이터를 공급하는 과정으로, 규칙 기반 AI에는 필요하지 않습니다.
* Tokens: AI 모델이 처리하거나 생성하는 데이터의 기본 단위로, 인간과 AI 간의 커뮤니케이션을 가능하게 하며 AI 서비스 비용 산정의 기준이 됩니다.
* Transfer learning: 이전에 훈련된 AI 모델을 시작점으로 사용하여 다른 관련 작업에 대한 새 모델을 개발하는 기법으로, 개발 효율성을 높이고 데이터가 제한적인 경우에 유용합니다.
* Weights: AI 훈련 과정에서 데이터의 다양한 특징에 부여되는 중요도를 결정하는 수치적 매개변수로, AI 모델의 출력을 형성합니다.
시사점
이 용어집은 AI 기술을 이해하려는 일반 대중과 전문가 모두에게 AI 분야의 복잡한 개념들을 명확하게 설명함으로써 AI 산업에 대한 통찰력을 제공합니다. AI 기술의 발전과 함께 지속적으로 업데이트될 이 용어집은 AI 관련 정보의 접근성을 높이고 이해의 폭을 넓히는 데 기여할 것입니다.
댓글
GitHub Discussions