[LLM] 대규모 언어 모델

LLM에 대해 잘 설명된 다음 글(https://www.cloudflare.com/ko-kr/learning/ai/what-is-large-language-model/)에서 일부를 발췌하여 정리함

Large Language Model, 대규모 언어 모델이 무엇인지 가볍게 알아보자

대규모 언어 모델(LLM)

방대한 양의 데이터로 사전 학습된 초대형 딥 러닝 (트랜스포머 신경망 모델 기반) 모델

텍스트를 인식하고 생성하는 등의 작업을 수행할 수 있는 일종의 인공지능 프로그램

트랜스포머 모델 : 문맥 학습 가능. 셀프어텐션->시퀀스 요소 간 연관방식 감지

사용

아래와 같이 매우 다양한 분야에서 활용 가능

생성형 Ai : 프롬프트가 주어지거나 질문을 받으면 응답으로 텍스트를 생성

감정 분석, DNA분석, 고객 서비스, 챗봇, 온라인 검색

장점

예측할 수 없는 쿼리에 대응할 수 있음

자연스러운 인간 언어에 응답하고 데이터 분석을 사용하여 구조화되지 않은 질문이나 프롬프트에 적절한 방식으로 답변

단점

수집하는 데이터만큼만 신뢰할 수 있는 정보를 제공할 수 있음

잘못된 정보가 입력되면 사용자 쿼리에 대한 응답으로 잘못된 정보를 제공 (환각)

버그가 발생하기 쉬움

악의적인 입력을 통해 LLM을 조작하여 위험하거나 비윤리적인 응답 등 특정 유형의 응답을 다른 응답보다 우선적으로 제공하도록 할 수 있음

기밀 데이터 유출 가능 : 사용자가 자신의 생산성을 높이기 위해 안전한 기밀 데이터를 LLM에 업로드할 시, LLM은 수신한 입력을 사용하여 모델을 추가로 학습시킴. 이후 다른 사용자의 쿼리에 대한 응답으로 기밀 데이터가 노출될 수 있음.

[Transformer] 트랜스포머 동작 원리 1. 인코딩, 디코딩 (0)	2024.08.20
[Transformer] 트랜스포머란? 그리고 등장 배경 (0)	2024.08.20
[딥러닝] 역전파(Back propagation) 알고리즘 (1)	2024.08.16
[딥러닝] 선형, 로지스틱, 소프트맥스 회귀 (0)	2024.08.05
[딥러닝] 딥러닝 기초 개념 (1)	2024.08.04

rec0de