카테고리 없음

벡터DB(Vector Database)

wikys 2026. 1. 11. 10:20

😎 한 줄 요약(잘난 척용)

“벡터DB는 텍스트·이미지 등 의미를 수치로 바꿔 ‘비슷한 것 끼리 찾는’ AI용 검색 엔진이다.”


벡터DB(Vector Database)란?

AI 시대에 꼭 필요한 ‘의미 중심 검색’ 저장소

1. 벡터DB를 한 문장으로

벡터DB는 데이터를 숫자의 벡터로 바꿔 저장하고, 비슷한 데이터를 빠르게 찾아주는 데이터베이스다.


2. 왜 ‘벡터’로 저장하나?

텍스트/이미지/오디오 같은 비구조화 데이터는 단어·픽셀 같은 고유 형태만으로는 의미를 비교하기 어렵다.
그래서 AI가 이해할 수 있도록 숫자의 리스트(벡터)로 변환한다.

벡터는

  • 의미를 담는 숫자 묶음
  • 각 차원이 특징 하나를 의미
    👉 비슷한 의미일수록 벡터 간 거리가 가까워진다.

3. 벡터DB와 전통 DB의 차이

요소 전통 DB 벡터DB
저장 방식 테이블(열·행) 고차원 벡터
검색 방식 정확 매칭 의미 기반 유사성
예시 검색 “정확히 이 단어” “비슷한 의미”

👉 벡터DB는 키워드보다 의미 중심 검색에 강하다.


4. 어떻게 쓰일까?

📌 의미 검색

  • 질문 → 관련 답 찾기
  • “AI 챗봇이 문맥 이해”
  • 단어 대신 벡터 의미로 검색

📌 추천 시스템

  • 비슷한 영화/상품 추천
  • 사용자 행동을 벡터로 바꿔 비교

📌 RAG (Retrieval-Augmented Generation)

  • LLM(대형 언어모델)이 지식 데이터를 검색해 답에 보태는 것
  • 벡터DB는 그 검색 엔진 역할을 함

📌 이미지·멀티모달 검색

  • 유사한 이미지 찾기
  • 텍스트로 이미지 검색
    👉 하나의 벡터 공간에서 다루면 가능해짐

5. 벡터DB가 좋은 이유

🧠 의미 기반

단순 단어 일치가 아니라
의미가 비슷한 것”을 찾는다.

🚀 빠른 검색

대형 모델 없이도
비슷한 항목을 효율적으로 찾는다.

🧩 AI 연결

LLM/임베딩과 함께 쓰면
초거대AI 기반 앱의 핵심 저장소가 된다.


6. 대표적인 벡터DB 예시

  • ChromaDB — 오픈소스 LLM 벡터DB
  • Milvus — 분산형 오픈소스 벡터DB
  • Pinecone, Qdrant 등 SaaS/클라우드형도 널리 사용

7. 초보자가 기억하면 딱 좋은 정리

  • 벡터DB = 의미 중심 검색 DB
  • 비슷한 것끼리 빠르게 찾아줌
  • AI용 상태 저장/검색의 핵심

8. 마무리

벡터DB는 전통적인 데이터 저장 방식과 AI 시대의 의미 기반 검색을 이어주는 다리다.

LLM/추천/검색/멀티모달 등 AI 스마트 기능을 빠르고 정확하게 구현하려면 벡터DB는 필수 구성 요소가 되고 있다.

 

참고 자료 (한국어)

🔗 개념 설명

🔗 기업·기술 설명

  • 벡터 데이터베이스란? (IBM)
  • 벡터DB 개념 (Elastic)

참고 유튜브 영상 (영어 / 한국어 자막 가능)

👉 개념 이해

✔ 벡터DB의 핵심: 의미기반 검색
✔ 유사도 검색·AI 활용까지 한 번에

반응형