목록검색 (2)
허허의 오늘은 뭐 먹지?
LangChain과 OpenAI Embeddings를 활용해 텍스트 데이터를 벡터화하고, 이를 바탕으로 사용자의 질문에 맞는 답변을 제공하는 대화형 문서 검색 시스템을 구현하려고 한다.벡터 데이터베이스인 Chroma를 이용해 텍스트의 의미 기반 검색이 가능하도록 설계하며, GPT 모델을 통해 문맥에 맞는 자연스러운 응답을 제공하는 목적이다.1. 벡터 저장소 및 텍스트 분할벡터 저장소(Vector Store)는 텍스트 데이터를 임베딩 벡터로 변환한 후 이를 저장하고 검색하는 데이터베이스이다.여기서는 OpenAI의 임베딩(Embedding) 모델을 사용하여 문서를 벡터로 변환하고, Chroma를 사용해 벡터 데이터를 저장 및 관리한다.벡터(Vector)란 무엇인가?벡터란 텍스트 데이터를 수치화하여 다차원 공..
Recall@1이란 무엇인가?Recall@1은 정보 검색 시스템이나 추천 시스템에서 검색된 결과의 정확성을 측정하는 지표로, 첫 번째 검색 결과(Top 1 결과)가 얼마나 자주 정답을 포함하는지를 평가한다. 이는 검색 시스템이 사용자의 질문에 대해 가장 관련성이 높은 정보를 정확히 상위에 반환하는지를 나타낸다.Recall@1의 의미전체 정답 중에서 첫 번째 검색 결과가 정답을 포함할 확률을 나타낸다.Recall@1 = (정답이 첫 번째 결과로 반환된 횟수) / (전체 검색 요청 수) 로 계산한다.예를 들어, 사용자가 100번 질문했을 때 첫 번째 검색 결과에 정답이 70번 포함되었다면, Recall@1은 70%가 된다.Recall@1의 예시검색 시스템의 예시사용자가 "서울의 날씨는?"이라는 질문을 했을 ..