Commit @f8a3f99bfc5a63c36420a6e5bb4aec6710be56b6 - yjyoon/RAG-minimal-example

윤영준 2024-01-25

Update README.md

@f8a3f99bfc5a63c36420a6e5bb4aec6710be56b6

610b48e

f8a3f99

README.md

--- README.md

+++ README.md

...	...	@@ -7,9 +7,11 @@
7	7	데이터 베이스 설정은 db_config.json을 수정하여 진행합니다.
8	8	data 폴더에 넣고 싶은 파일(pdf, word, hwp, txt, .md)를 넣고 document_embedding.py를 실행하면 서버위에 data 폴더 안에 있는 파일의 텍스트를 모두 임베딩합니다. 이 리포에는 예제로 텍스트 파일이 들어가 있습니다. 실행시마다 설정된 table을 리셋하고 새로 임베딩을 빌드하는 방식이기 때문에 파일이 많으면 오래 걸릴 수 있습니다. vector db의 특성상 하나의 새로운 element를 삽입하면 search tree를 다시 지어야 하기 때문에 프로토타입단계에서는 이것으로 마무리하고, 차후 Cassnadra 5.X로 넘어가 고도화 할 계획입니다. (PG vector는 임베딩을 relational 처럼 다룰 수 있게 하지만, 이때문에 상당한 성능의 희생을 감수하였습니다.)
9	9	또한 document_load_embedding.py 는 새로 임베딩을 실행하지 않고 vector db에서 임베딩을 불러와 검색하는 방식입니다.
	10	+
10	11	기본 설정된 embedding 파일은 한국어를 지원합니다. LLM(Mixtral)또한 한국어를 지원하지만 때때로 영어로 대답하는 문제가 있으며 이는 LLAMA INDEX상에서 기본적으로 하고 있는 프롬프트 엔지니어링이 모두 영어여서 그럴 수 있습니다. (이 문제는 gpt3.5-turbo도 가지고 있는 문제입니다)
11	12	또한 Mixtral의 근본적인 한계로써, 영단어의 한국어 음차를 이상하게 읽는 문제가 있습니다.
12		-현재 Llama Index의 가장 기본적인 프롬프트 엔지니어링을 사용하고 있습니다.
	13	+현재 Llama Index의 가장 기본적인 프롬프트 엔지니어링을 사용하고 있습니다. 따라서 대답이 단답형이고 딱딱합니다.
	14	+
13	15
14	16
15	17

Add a comment

Open 0
Closed 0

List