
--- README.md
+++ README.md
... | ... | @@ -18,13 +18,13 @@ |
18 | 18 |
|
19 | 19 |
document_load_embedding.py 는 새로 임베딩을 실행하지 않고 vector db에서 임베딩을 불러와 검색하는 방식입니다. |
20 | 20 |
|
21 |
-## 작동 구조 - LLM |
|
21 |
+# 작동 구조 - embedding |
|
22 | 22 |
|
23 | 23 |
기본 설정된 embedding 파일은 한국어를 지원합니다. LLM(Mixtral)또한 한국어를 지원하지만 때때로 영어로 대답하는 문제가 있으며 이는 LLAMA INDEX상에서 기본적으로 하고 있는 프롬프트 엔지니어링이 모두 영어여서 그럴 수 있습니다. (이 문제는 gpt3.5-turbo도 가지고 있는 문제입니다) |
24 | 24 |
또한 Mixtral의 근본적인 한계로써, 영단어의 한국어 음차를 이상하게 읽는 문제가 있습니다. |
25 | 25 |
현재 Llama Index의 가장 기본적인 프롬프트 엔지니어링을 사용하고 있습니다. 따라서 대답이 단답형이고 딱딱합니다. |
26 | 26 |
|
27 |
-## 작동 구조 - Vector DB 및 임베딩 |
|
27 |
+# 작동 구조 - Vector DB 및 임베딩 |
|
28 | 28 |
|
29 | 29 |
vector db 는 postgresql 의 extension인 pgvector를 사용하고 있으며 이에 대한 설치 방법은 해당 프로젝트 github 페이지를 참고하시길 부탁드립니다. [GitHub - pgvector/pgvector: Open-source vector similarity search for Postgres](https://github.com/pgvector/pgvector) |
30 | 30 |
데이터 베이스 접속 설정은 db_config.json을 수정하여 진행합니다. |
Add a comment
Delete comment
Once you delete this comment, you won't be able to recover it. Are you sure you want to delete this comment?