Simple-RAG-App

RFFを使ったハイブリッド検索によるRAGのQAアプリ

使い方：
・OpenAIのAPIkeyをSettingに入力
・LLMのモデルを選択
・temperature,max_tokensを設定
・質問を入力
・回答が出力される

処理方法
・事前に3つのURLをスクレイピングしてvectorstoreを作成（Chromadb）
・BM25のキーワード検索と事前に作成していたvectorstoreを使ったベクトル検索で類似文書を抽出
・RFFを使って文書の類似度を調整
・類似度が最も高い文書を使ってLLMに回答を要求

今後の改善ポイント：
①Improved processing speed
質問入力から回答出力までの時間を短縮する。
~~アプリ起動のたびにソースデータの読み込み～Embeddings～vectorstore作成を行っているため、事前にベクトルDBを作成しておくことで処理速度を短縮。~~(修正済み：2025/02/22)

②Improved text pre-processing accuracy
ソースデータの前処理の精度を向上させる。記号などを正しく削除する割合を増やす。また、「詳しくはこちら」という記載の直後にurlを挿入することで回答文の使いやすさ向上も実現したい。

③Improved text pre-processing accuracy
ソースデータの前処理の精度を向上させる。記号などを正しく削除する割合を増やす。また、詳しくはこちらという記載の直後にurlを挿入することで回答の精度向上も狙う。

④Result Re-Rank
マイクロソフトのSearchで述べられている通り、ハイブリッド検索とリランクモデルを併用することで精度向上が期待できる。
https://techcommunity.microsoft.com/blog/azure-ai-services-blog/azure-ai-search-outperforming-vector-search-with-hybrid-retrieval-and-reranking/3929167

⑤HyDE
HyDE（Hypothetical Document Embeddings）とは質問文のみでLLMから仮回答を生成し、その仮回答をEmbeddingして類似度検索を行うというもの。

⑥Metadata Attachments
メタデータを追加しまくる。ここは単純にデータをいっぱい準備するだけ。趣味の範囲でやっているので着手するモチベーションは低い。

⑦knowledge Graphs
1~5で満足のいく精度が得られなかった場合に手を出す。ナレッジグラフ用のDB（Neo4j）を準備する必要があるためハードルが高い。Neo4jはCypherとかいうクエリ言語の習熟も必要。CypherのクエリをGPTに書いてもらうという方法もある

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
.idea		.idea
chroma		chroma
README.md		README.md
app.py		app.py
requirements.txt		requirements.txt
runtime.txt		runtime.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Simple-RAG-App

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

kub-otake/Simple-RAG-App

Folders and files

Latest commit

History

Repository files navigation

Simple-RAG-App

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages