タグ
#Late Chunkingの記事一覧
1件の記事があります。
RAG・検索
Late Chunkingとは?RAGの文脈切れを減らす埋め込み分割の仕組みと使い道
Late Chunkingは、文書を先に小さく分割するのではなく、全文を一度エンコードしてからチャンク単位に埋め込みを作る手法です。RAGや検索で起きやすい文脈切れをなぜ減らせるのか、仕組み、評価結果、実務での使い道まで日本語で解説します。
参照論文:Late Chunking: Contextual Chunk Embeddings Using Long-Context Embedding Models