タグ

#ファインチューニングの記事一覧

3件の記事があります。

RAFTとは？RAG前提でLLMを学習し、検索ノイズに強くするドメイン適応手法

RAFTは、RAGで使う検索文書を学習時からLLMに見せ、正解文書とノイズ文書を見分けながら答える力を鍛える学習手法です。仕組み、実験結果、実務での使い道を日本語で解説します。

参照論文：RAFT: Adapting Language Model to Domain Specific RAG

QLoRAは、事前学習済みLLMを4bit量子化したまま凍結し、LoRAだけを学習して大規模モデルを少ないGPUメモリで調整する技術です。NF4、Double Quantization、Paged Optimizerの仕組みと、実務での使い道を日本語で整理します。

参照論文：QLoRA: Efficient Finetuning of Quantized LLMs

LoRAは、事前学習済みモデル本体を凍結したまま、低ランク行列だけを学習して新しいタスクに適応させる手法です。なぜ軽くて強いのか、仕組み、実験結果、実装へのヒントを日本語で整理します。

参照論文：LoRA: Low-Rank Adaptation of Large Language Models