タグ
#LongRoPEの記事一覧
1件の記事があります。
LLM・基盤モデル
LongRoPEとは?LLMのコンテキスト長を200万トークン超まで伸ばす仕組みと使い道を解説
LongRoPEは、RoPEの位置補間を次元ごと・位置ごとに最適化し、段階的な拡張と短文脈性能の回復を組み合わせて、既存LLMのコンテキスト長を2048kまで伸ばす技術です。長文RAGやAIエージェントにどう効くのかを日本語で解説します。
参照論文:LongRoPE: Extending LLM Context Window Beyond 2 Million Tokens