タグ

#RoPEの記事一覧

1件の記事があります。

LLM・基盤モデル

LongRoPEとは?LLMのコンテキスト長を200万トークン超まで伸ばす仕組みと使い道を解説

LongRoPEは、RoPEの位置補間を次元ごと・位置ごとに最適化し、段階的な拡張と短文脈性能の回復を組み合わせて、既存LLMのコンテキスト長を2048kまで伸ばす技術です。長文RAGやAIエージェントにどう効くのかを日本語で解説します。

参照論文:LongRoPE: Extending LLM Context Window Beyond 2 Million Tokens