タグ
#Mambaの記事一覧
1件の記事があります。
LLM・基盤モデル
Mambaとは?線形時間で長文を扱える選択的状態空間モデルの仕組みと使い道
Mambaは、Transformerの二乗計算コストを避けながら、入力内容に応じて記憶を選別できる選択的状態空間モデルです。Selective SSM、並列スキャン、長文処理への強さ、実務での応用可能性を日本語で整理します。
参照論文:Mamba: Linear-Time Sequence Modeling with Selective State Spaces