タグ

#長文処理の記事一覧

1件の記事があります。

LLM・基盤モデル

Mambaとは?線形時間で長文を扱える選択的状態空間モデルの仕組みと使い道

Mambaは、Transformerの二乗計算コストを避けながら、入力内容に応じて記憶を選別できる選択的状態空間モデルです。Selective SSM、並列スキャン、長文処理への強さ、実務での応用可能性を日本語で整理します。

参照論文:Mamba: Linear-Time Sequence Modeling with Selective State Spaces