Llama2のinferenceを500行のPure Cで実装されてたーTransformerも含めて500行で実装されているのはなかなか衝撃的。https://t.co/aW16fRs7yIGPT-4で日本語のコメントをつけたバージョンはこちらです。https://t.co/WUXJhNHfGQ — masuidrive (@masuidrive) 20…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。