脆弱性に関する情報は次のページにまとまっている。 Remote Code Execution by Server-Side Template Injection in Model Metadata Advisory abetlen/llama-cpp-python GitHub 脆弱性の情報(CVE)は次のとおり。 CVE-2024-34359- ...
「Llama 3.1 405B モデルと同様のパフォーマンスを提供する、Meta の新しい最先端の70Bモデル」らしいLlama-3.3-70Bを試してみます。 つづいて、パッケージのインストール。 make時のオプションが変わっていますので、ご注意を。 CMAKE_ARGS="-DGGML_CUDA=on" pip install llama ...
アメリカ語ではspeculative decodingというらしい。 LLMは次の単語を予測するモデルなので、次の単語を予測してそれを加えてさらに次の単語を予測してそれを加えt・・という風に生成する単語数分計算する必要があります。しかしLLMは単語一個一個ではなく ...