Benchmark Deepseek R1 Python

DeepSeekの推論モデル「DeepSeek-R1」をOpenAIのo1＆o3と比較することで ...

ほとんどのAIベンチマークはAIの出力精度(スキル)を測定するものですが、スキルはAIの知能を表すものではありません。スキルではなくAIの知能を測定するため、AIがスキルを効率的に習得する能力を測定するベンチマークが「ARC-AGI」です。そんなARC-AGIの ...

週刊アスキー

ChatGPT超えの中国AI「DeepSeek-R1」の衝撃

中国のAIスタートアップ「DeepSeek」は2025年1月20日、数学的推論やコーディング能力でOpenAIの最新モデル「o1」と同等性能を持つ大規模言語モデル「DeepSeek-R1」を公開した。使用・複製・改変・再配布を自由に許可する寛容なMITライセンス下でのオープンソース ...

窓の杜

NPUで動く「DeepSeek-R1」がもう登場、ローカル環境で動かしてみた

先週、中国発のAI「DeepSeek-R1」の話をしたところ、マイクロソフトから「DeepSeek-R1」の小型蒸留モデルをNPU（Neural Processing Unit）で動かせるようにしたという話が飛び込んできた。「マイクロソフトはOpenAIと組んでるんじゃないの？」とか「DeepSeekは問題だらけ ...

窓の杜

中国発の高性能AI「DeepSeek-R1」はCopilot+ PCで動くのか？「LM Studio」で ...

AI業界には今、中国のスタートアップ企業が開発したAIモデル「DeepSeek-R1」の登場による激震が走っている。OpenAIの1世代前のAIモデル「o1」に匹敵する性能を、はるかに低いコストで開発し、サービスを桁違いに安価に提供したことで、世界中から注目を集めた。

PC Watch

DeepSeek-R1がNPU上で動作できるようMicrosoftが移植

Microsoftは29日 (米国時間)、Copilot+ PCに搭載されているNPU上でLLMを活用できるDeepSeek-R1モデルの移植を行なったと発表した。まずは「Visual Studio Code」 (VS Code)の拡張機能「AI Toolkit」を介して「DeepSeek-R1-Distill-Qwen-1.5B」を提供し、7Bおよび14Bもまもなく用意するという。

GIGAZINE

中国製高性能AIモデル「DeepSeek-R1-0528」はGoogleのAI「Gemini」を使用し ...

AIモデルの開発現場では、大規模なモデルを用いて小規模なモデルをトレーニングする「蒸留」という手法が注目を集めています。この蒸留に関連して「中国企業のDeepSeekが2025年5月に発表したAIモデル『DeepSeek-R1-0528』がGoogleのGeminiで蒸留されている」という ...

ITmedia

話題の中華LLM「DeepSeek R1」は、天安門事件を説明できるかあれこれ ...

1月20日（日本時間）に突如登場し、AIユーザー・開発者たちの話題をさらった大規模言語モデル（LLM）「DeepSeek-R1」。特徴は、分野によっては米OpenAIの「o1」に匹敵するとうたう性能だ。すでにその能力を試すユーザーが続出している。一方、開発元が中国 ...

CNET

SambaNova、DeepSeek-R1 671Bを最速・最高効率（注1）で提供開始

SambaNovaは、DeepSeek-R1 6710億パラメータモデルの推論を効率的に実行するためのハードウェア要件を40ラック（320基のGPU）から1ラック（SambaNova独自のAIアクセラレータであるRDUが16基）に集約し、最新GPUの3倍の速度、5倍の効率を実現 @カリフォルニア州 ...

CNET

中国DeepSeek、非推論モデルで「米国製AI」を凌駕するスコア--OpenAIや ...

AIモデルのベンチマーク比較サイトを運営するArtificial Analysisの発表によれば、「DeepSeek V3」は現在、OpenAIやGrok、Googleを抑えて非推論モデルのトップに立った。同ベンチマークでは推論力、知識、数学、コーディングといった項目を評価した。 James Martin/CNET ...

BRIDGE

高度な推論モデルo3-miniとDeepSeek、激しい競争がはじまる

OpenAI はオープンソースのライバル DeepSeek-R1の台頭に対抗するため、新しい独自の AI モデルをリリースした——しかし、これは後者の成功を抑えるのに十分だろうか？本日（訳註：原文掲載日は1月31日）、ソーシャルメディア上で数日間の噂と期待が高まっ ...

BRIDGE

Cerebras、世界最速のDeepSeek R1ホストとなり、Nvidia GPUを57倍上回る

Cerebras Systems は本日（訳註：原文掲載日は1月30日）、DeepSeek の画期的な R1人工知能モデルを米国のサーバーでホストすると発表し、GPU 基盤のソリューションよりも最大57倍高速な速度を実現しながら、機密データを米国内に保持することを約束した。この ...

技術評論社

サイトについて

サイバーエージェントは2025年1月27日、1月20日に中国のAI企業DeepSeekが公開した推論型LLM 「DeepSeek-R1」の蒸留モデルに日本語データによる追加学習を行ったLLM 「DeepSeek-R1-Distill-Qwen-14B/ 32B-Japanese」を公開した。【モデル公開のお知らせ】 DeepSeek-R1-Distill-Qwen-14B ...

一部の結果でアクセス不可の可能性があるため、非表示になっています。

アクセス不可の結果を表示する