ほとんどのAIベンチマークはAIの出力精度(スキル)を測定するものですが、スキルはAIの知能を表すものではありません。スキルではなくAIの知能を測定するため、AIがスキルを効率的に習得する能力を測定するベンチマークが「ARC-AGI」です。そんなARC-AGIの ...
先週、中国発のAI「DeepSeek-R1」の話をしたところ、マイクロソフトから「DeepSeek-R1」の小型蒸留モデルをNPU(Neural Processing Unit)で動かせるようにしたという話が飛び込んできた。 「マイクロソフトはOpenAIと組んでるんじゃないの?」とか「DeepSeekは問題だらけ ...
AI業界には今、中国のスタートアップ企業が開発したAIモデル「DeepSeek-R1」の登場による激震が走っている。OpenAIの1世代前のAIモデル「o1」に匹敵する性能を、はるかに低いコストで開発し、サービスを桁違いに安価に提供したことで、世界中から注目を集めた。
SambaNovaは、DeepSeek-R1 6710億パラメータモデルの推論を効率的に実行するためのハードウェア要件を40ラック(320基のGPU)から1ラック(SambaNova独自のAIアクセラレータであるRDUが16基)に集約し、最新GPUの3倍の速度、5倍の効率を実現 @カリフォルニア州 ...
AIモデルの開発現場では、大規模なモデルを用いて小規模なモデルをトレーニングする「蒸留」という手法が注目を集めています。この蒸留に関連して「中国企業のDeepSeekが2025年5月に発表したAIモデル『DeepSeek-R1-0528』がGoogleのGeminiで蒸留されている」という ...
OpenAI はオープンソースのライバル DeepSeek-R1の台頭に対抗するため、新しい独自の AI モデルをリリースした——しかし、これは後者の成功を抑えるのに十分だろうか? 本日(訳註:原文掲載日は1月31日)、ソーシャルメディア上で数日間の噂と期待が高まっ ...
AIモデルのベンチマーク比較サイトを運営するArtificial Analysisの発表によれば、「DeepSeek V3」は現在、OpenAIやGrok、Googleを抑えて非推論モデルのトップに立った。同ベンチマークでは推論力、知識、数学、コーディングといった項目を評価した。 James Martin/CNET ...
1月20日(日本時間)に突如登場し、AIユーザー・開発者たちの話題をさらった大規模言語モデル(LLM)「DeepSeek-R1」。特徴は、分野によっては米OpenAIの「o1」に匹敵するとうたう性能だ。すでにその能力を試すユーザーが続出している。 一方、開発元が中国 ...
Cerebras Systems は本日(訳註:原文掲載日は1月30日)、DeepSeek の画期的な R1人工知能モデルを米国のサーバーでホストすると発表し、GPU 基盤のソリューションよりも最大57倍高速な速度を実現しながら、機密データを米国内に保持することを約束した。この ...
会員(無料)になると、いいね!でマイページに保存できます。 ChatGPTでプログラミングをする「意外な利点」 『#100日チャレンジ 毎日連続100本アプリを作ったら人生が変わった』(大塚あみ著、日経BP、2025年)という書籍が発売され、話題を呼んでいる。
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する