本記事の対象読者:Claude Codeを使い始めたが、すぐにトークン使用量の上限に引っかかってしまう方。「何が起きているのか」を正しく理解したうえで、具体的な対策を一つずつ身につけたい方。 この記事の方針:根拠のある情報のみを扱います ...
なぜトークン削減が重要なのか Claude Codeの料金はトークン消費に比例します。 特にBashツールの出力は、人間が見たら一瞬でスルーするような情報でも、AIは律儀に全部読んでしまいます。 30分のセッションで見ると、こんな内訳になっています。
米OpenAIは4月14日(現地時間)、最新の大規模言語モデル「GPT-4.1」ファミリーを発表し、API経由の提供を開始した。 今回リリースされたのは「GPT-4.1」「GPT-4.1 mini」「GPT-4.1 nano」の3種であり、「プログラミング支援性能の向上」「指示追従能力の改善」「最大 ...
Claude Codeに全部やらせていた頃の話 判断基準はたった1つ。「ロジックが固定か、毎回判断が要るか」 Pythonに任せるもの(固定ロジック) Claude Codeに任せるもの(判断が必要) 実際に作ったパイプラインの全体像 Before:Claude Code単独(1日7回起動) After ...
通常、大規模言語モデル(LLM)のほとんどは「次の単語を予測する」という作業を行っており、一度に出力されるデータ(トークン)は1つです。これに対しMetaは2024年4月の論文で、一度に複数のトークンを出力する「マルチトークン予測」というアプローチを ...
システム関連で幅広い事業を展開しているサイオステクノロジーのプロフェッショナルサービスチームが、日々何を考え、どんな仕事をしているかを共有する「SIOS PS Live配信」。今回は、利用頻度の高いOAuthをテーマにシニアアーキテクトの武井氏が登壇し ...