OpenAI Responses APIが現地時間の3月11日に公開されました。エージェント指向のAPIということで、より実用的なアプリが作りやすくなり、いわばAIエージェントへの布石とも言えるでしょう。 この記事ではAPIの解説と、実際に自分で作って動かしてみた結果を ...
「OpenAI APIをPythonで使ってみたいけど、エラーが出たらどうしよう…そもそも何から始めればいいの?」そう思う方もいるかもしれません。実は、OpenAI APIをPythonで扱うには、基本的な使い方とよくあるエラーの対策、この2つを押さえるだけでスムーズに ...
大規模言語モデル(LLM)が得意なタスクは、大きく分けて要約・推論・変換・拡張の四分野に分けられる。それで、文章を要約したり翻訳したりするのは、LLMの得意なタスクだ。それで、筆者もよく翻訳や要約にChatGPTを利用している。 とは言え、専用ツールが ...
何かと話題の対話型AIであるChatGPTだけれども、その開発元であるOpenAIが提供しているサービス・機能はChatGPT以外にもいくつかある。その1つが「Whisper」という音声データから文字起こししてくれる機能だ。 筆者の場合、たとえば取材のときに録音し、それを ...
しかし、上記のように出力を構造化したとしても、出力結果の制約を全て満たすわけではなく、 「⁠LLMをアプリケーションに型安全に組み込める」 とは限りません。実際の開発においては以下のようなケースに遭遇し、修正のためのコードを書くという ...
Azure OpenAI Service(以下Azure OpenAI)は、2023年1月に一般提供が開始されたMicrosoft版のOpenAIサービスだ。GPT-3やChatGPT(GPT-3.5 Turbo)などの大規模言語モデル(LLM)をAzureプラットフォーム上で利用できる。少々、利用申請に戸惑ったが、それらを含め使用感を ...
本特集では、既存のWebブラウザをAIブラウザにするソフトウエアである「Browser Use」を取り上げます。導入方法や基本操作、Pythonプログラムでの活用方法などを解説します。なお本特集の情報は執筆時点(2025年12月)のものです。あらかじめご了承ください。
Mozillaが単一インターフェースで複数のAIを使用可能にするGo言語向けライブラリ「any-llm-go」を2026年2月10日にリリースしまし ...