はじめに:AIとの対話、その成功と「もしも」に備える 皆さん、こんにちは!AI開発の冒険、第8回です。前回(第7回)の総合演習では、Pythonコードで構造化コンテキスト(MCPの考え方)をOpenAI APIに渡し、パーソナライズされた応答を得るという、より実践 ...
はじめに - AI開発の「鍵」を手に入れ、鉄壁の守りを固める! 皆さん、こんにちは!前回の第2回では、OpenAI APIが持つ驚異的な能力と、AIを真に賢くする「コンテキスト(MCPの考え方)」の重要性について学びましたね。AIが私たちの言葉や状況を理解し ...
しかし、上記のように出力を構造化したとしても、出力結果の制約を全て満たすわけではなく、 「LLMをアプリケーションに型安全に組み込める」 とは限りません。実際の開発においては以下のようなケースに遭遇し、修正のためのコードを書くという ...
杉田 (@ane45) です。2024年12月の 「Python Monthly Topics」 は、OpenAIの音声認識モデルWhisperをPythonから使用する方法を解説します。さらに、Whisperモデルを基にした派生ツールやライブラリであるwhisper. cpp、faster-whisper、mlx-whisperについても紹介します。 Whisperとは ...
Amazonは6月1日(現地時間)、Amazon Bedrock上でOpenAIが提供するAIモデル「GPT-5.5」「GPT-5.4」および「Codex」の一般提供を開始した。 モデル利用はAmazon Bedrockの高性能な推論エンジンを介して ...
OpenAIは、Realtime API向けの次世代音声機能群を発表した。GPT-5クラスの推論力を備えた「GPT-Realtime-2」、多言語同時通訳の「GPT-Realtime-Translate」、即時文字起こしの「GPT-Realtime-Whisper」が含まれる。音声を自然なインタフェースとして普及させ、高度な音声アシスタント構築を支援する。
Mozillaが単一インターフェースで複数のAIを使用可能にするGo言語向けライブラリ「any-llm-go」を2026年2月10日にリリースしまし ...
大規模言語モデル(LLM)が得意なタスクは、大きく分けて要約・推論・変換・拡張の四分野に分けられる。それで、文章を要約したり翻訳したりするのは、LLMの得意なタスクだ。それで、筆者もよく翻訳や要約にChatGPTを利用している。 とは言え、専用ツールが ...
本特集では、既存のWebブラウザをAIブラウザにするソフトウエアである「Browser Use」を取り上げます。導入方法や基本操作、Pythonプログラムでの活用方法などを解説します。なお本特集の情報は執筆時点(2025年12月)のものです。あらかじめご了承ください。
現在アクセス不可の可能性がある結果が表示されています。
アクセス不可の結果を非表示にする