Googleは9日(米国時間)、ほぼリアルタイムの音声対音声翻訳に対応する音声モデル「Gemini 3.5 Live Translate」を発表した。70以上の言語を自動検出し、話者のイントネーション、ペース、ピッチを保った翻訳音声を生成する。
Googleは2026年6月9日、音声翻訳モデル「Gemini 3.5 Live Translate」を発表しました。日本語を含む70以上の言語に対応し、話者の抑揚、話す速さ、声の高さを保ちながら、ほぼリアルタイムで音声を別の言語に翻訳するモデルです ...
先日開催された「Google I/O 2026」では多くの製品でAIを活用した新機能や改善がアナウンスされたが、「Google Chrome」もその例外ではない。とくに注目したいのが、Webブラウザー組み込みのAI(Built-in ...
The Wall Street Journal は米国時間6月3日、Metaの計画に詳しい関係者の話として、同社が4月に発表した高度な大規模言語モデル(LLM)「 Muse Spark ...
データセクション株式会社(本社:東京都品川区、代表取締役社長執行役員CEO:石原紀彦、東証グロース:3905、以下「当社」)は、本日、同社の「TAIZA AI クラウドプラットフォーム」におけるエージェント型AIワークフロー機能を強化するため、OpenAI API を活用する計画を発表しました。 本連携は、アジア太平洋地域の対象となる法人顧客が、OpenAI API やモデルエンドポイントに直接ア ...
Googleが画像生成AI「Nano Banana 2」と「Nano Banana Pro」の正式リリースを発表しました。Gemini APIをプログラムから使うためのサンプルコードも公開されています。
インプレスグループでIT関連メディア事業を展開する株式会社インプレス(本社:東京都千代田区、代表取締役社長:高橋隆志)は、『AI音声API入門クラウド時代の音声合成』(著者:前川 竜希)をインプレス NextPublishingより発行いたします。
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する