私たちの生活空間にロボットが溶け込み、家事を手伝い、高齢者を介護し、人間と協働する未来。それは長年、SFの世界で描かれてきた夢であり、ロボット工学が目指す究極の目標だ。工場で決められた作業を繰り返す産業用ロボットの時代は終わり、今 ...
この資料では、VLM(大規模視覚言語モデル)の基礎から、LLM(大規模言語モデル)とVLMの違い、開発ステップや業界・分野での活用事例など、詳細な情報をわかりやすくまとめています。 特に、画像を用いた検索・解析や、画像処理と言語処理を統合したAI ...
AIの進化は止まることを知りません。特に最近、「VLM」という言葉を耳にすることが増えたのではないでしょうか? 画像とテキスト、異なる情報を同時に理解し、処理するこの新たなAI技術は、私たちの世界を大きく変える可能性を秘めています。 でも「VLM ...
ソフトバンクの子会社でAIの研究開発などを手掛けるSB Intuitions(東京都港区)は6月17日、大規模視覚言語モデル(VLM)の基礎などをまとめた資料「大規模視覚言語モデルの開発」を無料公開した。5月に開催した人工知能学会全国大会(JSAI)の講演で使用し ...
生成AI技術で柔軟性の高い異常監視を実現 「ANOMALY WATCHER」とVLMの連携により新たな検知手法を提供 キヤノンマーケティングジャパングループのキヤノンITソリューションズ株式会社(本社:東京都港区、代表取締役社長:金澤 明、以下キヤノンITS)は、製造 ...
サイバーエージェントは6月13日、75億パラメータの日本語大規模視覚言語モデル(Vision Language Model、VLM)を一般公開した。Hugging Faceで商用利用可能なAIモデルや、研究用途でのみ使えるデモを公開中だ。 サイバーエージェント、日本語に強い“視覚言語 ...
株式会社日立ソリューションズ・テクノロジー(本社:東京都立川市、取締役社長:平間 顕一、以下、日立ソリューションズ・テクノロジー)は、映像や画像とテキストを統合的に理解するVision Language Model(以下、VLM)技術を活用し、フロントラインワーカーに ...